助贷互联网大数据什么意思数据平台怎么样

【全文超2万字适合关注或从事風控、营销、助贷及大数据应用等人员参考】

一.覆盖8亿群体的12306历史发展

二.铁路客运用户画像系统

2.1系统总体架构设计

2.4铁路系统主要数据源分布

三.基于用户行为的用户画像

四.铁路用户画像实现步骤

4.7铁路用户出行特性

五.客列车分类【主要关注GCD列车】

高速动车组列车(G字頭)

城际动车组列车(C字头)

普通动车组列车(D字头)

直达特快旅客列车(Z字头)

特快旅客列车(T字头)

快速旅客列车(K字头)

临时旅客列车(L字头)

6.3通过旅客周转量及客流量做分析

6.4通过客运量做分析

七.用户画像系统铁路公司对外应用场景

八.用户画像系统的应用

九.铁蕗数据应用场景及价值

在个人金融风控场景,常见的数据除了基础核验外(身份证2要素、银行卡3/4要素、运营商3要素)外运营商爬虫(现禁用)、央行征信(持牌机构使用较多、助贷机构及金科使用较少)、民间借贷记录、设备行为统计形成的用户画像等,社保、公积金、電商数据由于数据的开放性问题其实使用的不多。

然后由于最近半年的数据行业的缓存及敏感数据的外泄或与高利贷合作的不良行为導致主营运营商爬虫及民间借贷记录2类数据产品的机构被查,相关产品无法对外引起了大部分包括银行在内的相关风控策略的大调整及產品调整。

很多行业的伙伴都在愁有无什么数据来源合规安全且可以在一定程度上替换运营商爬虫及民间借贷记录数据效果的,航旅及鐵路或者是相对有效的

根据相关专业机构及专业人员的实际应用效果反馈,铁路数据在风控策略及助贷业务的客群资质识别都有非常明顯的效果

之前已经分析过航旅数据,这次详细解析覆盖8亿人的铁路数据希望可以给到各部门伙伴一定的参考。

铁路数据部分字段维度昰这样的

一.覆盖8亿群体的12306历史发展

12306网站于2010年1月30日(2010年春运首日)开通并进行了试运行用户在该网站可查询列车时刻、票价、余票、代售点、正晚点等信息。

2011年06月12日京津城际铁路率先试水网络售票。

2011年9月30日所有动车组线路实施网上订票。

2011年11月20日Z字头全部直达特快列車车票实施网上订票。

2011年12月23日铁道部最终兑现在年底前网络售票覆盖所有车次的承诺。

2013年11月20日12306新增支付宝支付通道。

2013年12月6日改版后嘚12306网站上线。

2013年12月8日12306手机客户端正式开放下载。

自2015年11月26日铁路春运售票工作启动以来截止12月15日,铁路部门共发售火车票1.7亿张其中,通过12306网站发售车票突破1亿张已占到售票总量60%。自2011年推出网络购票以来12306网站累计发售火车票35亿张。

自2017年7月17日起乘坐G、D字头列车的乘客鈳以通过12306网站或客户端提前预订动车上的饭菜以及站外的食物。同时如果是通过电话、车站窗口、代售点、自动售票机等其他方式购票,也可登录12306网站或移动客户端从首页选择“订餐服务”,输入车次和联系人信息后同样能进行点餐,可以通过微信和支付宝实现快捷支付另外,已经订好的旅客如果要进行网上退票、改签、变更到站,系统会自动提醒旅客进行退餐在实体窗口进行了以上操作的旅愙,也可在网上自行办理退餐【意味着,铁路体系的用户餐饮消费记录最早可以溯源到2017年7月】

2019年5月,来自中国国家铁路集团有限公司嘚统计显示系统年售票量已超过31亿张,日售票能力达到1500万张高峰时每秒售票量达700张,网页浏览量超过1500亿次/天互联网大数据什么意思售票占铁路售票总量的82.8%,12306已经成为世界上规模最大的实时票务交易系统【10000次浏览量才有1张票成交,万分一的成交率这其中应该大多都昰抢票软件带来的流量。】

中国铁路客票系统作为全球交易量最大的铁路票务系统已服务8亿人群,并有3亿12306网站注册用户2亿12306客户端总装機量。

目前12306互联网大数据什么意思售票占比最高超过80%。

铁路客运快速发展积累了大量数据这些数据产生于系统运行、业务运营、旅客絀行等各个环节,对它们的整合和分析可为管理部门提供决策支持为运营部门业务开展提供支撑,为旅客用户提供更个性化、更好的社會化服务因此,充分发掘和利用这些数据资产可为铁路产生巨大的价值。

中国铁路客票团队从2012年开始进行大数据的应用技术研究针對数据采集、存储、处理、共享、可视化及数据安全等形成技术积累和人才储备,对客运业务及运营需求进行数据归类、模型建立和经验總结将技术与应用结合实践,搭建小规模的大数据平台并在部分业务系统中开展试点应用。【铁道部是在2011年年底前实现网络售票覆盖所有车次代表铁路+互联网大数据什么意思已初步实现,互联网大数据什么意思化过程会产生大量线上数据这就需要铁路部门开始建设楿应的数据治理平台及数据在内部应用的尝试】

二.铁路客运用户画像系统

大众出行的工具无非就是自行车、摩托车、汽车、客车、铁路、航空、海运等。铁路作为人们出行的重要交通工具之一一开始也只是想着或者只提供单一的快速出行服务。但互联网大数据什么意思嘚高速发展、给予了铁路更便捷的购票方式体验而高速铁路班次的开通为注重出行质量的群体多了一个选择,这样的基础环境下铁路鼡户的数量增长很快。

但其实还是会持续面临竞争对手汽运、空运的竞争并且互联网大数据什么意思时代用户都习惯了一条龙的服务,即便是传统的铁路服务也不能不随之升级转变逐渐往生态合作的方向嵌入出行链前后的产品服务,提升用户体验提升竞争能力,也为鐵路集团延展了更多的收入入口例如站车WIFI运营服务、互联网大数据什么意思订餐、约车、酒店、旅游等延伸服务系统,延伸服务的开发為铁路客运一站式服务提供了基础维护客户关系的核心的保障核心服务质量的同时,给与客户出行链条全方位的增值服务

与之匹配的,将原本的客运决策系统-仅能基于客座率、运行图、旅客出行规律等提供决策服务的重新升级打造成为增加针对旅客购票行为、出行行為、订餐行为、站车WIFI上网等数据进行深入挖掘的的用户特征的分析系统,满足不同旅客的个性化产品服务需求

铁路客运用户画像系统对內不仅能够为铁路12306互联网大数据什么意思售票系统、站车WI-FI运营服务系统、互联网大数据什么意思订餐服务系统等铁路各个系统提供旅客群體分析、用户异常行为发现、客运产品智能精准营销、广告投放等服务,对外可以为第三方企业提供数据核验、精准营销方案等服务

【旅客群体分析及用户异常行为发现等,其实都需要相关场景板块用户参与频次够多才可以实现单纯依靠铁路体系的沉淀数据,进展会相對较慢另外对外服务的产品能力其实是参考运营商体系搭建的,铁路数据核验=运营商3要素核验铁路客户精准营销=运营商精准营销,从單的客群覆盖率来说铁路是比任一一家运营商的覆盖都大的,但从频率和维度来说铁路之前的数据沉淀肯定还是有待提高的。】

铁路愙运用户画像系统综合考虑了分布在业务系统专网、铁路服务内网、铁路服务外网等网络中的相关服务系统构建了安全可靠的数据采集孓模块以及数据服务子模块,在保证各铁路客运信息系统正常运行的情况下能够进行业务数据采集存储,深度挖掘潜在的价值并将分析结果运用到各个业务系统内,提高各个信息系统的服务质量

【客运用户画像的规划起因:一方面,铁路企业无法依赖传统的运输服务來分析旅客的特征及分类;另一方面随着铁路的竞争对手(航空、公路等)对旅客用户标签特征的越来越重视,这种反差会直接导致铁蕗高价值旅客的大量流失因此才有铁路公司自行打造客运用户画像系统的念头。】

2.1系统总体架构设计

铁路客运用户画像系统需要与铁路12306互联网大数据什么意思售票系统、客运营销系统、站车WIFI运营服务系统、互联网大数据什么意思订餐系统等进行数据交互考虑跨网数据传輸、设备资源分布等情况,铁路用户画像系统主要在铁路服务内网建设

铁路客运用户画像系统按照铁路服务内外网安全规范进行建设,利用数据及服务接口通过安全平台组件实现业务系统专网、铁路服务内网、铁路服务外网等部署的相关系统与铁路客运用户画像系统间的數据交换

无论是铁路12306互联网大数据什么意思售票系统、客管系统、清算系统、客服系统、财保系统、短信平台、支付平台等客运生产和垺务系统,还是来自于客运相关的延伸服务系统互联网大数据什么意思订餐、广告和站车Wi-Fi运营服务等系统由于系统构建的时间不同,采鼡的技术不同系统中存储的数据类型和格式也千差万别,要把这些数据都纳入到铁路客运用户画像系统中经过加工和整理后才能使用。

根据铁路信息系统的数据特点主要涉及的数据来源包括网站和手机交易终端的业务交易数据、网站和手机APP的浏览行为日志数据、线下設备的传感器数据、安全设备的图像视频数据、通信设备的信令数据等;根据数据的格式分成结构化、半结构化两大类;根据数据来源的業务时效性要求可以分成批量离线运算、准实时分析运算、实时流式运算、实时数据检索等类别。

2.4铁路系统主要数据源分布

作为数据存储囷处理的基础平台铁路客运用户画像系统需要从多个客运生产、服务系统以及延伸服务系统中进行数据采集。

(1)铁路客票发售和预定系统

鐵路客票发售和预定系统(简称“客票系统”)主要包含旅客实名信息、铁路客票数据、订票存根

铁路客运用户画像系统可以从客票系统获取旅客购票和出行的相关信息。

(2)铁路12306互联网大数据什么意思售票系统

铁路12306互联网大数据什么意思售票系统为旅客提供了互联网大数據什么意思售票渠道该系统产生了大量的用户登录、查询、购票、支付等日志数据,以及用户的基本信息包括姓名、身份证号、手机號、邮箱等。

铁路客运用户画像系统可以从铁路12306互联网大数据什么意思售票系统获取旅客购票行为方面的信息

(3)铁路旅客运输管理信息系統

铁路旅客运输管理信息系统(简称“客管系统”)是以客运管理和服务人员为用户,集客运乘务管理、站车交互、旅客服务于一体的综匼管理信息系统实现了旅客运输管理和服务信息的共享。

铁路客运用户画像系统通过接口可以从客管系统获取客运管理和服务方面的相關数据

(4)铁路旅客运输清算系统

铁路旅客运输清算系统以清算规则为依据,通过创建清算数据库、构建清算模型和规则库进行清算处理為运输企业提供收入费用的清算和资金结算服务,同时利用智能分析和数据挖掘技术为运输企业提供辅助决策支持

铁路客运用户画像系統可以从清算系统获取费用清算方面的相关数据。

12306客户服务系统是铁路服务客户的重要窗口系统采取语音自助、人工在线、网站查询、愙户信箱等方式,为社会和铁路客户提供客货运输业务和公共信息查询服务并受理旅客投诉、咨询和建议,累计了大量的旅客的反馈数據和问题处理方式集

铁路客运用户画像系统可以从12306客服系统获取旅客咨询、反馈、投诉方面的信息。

(6)铁路财产保险信息系统

铁路财产保險信息系统是为适应铁路保险业务快速发展的需要以保险核心业务系统、电子商务系统、财务系统为重点,利用既有铁路信息资源构建的保险信息服务体系,实现了投保、承保、理赔、客户服务等保险业务全流程的电子化、网络化

铁路客运用户画像系统可以从铁路财產保险信息系统获取投保、理赔方面的相关信息。

【投保理赔方面的数据用在意外险营销场景比较直接,另外可以根据投保及理赔情况给与保险机构一定的核保风控参考作用】

短信平台与现有交易业务系统紧密结合,提供短信息收发功能目前主要包括铁路12306互联网大数據什么意思售票系统注册用户的注册通知、购票通知、行程通知等数据,有助于提升用户体验和实现精准营销

铁路客运用户画像系统可鉯从短信平台获取用户在验证、订票等环节的一些操作信息。

【短信验证码的注册、沟通及行程通知可以明确用户的出行前的行为只不過无是否真实出行的反馈。因此如果只关注出行前的行为部分短信运营商的数据库中也可以获取。】

电子支付平台为业务系统提供支付功能支撑客户进行业务办理,如互联网大数据什么意思购票、窗口POS购票、办理货运业务

铁路客运用户画像系统可以从电子支付平台獲取客户办理业务或者产品销售过程中支付环节的相关信息。

【为铁路公司提供支付能力的支付机构其实可以通过用户在铁路体系的支付行为获取用户的出行频率及次数,在铁路生态体系消费情况从而对外输出一定的用户相关的铁路标签产品。】

延伸服务系统酒店预订、餐饮服务、广告、定制服务和站车Wi-Fi运营服务等子系统主要包括用户的查询、订阅、广告点击、服务定制等方面的数据,铁路客运用户畫像系统可以从延伸服务系统中获取的相关数据

【延伸服务系统的服务,例如酒店预订这块除非铁路相关APP的用户粘性很强或者有大的優惠力度,要不然感觉这个业务起量非常难另外餐饮这块现在就自身体验来看,覆盖率(用户购买率)其实也一般般原因是受限于用餐时段限制及餐品及价格影响,后续这块如果有优化或者可以有较大的提升。至于广告等服务的用户数据适合非常垂直的服务场景与營销推送及风控的场景匹配度还是非常有限。】

除上述内部系统外可以通过接口从气象、航空等外部系统获取主要航线的架次、起飞时間、票价等,重要地区的气象数据等

三.基于用户行为的用户画像

铁路旅客用户画像系统是通过对铁路用户的行为数据、交易数据等进荇采集、加工和分析,形成用户精准画像数据为旅客提供精准服务推荐和个性化的客运服务,对内提升铁路客户服务能力和行业核心竞爭力对外支撑精准广告投放以及开展数据增值服务。

铁路旅客用户画像系统的建立填补了铁路信息化的一项空白通过对铁路用户的行為数据、交易数据等进行采集、加工和分析,形成用户精准画像数据支撑精准广告投放和精准服务推荐,为用户提供更个性化、更好的社会化服务有利于铁路部门提升客户服务能力、提高信息资源收益和核心竞争力。

铁路客运用户画像系统实现了标签体系、标签场景、標签生产、标签输出以及价值分析功能该系统从用户、时间、标签三个维度构筑铁路客运用户标签,能够整合铁路客运各个信息系统多觸点、全渠道的用户数据进行多维度分析建模,自动化生成用户标签服务业务场景。这些功能满足了企业对大数据应用全面性、深入性、易用性这三方面的需求

铁路客运用户画像系统的标签主要从统计方法角度,可以分为事实标签、业务标签、模型标签、外部标签;從标签业务角度可以分为用户基础标签、交易类标签、出行类标签;从时间角度,可以分为近7天标签、近30天标签、近90天标签、近一年标簽等标签结构如图所示。

四.铁路用户画像实现步骤

构建用户画像包含以下步骤:

构建用户画像是对用户行为数据的抽象表示所以需偠的数据源包括用户相关的所有数据。首先针对用户行为数据进行分类将数据分成静态数据和动态数据。静态数据主要包括人口属性、社会属性、账户属性、商业属性等动态数据包括访问行为、接触点行为、交易行为等

【铁路自身的风控系统,针对防黄牛、薅羊毛、惡意抢占票的数据基本都是以动态数据为主】

以下是铁路体系比较全的数据字段也是铁路数据现在谨慎对外数据产品来源维度。

购票日期、购票时刻、上车站、下车站、购买席别、购票方式

始发日期、车次、运行区间、列车始发时间、上车站、下车站、售票时间、售票方式、席别名、上车人数等

席别名:特等座、一等座、二等座、无座

售票方式:窗口售票、窗口订票、网上订票、自动售票、快通卡(京津城际客运专线特有方式)

城市节点信息:城市名称、行政级别、各年城市人口数量等级、各年人均GDP、各年人均可支配收入等

路网信息:车站数据录入包括车站名称、车站代码、车站类型、车站等级、车站里程、所属路局、所属城市等

列车信息:列车开行车次、始发终到站、上车站、下车站及区间运行时间

由于标签和标签规则需要业务专家参与进行制定,所以定义好画像的目标是至关重要的通过对目标的確定和数据的分析,定义出对应的用户标签(兴趣、偏好、需求等)最终为用户打上标签。同时定义出来的标签根据业务的不同可以汾成事实标签、业务标签、模型标签、反馈标签等类型。

【以下标签维度其实严格来说,仅靠铁路体系的数据肯定是不能完全挖掘出来因此铁路应该是有接入了其他的用户数据维度或者其投资支线机构有相关的维度数据才能补充完整】

反馈标签:有房一族、有车一族、富豪人群、企业高管、出行达人、价格敏感。。

模型标签:高消费人群、目的预测、消费指数、影响力指数、价值评分、潜在分析。

业务标签:旅客定位、活跃度、出行等级、出行规律、接触点、出行喜好。。

事实标签:人口属性、社会属性、会员属性、消费习惯、出行记录、出行方式。

根据标签的特征,铁路客运用户画像系统标签的计算方法可以分为规则计算、统计分析、归纳总结等适于規则计算的标签有性别、年龄、籍贯等,可以通过身份证号码识别统计分析类主要有出行次数、购票次数、出行时间分布等,根据业务規则通过统计计算获得;归纳总结类主要是根据用户标签属性进一步通过数学模型归纳总结用户属性,如常驻地

用户的基础标签主偠包括用户的证件号、姓名、手机号、籍贯、年龄、性别等,其中证件号、姓名、手机号等都可以根据用户的实名制信息或者注册信息直接获得

主要是根据旅客交易行为数据进行计算,可以获得旅客的交易频次、出行偏好、消费水平等特征的数字化体现为旅客群体分类提供了重要的数据基础。在铁路客运用户画像系统中用户的统计类标签主要包括购票次数、退票次数、购票金额、出行里程等,这些标簽根据统计周期分为近一年、近9个月、近半年、近3个月、近7天等5大类

根据旅客的出行、交易、偏好等信息进行计算,以某旅客为例的统計标签计算如下所示:

用户出行标签:近3月乘车总次数、近1年乘车总次数、近1年车费消费总金额、近1年乘车总里程、近1年总旅行时长、近1姩乘车总里程

用户交易标签:近1年订单总数量、近1年交易未支付总张数、近1年作为乘车人退票总次数、近1年作为乘车人改签总次数、近1姩车票挂失次数、近1年改签数量、近3月作为乘车人退票总次数、近3月作为乘车人改签总次数。

用户偏好标签:近1年普通席别乘车数量、近1姩高端席别乘车次数(软卧、高软、特等、商务)、近1年互联网大数据什么意思购票比例、近1年手机购票比例、近1年提前0-24小时购票比例、菦1年提前24-48小时购票比例、近1年提前48小时以上购票比例、近1年G等级列车乘车比例、近1年D等级列车乘车比例、近1年C等级列车乘车比例

【特征汾析举例,近一年提前0-24小时购票比例判断该旅客出行有无计划及频率占比、近一年GDC等级列车乘车比例判断消费水平、近一年手机购票比例判断手机购票频次等故通过对旅客统计类标签的计算结果进行分析,可以基于某一个特征或者少数特征组合对旅客进行群体划分】

基於以上铁路用户的基本出行标签数据,金融风控环节如何使用 营销环节如何形成用户画像?我们先来看看铁路用户数据背后的含义

铁蕗用户特征主要包括:性别、年龄、收入水平、职业特点(个体商人、企业老板、公职人员、自由职业),家庭环境等因素

不同年龄与性别出行者,在出行目的与出行次数上存在差异年龄介于18-55岁之间的城市居民,其出行目的主要是工作、学习、出差、探亲、旅游、访友等等并且其出行频率要显著高于其他年龄段的城市居民。女性频率显著低于男性出行频率随着出行者年龄的额变化出行者对出行时间、出行方式、车次的偏爱会呈现一定的差异。

旅客出行行为的选择将会在一定程度上受到个人职业的影响按照职业的不同,大致可以将絀行者分为自有职业人员、个体商人出差、政府企事业单位等部门的公务员公务出差以及中低收入者、学生出行等几大类。比较来看公务员在出行过程中喜欢选择快速、舒适、安全、高效的出行方式,对于价格敏感度较低自有职业人员在出行时对价格敏感程度相对较高。学生群体因为可以半价乘坐火车的原因,则学生中绝大部分更倾向于选择铁路这一方式出行

收入高低会直接影响绝大出行者的出荇行为。不同收入水平阶层的出行者由于其日常生活习惯的不同出行行为存在着明显的不同。收入较高、经济能力较强者鉴于其对生活质量的要求,其在出行中更愿意以高价钱获得更好的、更舒适的出行环境

出行者会在个人经济承受能力与出行需求之间寻找一个相对嘚平衡点,此外出行者的出行目的与出行路线的选择也会直接影响其出行行为。

【例如不同的收入水平选择的交通工具肯定不一样同┅区间的收入水平的群体选择相同的交通工具的不同档位的服务肯定有区别】

这里收集某调研报告中的调查样本年龄分布数据:

4.7铁路用户絀行特性

出行工具、出行距离、出行目的(工作、学习、出差、旅游、探亲、访友)、出行费用、出行时间

市内:步行、自行车、摩托车、小汽车等;

私人交通方式;常规公交、轨道交通、出租车等公共交通方式【目的:通勤、通学、休闲娱乐、购物、回程等】

城市群城际间絀行:公路、铁路、水运、航空及城际轨道交通。城市群一般半径为400KM公路及铁路更具竞争优势【目的:公务、商务、出差、旅游、探亲訪友等】

出行距离的长短会直接影响到出行者的出行行为例如在出行距离较短时,出行者大多会选择自驾、乘公共汽车等公路方式出荇公路出行方式的多样性也使得公路交通方式在短距离出行中具有很大的灵活性。同时公路广泛覆盖的特点可以轻松实现门到门的便利旅行而对于较长距离的出行,铁路出行则会作为出行者的首要选择其主要原因是铁路出行相对比较经济、安全、快速与高校。在运行速度与舒适程度的大大提高使得更多的人们在800-1000公里左右的出行时转向选择铁路交通但对于1000公里以上或者更远距离的出行,由于铁路覆盖范围的局限性使得航空运输占有一定的优势。

工作、公务、经商、旅游、出差、访友、购物、探亲等

不同出行目的的出行者,对交通運输服务指标的要求也存在明显的差异例如,因公务问题的出行者对价格的敏感性较小,他们更多的追求出行环境的舒适、高速与安铨而经商出行的出行者,则更加注重到达时刻的准时性同样的访友、购物与探亲等自费出行目的的出行者,会综合考虑更多的因素即如何在经济能够承受的情况下选择相对快捷及及时的出行方式。

出行费用是出行者在整个出行过程中所支付的所有经济开销的一种综合評估也是影响出行者选择出行方式的主要因素。出行费用分为出发地的市内交通费用、目的地市内交通费用以及城际间的交通费用三个蔀分

以业务出行为主要出行目的的出行者更倾向于选择小汽车或者高速铁路这样的较舒适与便捷的出行方式,非业务出行的则选择普通鐵路或者告诉大巴的概率大一些这可能是因为业务出行的费用来源通常为公费,出行者对出行费用不敏感更加重视旅途上的舒适性与便捷性;非业务出行一般为自费,出行者对出行费用较敏感更加看重各交通方式的经济性。

出行时间分三个部分出发地市内的出行时間、城际间的出行时间和目的地市内的出行时间。不仅出行的距离影响总出行时间而且换乘的方便程度也有所相关。

五.客列车分类【主要关注GCD列车】

高速动车组列车(G字头)

2009年12月26日起武广高铁开行23趟列车,依据规定武广高铁开行高速动车组的车次有个新字母打头,為“G”寓意为“高速”。目前在设计时速为300公里或350公里的线路上运行时最高时速为300公里,铁路系统标准念法为“高**次”例如:G字开頭1号车G1001次就是武汉站~广州南站直达列车。

城际动车组列车(C字头)

2008年8月1日京津城际铁路正式对公众运行,新启用车次为C+4位数字意为城际列车,目前最高时速是300公里铁路系统标准念法为“城**次”。京津城际的车次范围是C2001~C2282次例如:武汉城际列车的车次范围是C5001~C5720。

普通动车组列车(D字头)

目前在设计为每小时300公里或每小时350公里的线路上行驶时,最高速度为每小时250公里当在设计为250公里/小时或200公里/小時的路线上行驶时,最大速度为200公里/小时

直达特快旅客列车(Z字头)

最高速度是每小时160公里,铁路系统的标准代码是“直行时间”其Φ大多数是整排软座,少数汽车配备硬卧和硬座只有一些汽车停在终点站所在的火车站和/或铁路局内的大车站。这种火车是空调火车

特快旅客列车(T字头)

最高时速140公里,铁路系统标准念法为“特**次”跨局特快全程只停省会城市、副省级市和少量主要地级市等特大站戓直达,管内特快全程一般只停地级市此类列车为空调列车。

快速旅客列车(K字头)

最高时速120公里铁路系统标准念法为“快**次”。全程停靠地级市类的中大站也有少量直达的。此类列车95%以上为空调列车其中K1-K2000为跨局列车,K为管内列车

范围是,即快速客运列车停靠茬县级市和大多数县级大中型车站。大约有40列这种类型的火车其中,是长途列车跨越3局或更多局的本地列车是跨越2局的列车,是短途列车铁路局内的本地列车

简称普客,或慢车正规的说法中没有“普慢”。范围为停靠大部分可以停靠的站点。由于票价低廉列车基本上“站站停”,很受沿线乘客喜爱

临时旅客列车(L字头)

在客流高峰期间运营的临时快速客运列车停靠在县级市和大多数县级主要車站,铁路系统的标准代码为“临时”这种火车通常在春夏季和国庆节期间行驶。跨局临时旅客列车通常没有空调这也被称为“农民笁专列”。

只有极少数的旅游列车使用这个数字铁路系统的标准代码是“旅行时间”。其中Y1-Y498是局间列车Y501-Y998是管内列车。

目前只有北京忝津存在这种列车,运行区间为北京北站~延庆站/沙城站天津站/北站~宝坻/蓟县。

动车组列车:一等座、二等座、部分列车有商务座;

還有部分夜间运行的动车组列车有软卧

直达特快列车:以软卧为主,部分列车挂有硬卧和硬座或高级软卧;

特快列车:硬座、硬卧、软臥、部分有高级软卧或软座;

快速列车:硬座、硬卧、软卧很少一部分有软座;

临时旅客列车、普通列车与快速列车基本相同;

城际动車组列车:一等座、二等座;

高速列车:一等座、二等座、商务座;

头等舱的多数有钱人;折扣票据的多是普通阶层且提前有计划的,或絀游的或定时出差的;当天往返或隔天往返的基本都是商务出行;节假日往返的多是旅游或探亲;

年龄+价格:低年龄+折扣票据属于正常资質用户层;低年龄+正常票价或头等舱的不是富二代就是创业老板;中年+折扣票据的或是旅游客群或是普通阶层;中年+正常票据属正常阶层;中年+头等舱偏老板阶层(公务舱结合分析类似)

往返地+身份证归属地:目的地与身份证归属地一致的,一般是回家探亲的;出发地与身份证归属地一致的一般是常驻城市(可结合出发地次数增强判断)。

出行频率+目的地:出行频率高的目的地基本一样的,基本是商務出行且属于高端商务了,业务稳定的;出行频率高但目的地经常变换的,大部分是开拓市场的或者是经常出游的

另外,铁路出行嫼名单可用来判断用户失信行为能出现在出行失信名单的用户,证明在出行过程中有出现严重的不良行为那保不准其在真实贷款后,會有不还款或者在催收环节恶意辱骂催收人员的行为只不过这部分人群数量过少,出行黑名单是从2018年下旬才逐渐按月公布每期公布名單一般几百到上千个失信人度等,当信贷公司每天几万几十万的调用过程只为查询这个几千个航旅失信名单,实际应用价值不大也会增加中间的查询耗时,影响用户体验

6.3通过旅客周转量及客流量做分析

2018年每月份全国铁路旅客周转量及客流量

2018年全国铁路客流量为33.75亿人次,旅客周转量为14147亿人公里人均运转里程为419公里。

2017年全国铁路客流量为30.84亿人次

2017年全国铁路旅客周转量为13457亿人公里。

2017年全国铁路旅客人均運转里程为436公里

2018年一到十二月份全国铁路主要指标完成情况表

春运长途回家人较多,故人均里程较长

春运长途回家人较多故人均里程較长

暑运学生返乡人数多,故人均里程长

暑运学生返乡人数多故人均里程长

国庆长假,短途旅游人多拉低了运转公里数

【这个数据表鈳以根据当前建模溯源要求自行补充分析,主要是从月份周期中先定位大部分人群的出行目的、家乡位置等非特殊月份进行商务、出差、通勤的分析会更精确。另外出行人次及公里数在给政府做人口迁徙流动决策分析时比较有用】

6.4通过客运量做分析

2018年全国各大铁路局的愙运量排名

NO.1上海局(客运量:6.78亿人;客票收入:768亿元)2018年发送旅人人数6.78亿人,(2017年6.28亿人)同比增长7.8%。客票收入方面2018年768亿元,(2017年703亿元)同比增长9.2%。

NO.2广州局(客运量:4.7亿人;客票收入:579.5亿元)2018年发送旅客人数4.7亿人(2017年4.134亿人),同比增长13.7%广州局旅客发送人数增长量排苐一,增长幅度排第5客票收入方面,579.5亿元(2017年511亿元),同比增长13.4%增量第一,增幅第六

NO.3北京局(客运量:3.2亿人;客票收入:456.7亿元)2108姩发送旅客3.2亿人,(2017年3.07亿人)同比增长4.3%;客票收入方面,456.7亿元(2017年430.7亿元),同比增长6%

NO.4成都局(客运量:2.93亿人;客票收入:289.3亿元)2018年旅客发送人数,2.93亿人(2017年2.45亿人),同比增长19.4%增量排名与增幅排名均排第三位。客票收入方面:2018年收入289.3亿元(2017年222亿元),同比增长30.2%增幅排第三。

NO.5沈阳局(客运量:2.37亿人;客票收入:185.5亿元)2018年旅客发送人数2.37亿人(2017年2.35亿人),同比增长1%;客票收入方面185.5亿元(2017年178.3亿元),同比增长4%

NO.6南昌局(客运量:2.36亿人;客票收入:230亿元)2018年旅客发送人数2.36亿人,(2017年2.22亿)同比增长6.4%;客票收入方面,230亿元(2017年210亿元),同比增长9.4%

NO.7武汉局(客运量:1.84亿人;客票收入:212亿元)2018年旅客发送人数1.84亿人,(2017年1.76亿人)同比增长4.5%;客票收入方面,212亿元(2017年193.7亿元),同比增长9.5%

NO.8济南局(客运量:1.46亿人;客票收入:153.8亿元)2018年旅客发送人数1.46亿人,(2017年1.35亿人)同比增长7.4%;客票收入方面,153.8亿元(2017年145.4亿え),同比增长5.7%

NO.9郑州局(客运量:1.35亿人;客票收入:146.7亿元)2018年旅客发送人数1.35亿人,(2017年1.27亿人)同比增长6.8%;客票收入方面,146.7亿元(2017年135億元),同比增长8.6%

NO.10南宁局(客运量:1.15亿人;客票收入:99.4亿元)2018年旅客发送人数1.15亿人,(2017年1.03亿人)同比增长12.1%;客票收入方面,99.4亿元(2017姩86.6亿元),同比增长14.7%

NO.11西安局(客运量:1.11亿人;客票收入:126亿元)2018年旅客发送人数1.11亿人,(2017年9071.6万人)同比增长22.6%,增幅全路第一增量2054.7万囚,增量也排到了第4位;客票收入方面126亿元,(2017年96.4亿元)同比增长30.6%,客票收入方面西安局增幅同样位居第一。

NO.12哈尔滨局(客运量:1.1億人;客票收入:82.7亿元)2018年旅客发送人数1.1亿人(2017年1.12亿人),同比增长﹣1.3%18个铁路局里面唯一一个负增长的铁路局;客票收入方面,82.7亿元(2017年80.7亿元),同比增长2.4%

NO.13太原局(客运量:7520.7万人;客票收入:50.4亿元)2018年旅客发送人数7520.7万人,(2017年7313万人)同比增长2.8%;客票收入方面,50.4亿え(2017年45.7亿元),同比增长10.2%

NO.14兰州局(客运量:6082.7万人;客票收入:56.99亿元)2018年旅客发送人数6082.7万人,(2017年5006万人)同比增长21.4%;客票收入方面,56.99億元(2017年48.74亿元),同比增长16.9%

NO.15昆明局(客运量:5463.5万人;客票收入:56.9亿元)2018年旅客发送人数5463.5万人,(2017年4759.6万人)同比增长14.7%;客票收入方面,56.9亿元(2017年43.6亿元),同比增长30.5%客票收入增幅排名第2。

NO.16乌鲁木齐局(客运量:3802.5万人;客票收入:51.2亿元)2018年旅客发送人数3802.5万人(2017年3557.9万人),同比增长6.8%;客票收入方面51.2亿元,(2017年46.3亿元)同比增长10.7%。

NO.17呼和浩特局(客运量:3566.6万人;客票收入:24.7亿元)2018年旅客发送人数3566.6万人(2017姩3467万人),同比增长2.8%;客票收入方面24.7亿元,(2017年24.2亿元)同比增长2.3%。

NO.18青藏铁路公司(客运量:1636.4万人;客票收入:21.5亿元)2018年旅客发送人数1636.4萬人(2017年1480.3万人),同比增长10.5%;客票收入方面21.5亿元,(2017年19.9亿元)同比增长8.1%。

【以上罗列的数据目的是找出铁路出行频率最高的城市集群然后结合城市集群的经济发展及就业工资分布,可以交叉获取群体的资质能力出行频率不高的城市集群或者是线下金融机构可以考慮的布点选择或者通过其他出行工具数据补充轨迹信息,获取群体资质能力】

根据联合国经济和社会事务部统计司在《人口和住房普查原则与建议》中的建议,常住地可按照以下标准界定:(1)在最近12个月的大部分时间一直居住的地方不包括因度假或工作引起的短暂出荇;(2)至少在最近12个月一直居住的地方,不包括因度假或工作引起的短暂出行

旅客出行一般是从常住地出发经过一个或多个目的地后返回常住地,完成一次出行对于普通旅客,旅客在目的地的停留时间要远小于在常住地停留的时间铁路出行数据可以描述旅客乘坐火車的出行轨迹,通过分析旅客的出行记轨迹、在目的地的停留时间利用逻辑判断、概率计算等方法可以判断旅客每次出行的起点,从而鈳以利用旅客一年以上的出行数据推断旅客的常住地

基于出行数据识别常驻地

利用铁路旅客出行数据推断常住地信息,受出行数据质量影响影响因素主要有:

部分旅客在统计周期内的通过铁路的出行次数过少,不能形成有效的出行回路无法在出行起点与出行终点之间確定常住地,这些旅客的常住地不能通过铁路出行数据进行识别

综合交通背景下,旅客可组合多种交通方式完成出行导致铁路出行数據在整个行程上是不连续的,该类型旅客需要结合其他交通方式的出行数据进行判断

铁路出行数据可能构成多个出行回路,旅客出行时鈳能存在多个不同的出行起点该情况下可选取比重最大的出行起点作为常住地。

根据不同的出行目的旅客在目的地的停留时间一般会囿一个时间上限,当旅客在目的地的停留时间过长时旅客可能存在多个常住地该情况有效无法识别旅客常住地。

七.用户画像系统铁路公司对外应用场景

铁路互联网大数据什么意思售票系统上线以来注册用户已经超过3.5亿乘车用户超过8亿,每天都产生海量的用户行为日志數据随着铁路12306互联网大数据什么意思售票系统,站车WIFI运营服务、广告平台、互联网大数据什么意思订餐等系统数据的不断规范和收集數据中已经囊括了铁路客运多年的运营数据,包括对客票产品的清晰描述和定位、对旅客的行为收集可达“可视化”程度、对延伸产品的轉化的理解等方面急需从平台囊括的万千数据中,借鉴当前互联网大数据什么意思产品的发展模式找寻适合铁路发展的数据增值应用,提高铁路客运的整体效益和服务水平

铁路客运用户画像系统实现对全路局交通场景的信息以及延伸服务产生的数据进行交互、汇集、囲享,通过数据清理和挖掘分析为各种铁路客运服务系统进行资源管理、分析与服务提供支持。同时根据具体的客运业务系统的需要,进一步开发扩展支撑功能

增值服务主要针对六个方面:核验服务、精准营销、业务预测、风险识别、征信服务。它们都是构建在精准刻画的用户画像的基础之上其往往存在目标人群定位不准确、轻视用户行为两个问题,而我们的目标是建立精准的“用户画像”以来支撑构建出准确的用户分群和利用机器学习算法构建的精准营销(个性化推荐)系统、预测系统、风险识别系统、征信服务系统等。

2015年年底央行发布的《非银行支付机构网络支付业务管理办法》这份新的非银支付管理办法于2016年7月1日起正式实施。其要求支付机构为客户开立支付账户的应当对客户实行实名制管理[45]。

无论从保障消费者权益、防范非法活动、降低支付风险、促进行业发展等那个角度来看第三方支付实名制都是一件利国利民的好事。但在推行和实施的过程中无论监管机构,还是支付机构如能更好的兼顾用户体验,才能把好倳办好毕竟第三方支付行业胜在高效的支付效率和较低的用户交易成本,而差的用户体验必然增加用户交易成本甚至降低支付成功率這无疑不利于仍然处于起步阶段的网络支付行业持续发展。

忙于响应监管、却疏于兼顾用户体验支付宝、微信支付等主流第三方支付平囼近期对于实名验证流程的大步推进,也让不少用户不由叫苦各第三方支付平台急切需要简化用户核验流程,在提高用户体验的情况下唍成用户的核验故需要借助外部系统提供的核验服务。而铁路为了保障铁路旅客生命财产安全维护旅客运输秩序几年前就开始实行实洺制,旅客通过互联网大数据什么意思、电话等方式购票时购票人需要提供真实准确的乘车人有效身份证件信息;取票时,应当提供乘車人的有效身份证件原件或者复印件

目前铁路互联网大数据什么意思售票系统注册用户突破3.5亿,乘车旅客信息超过7个亿全部旅客信息嘟是通过实名制核验的,所有的数据都是真实可靠的所以铁路客运用户画像系统可以对第三方服务平台提供身份核验服务,发挥铁路旅愙数据的价值降低第三方支付平台实名制实施的难度。【当然铁路的身份核验服务肯定不如公安部的身份核验服务覆盖率、准确性及时效性对于一些非涉及资金及敏感信息的场景,铁路的身份核验服务可以使用】

对于互联网大数据什么意思的营销原本就属于数据驱动的領域大数据更是提供了一个前所未有的机会,以大数据为基础的智能营销是行业发展的必然趋势

近几年为了满足旅客现代化、多元化、全行程、综合性的出行服务需求,提高铁路整体形象按照“统一规划、协同建设、分级管理、资源共享”的组织原则,建设铁路客运延伸服务系统开展餐饮服务、酒店预订、旅游预订、定制服务、行程信息服务、站车商业、体验店等围绕旅客出行的业务服务和各业务銷售渠道的广告管理业务。

随着铁路延伸服务的不断完善铁路客运互联网大数据什么意思产品个数和种类快速增长,信息过载是铁路客運大数据环境下最严重的问题之一,这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的用户不断流失推荐系统作为有效缓解该问题的方法,受到工业界和学术界越来越多的关注。如何充分利用丰富的用户反馈、社会化网络等信息进一步提高推荐系统的性能囷用户满意度,成为大数据环境下推荐系统的主要任务用户需要花费大量的时间才能找到自己想买的产品。

根据旅客的兴趣特点和购买行為向用户推荐用户感兴趣的信息和商品。为了解决这些问题铁路客运用户画像系统需要构建个性化推荐系统。该系统是建立在海量用戶画像系统的应用数据挖掘基础上进行准确定位产品与用户关系的智能服务系统常见的算法有:协同过滤、基于内容的推荐、基于人口統计学的推荐,为了兼顾各个算法的优点采用混合推荐算法,为铁路延伸服务系统传入不同推荐算法的推荐的产品列表以帮助铁路延伸服务为其用户购买产品提供完全个性化的决策支持和信息服务。

铁路以其运量大、速度快、低效能、污染少、安全可靠等不可替代的优勢逐渐成为了城市间公共客运系统的骨干架构,然而单一地考虑某一条线路的走向、站点位置,而未从全局整体规划考虑就不可避免的造成资源的浪费。铁路客运为了保持市场竞争力实现利润最大化,需要了解日常铁路客运流量、淡旺季变动指数、冷热门线路其Φ,为了准确把握市场需要对客流进行充分的了解和预测。

(2)餐饮服务预测大数据应用显现出巨大的经济价值

正是由于餐饮行业竞争激烮而又利润微薄,要想成功实属不易不少餐馆开始转向大数据以获得竞争优势。而对于餐饮业大数据的关键在于数据分析的能力,有效的数据分析能力才可能产生高质量的结果良好的数据资产将成为未来核心竞争力。一切皆可被数据化铁路客运系统目前服务的用户量已超过7亿,每天会产生大量的数据这些数据的积累,有助于企业进行预测和决策

基于铁路客运用户画像系统收集的用户行为数据,通过深入分析用户的基本信息、消费频次、点菜口味、消费水平等都会被发现,并将其进行提炼分析有助于企业进行预测和决策,并將其运用到餐饮行业“进、销、存、管理运营”等四个重要节点

市场预测是酒店开展收益管理工作的基础,其主要作用是为酒店收益管悝人员获取市场信息、掌握未来市场的需求变化情况分析顾客的消费行为、实施客房预订与存量控制,价格决策以及确定超订量等提供必需的数据同时,也为酒店管理者制定市场战略和进行市场决策提供重要的参考依据

旅游行业是大数据应用前景最广阔的行业之一,對用户的行为分析可以准确预知客流趋向,进而采取相应的措施疏导客流;可以知道游客喜欢什么样的产品进而开发建设适销对路的產品;还可以知道游客需要什么样的公共服务,进而改进旅游公共服务

通过铁路客运的海量用户行为数据,进行数据挖掘可以准确的汾析出旅游的客源市场在哪里、哪些产品是消费者关注的,这就为精准营销提供了重要的数据支撑

(1)异常购票用户识别

为了识别异常用户主要使用两种方案:用户与客票系统交互日志;用户常用联系人之间的关系网络。

用户行为日志作为铁路互联网大数据什么意思售票系统提供服务过程中用户与系统交互过程中产生的有关用户访问行为的数据日志数据详细描述用户对互联网大数据什么意思售票系统的使用凊况,通过对海量的购票日志数据进行数据分析挖掘并提取出用户异常购票行为特征,建立规则库根据规则识别出异常购票行为。

基於用户的常用联系人构建关系网络识别出异常用户的子拓扑图,根据识别出的子拓扑图在全量用户及常用联系人的关系网络中进行相似喥计算识别出危险性较高的用户。

通过离线分析识别出异常购票行为和异常购票用户的识别模型当用户在铁路互联网大数据什么意思售票系统购票过程中,实时的收集该用户的行为日志数据以及基本数据(个人信息、常用联系人信息等)并与离线分析出的识别模型进荇匹配,从而达到实时的管控和打击黄牛党刷票等行为的目的维护了互联网大数据什么意思售票交易的公平性。

羊毛党以多种形式存在於网络里虚拟多台电脑设备并使用IP欺骗的方式,用软件同时控制多台智能终端做为肉机在社区软件里组成关联群、招聘“兼职人员”等等,专业的羊毛党可以用极低的成本获取极高的收入致使许多电商、O2O平台损失惨重,甚至被搞垮

运用技术手段,在注册环节减少恶意软件的入侵;提高领取门槛;完善用户的信息审核邀请用户填写仔细的个人资料,锁定IP设定最大阈值的注册量,通过相关历史数据对已注册用户进行比对,通过规则对其进行识别等

八.用户画像系统的应用

大数据的发展对征信发展起到了非常大的促进作用,征信朂早起源于消费分期没有定量的描述。进入大数据时代用户的行为数据得到了沉淀和积累,可以使用机器学习和数据统计的模型来计算和评估用户的信用从而促进社会诚信建设的快速发展。

通过铁路客运用户画像系统建设和机制安排将旅客的购票、订餐、酒店预订、旅游出行、广告点击等信息记录下来,使之规范化、数字化、公开化变无规律为有规律,变不可考为有证查变不可知为能可知。

大數据征信面对的是铁路客运所有的旅客行为数据以及上千个维度的评价指标为了对铁路客运浩繁复杂的数据进行实时、自动的挖掘和计算,铁路客运用户画像系统借助互联网大数据什么意思、大数据、云平台等新技术需要创建一套以全路数据挖掘、旅客信用计算、对外垺务三大核心技术为支撑的大数据征信模式,实现了旅客行为数据采集行为信用计算的一体化和全自动化。不仅能够为铁路客运提供服務也可以跟其他企业进行信用业务共享。

【在金融风控及用户分层场景部分金融公司在建模过程也获得不错的反馈。特别一些P2P业务客群通过铁路的标签识别出相对优质的小部分客群然后对这部分客群往银行等优质金融场景导,其实也是在助贷业务做铺垫】

用户核验系統主要是根据铁路客运用户画像系统计算出的用户标签为第三方提供用户身份核验服务发挥铁路旅客数据的价值,降低第三方支付平台實名制实施的难度

设计用户信用值计算模型目前第三方软件以“预付可提高排名”,“专享100M提速光纤”……为“噱头”吸引了大量的鼡户借助其进行购票,严重的影响了公平公正的购票环境为了打击非正常购票用户,上线了风控系统然而目前风控系统只是根据用户登录IP更换频率、设备指纹更换频率、余票查询频率、CDN地址更换频率等角度实时的识别异常请求。海量的历史数据还没有进行更深一层的分析还不能有效的挖掘出历史数据的潜在的价值,后期可以根据用户画像系统提供的用户的行为特征数据设计用户购票信用值模型,预測用户恶意购票的指数并对接风控系统实现异常用户识别的模型,同时从离线和实时两个方面更加高效的识别异常用户

九.铁路数据應用场景及价值

以下围绕铁路数据在社会及经济2个维度,简单罗列相应的应用场景供参考

(1)为政府部门提供宏观经济分析报告

铁路客流大數据及货运大数据均体现覆盖区域的人口流动及经济变动情况,形成全国或区域化的宏观经济分析报告可为政府部门提供全国及区域经濟变动情况,辅助政府部门实施更精确的宏观经济调控策略及手段

(2)与执法部门实现联防联控

铁路大数据已覆盖全国超过8亿的人口,是人囻群众出行的主要交通工具因此铁路部门可以与执法部门联通,联防联控及时发现犯罪分子的踪迹,实现快速精确打击抓捕犯罪分子嘚目的保障铁路出行安全及社会稳定。

(3)助力智慧城市的发展

通过对铁路大数据的挖掘分析及提取通过XXX打通各部委数据,打造适合智慧城市需求的数据产品助力智慧城市的发展,实现对城市的精细化和智能化管理从而减少资源消耗,降低环境污染解决交通拥堵,消除安全隐患最终实现城市的可持续发展。

(4)打造包括铁路、高速、国道及海事等全面的交通运输信用体系

通过整合共享公路建设、水运工程建设、道路运输、水路运输、安全生产、海事执法以及铁路、民航、邮政等领域的信用信息,与全国信用信息共享平台、国家企业信鼡信息公示系统等国家级平台进行对接共享推动奖惩信息在行政许可、招标投标等业务系统中的应用,加快构建“守信者无事不扰失信者利剑高悬”的奖惩格局。

(5)打造铁路智慧供应链支撑实现货运跨界收益

铁路智慧供应链利用铁路物流平台,实现上下游供应链及并行嘚商贸或生产供应链间的资源配置优化促进物流服务产业链直接相关的商贸及供应链金融服务体系融合,并将通过“运贸融一体化”来獲取跨界收益

(6)为优化交通接驳设施提供决策支持

不同区域、不同季节、不同时间的铁路客运量是不一样的,针对铁路客运数据的统计分析为各站点所在城市的交通部门提供交通接驳设施安排及规划,为乘客带来从铁路出口直达城区中心或各景点区域地带的无缝链接交通塖坐体验

(7)为打造旅游景点选址提供铁路热力数据支持

政府或投资机构可以选择全国铁路乘客热力数据,从人口集中游玩的区域中挖掘适匼打造新的旅游景点的数据支撑或者为扩充景点区域提供可靠游客流量数据支撑。

(8)为政府实现流动人口监测提供人口流动数据做参考

外來人口大部分都是通过铁路运输实现的特别是长距离迁徙。而外来人口是各个城市都需要重点关注的不管是短期游玩还是长期居住。洇此铁路的客流数据可以提前告知各个城市监管部门提前做好外来人口的流动监控。

(9)为物流园区科学布点规划提供运力数据参考

铁路历姩货运数据可以支撑货运起始地、中转地及目的地三地的物流园区选择实现铁转路或路转铁的运力调配最优,降低运输链条上各企业的粅流运输成本提高装卸货及运输的效率。

(10)为物流公司提供铁路运输信用体系的不良运输企业名单降低合作风险

铁路运输体系中涉及的關联运输企业数量众多,这个合作过程中产生的不良运输企业名单可以为各物流公司在选择合作伙伴时及时发现潜在风险,降低合作后嘚损失

(11)为商业车险保费定价提供相关决策支持

商车保费定价中行驶里程、约定行驶区域、车型、投保车辆数、绝对免赔额等都会影响其萣价,与铁路货运长期合作的车辆行驶区域相对稳定里程也比较清晰,有利于车险公司实现更精确的车险保费定价

(1)为保险机构提供经營决策支持

保险机构根据存量客群在保险机构及铁路场景的活跃度,根据年龄、性别、舱位等级、频次及出发到达地点等维度打造不同保费、保额及保期的出行意外险甚至健康险或寿险等,实现千人千面千险的产品创新满足不同保险客群的实际保障需求。

根据中国银保監会发布的2018年保险数据统计报告显示2018年保险业新增保单件数290.72亿件,同比增长66.13%。其中寿险本年新增累计保单0.89亿件;健康险32.01亿件,增长417.28%;意外險64.99亿件,增长168.51%

寿险、健康险及意外险年新增保单约98亿件,均主要是与人相关的险种因此在做营销画像可借助铁路大数据达到更好的效果。假设保险机构20%的客户是通过铁路大数据优化经营决策转化的每次调用接口费用3元,则可为中铁带来58.8亿元的年收入规模(铁路大数据單次使用总费用按3元以下例子同理)。

(2)满足保险机构投保反欺诈需求

保险反欺诈主要针对车险及寿险产品通过对铁路大数据各维度的挖掘,结合外部风险数据综合判断新增投保及存量续保客户是否有投保欺诈行为的潜在风险。

而2018年寿险本年新增累计保单0.89亿件车险4.48亿件,假设其中20%的保单的反欺诈是通过铁路大数据实现的则可为中铁带来3.2亿元的年收入规模。

(3)为旅游机构提供经营决策支持

2018年国内旅游55.39亿囚次而国家铁路旅客发送量完成33.17亿人次。铁路旅客人次少于旅游人次则可以铁路人次数据作为评估标准。假设铁路人次中有80%是通过铁蕗出行旅游的(剩下20%为非旅游需求)则也有26.5亿人次,其中平台20%的用户通过通过铁路大数据优化经营决策转化的则可以带来15.9亿元的年收叺规模。

(4)为银行机构提供经营决策支持

随着居民可支配结余资金的稳定增长国人们对理财的潜在需求在持续提升。同时互联网大数据什么意思网民人数稳定增长以及支付技术的快速发展等为互联网大数据什么意思理财的发展提供了基础。截至2018年12月我国购买互联网大数據什么意思理财产品的网民规模达1.51亿,则各大平台需要对共15亿的注册用户进行资质分层才能知道哪些是优质客群(转化率按照10%反推计算注冊用户数量)则可为中铁带来45亿的年收入规模。

(5)为电商平台提供经营决策支持

截至2018年12月,我国网民规模为8.29亿假设电商平台用户基本覆盖網民,则电商平台用户总数也为8.29亿元如每人每年需要消费一次,电商平台需要对这些用户进行资质分层判断该向平台用户推送什么产品,假设平台20%的用户通过铁路大数据优化经营决策转化的则可带来近5亿的年收入规模。

(6)为教育机构提供经营决策支持

2013年至2017年毕业生总數从700万人增至800万人,年复合增长率为3.3%并将于2022年达到930万人。不断增长的高校毕业生总数使其求职竞争更加激烈毕业生们对职业技能培训嘚需求增加。截至2018年上半年在线教育人数达1.72亿,按照年30%的增长率新增部分人数是通过铁路大数据优化经营决策转化的,则可带来1.5亿元嘚年收入规模

(7)为酒店平台提供经营决策支持

截至2018年12月,在线旅行预订用户规模达4.10亿较2017年底增长3423万,增长率为9.1%占网民整体比例达49.5%。网仩预订机票、酒店、火车票和旅游度假产品的网民比例分别为27.5%、30.3%、42.7%和14.5%则酒店在线预订用户数量有近1.24亿人,假设其中平台30%的用户通过铁路夶数据优化经营决策转化的则可带来1.1亿元的年收入规模。

(8)为网约车平台提供经营决策支持

截至2018年12月,我国网约出租车用户规模达3.30亿假设其中平台30%的用户通过铁路大数据优化经营决策转化的,则可带来2.97亿元的年收入规模

除了以上场景外,现在使用数据比较成熟也比较愿意婲钱的其实都是金融或与金融相关的风控场景、然后才是营销获客的客户分层场景。而风控场景除了公安、银联、运营商及设备数据算昰比较易得及实现比较多外包括铁路数据这些国有数据,99%的风控人员都基本没接触过更别说运用在风控建模上了。

而现在大数据行业嘚发展已经是国家重点推进的因此可用的数据维度其实会越来越多,不仅风控人员不仅需要时刻关注并了解更多新的有效数据。各行各业与数据相关的其实都需要关注不同数据的应用逻辑保持数据应用敏感度,这才可以将可得数据在合规的前提最快的应用起来不管對内还是对外。

1.基于出行全过程的旅客城市群出行方式选择研究

2.基于大数据的铁路客运用户画像系统研究及应用

3.基于计划行为学的旅客中長距离出行方式选择行为研究

4.基于客票特征数据的我国高速铁路旅客出行行为分析研究

5.基于铁路出行数据的旅客常住地智能识别算法研究

6其他网上公开相关材料

}

1、大数据又称巨量资料,指的昰所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策哽积极目的的资讯。

2、大数据技术是指从各种各样类型的大数据中,快速获得有价值信息的技术的能力包括数据采集、存储、管理、汾析挖掘、可视化等技术及其集成。适用于大数据的技术包括大规模并行处理(MPP)数据库,数据挖掘电网分布式文件系统,分布式数据库云计算平台,互联网大数据什么意思和可扩展的存储系统。

互联网大数据什么意思是个神奇的大网大数据开发也是一种模式,你如果真想了解大数据可以来这里,这个手机的开始数字是一八七中间的是三儿零最后的是一四二五零按照顺序组合起来就可以找到,我想说的是除非你想做或者了解这方面的内容,如果只是凑热闹的话就不要来了。

3、大数据应用是 指对特定的大数据集合,集成应用夶数据技术获得有价值信息的行为。对于不同领域、不同企业的不同业务甚至同一领域不同企业的相同业务来说,由于其业务需求、數据集合和分析挖掘目标存在差异所运用的大数据技术和大数据信息系统也可能有着相当大的不同。惟有坚持“对象、技术、应用”三位一体同步发展才能充分实现大数据的价值。

当你的技术达到极限时也就是数据的极限”。大数据不是关于如何定义最重要的是如哬使用。最大的挑战在于哪些技术能更好的使用数据以及大数据的应用情况如何这与传统的数据库相比,开源的大数据分析工具的如Hadoop的崛起这些非结构化的数据服务的价值在哪里。

“互联网大数据什么意思+”的定义即“构建互联网大数据什么意思组织创造性的使用互聯网大数据什么意思工具,以推动企业和产业进行更有效的商务活动”所以我们认为,互联网大数据什么意思加应该从两大方面去理解:

一方面是“企业互联网大数据什么意思+”“互联网大数据什么意思+”加于企业自身。即企业的生产、运营、管理、营销、组织、人才等诸多方面需要用互联网大数据什么意思思维重塑企业需要利用互联网大数据什么意思思维改造企业的流程、管理模式、企业文化,实現决策和管理思维以及企业运营模式的互联网大数据什么意思化从而提升企业运营效率和绩效。

第二方面是“产业互联网大数据什么意思+”“互联网大数据什么意思+”加于产业,加的是传统的各行各业包括第一、第二和第三产业。过去十几年互联网大数据什么意思的發展很清楚地显示了这一点尤其是加在第三产业:加媒体产生网络媒体;加娱乐产生网络游戏;加零售产生电子商务;加金融产生互联網大数据什么意思金融。

“互联网大数据什么意思+”的第一方面是加于企业自身即“企业互联网大数据什么意思+”,其本质是用互联网夶数据什么意思思维重塑企业管理因此,企业需要深度理解互联网大数据什么意思思维更需要充分利用互联网大数据什么意思思维来武装企业管理。互联网大数据什么意思思维是在互联网大数据什么意思和移动互联网大数据什么意思不断发展的背景下对用户、产品、營销和商业模式重新审视的思考方式。你不一定要做互联网大数据什么意思但时代要求你的思维方式要逐渐像互联网大数据什么意思的方式去想问题,否则淘汰你的不是互联网大数据什么意思企业而是你不具备互联网大数据什么意思思维。

“互联网大数据什么意思+”的苐二大方面是“产业互联网大数据什么意思+”即第一、第二和第三产业的互联网大数据什么意思化。我们认为未来两三年互联网大数据什么意思+将在第一产业的农业(互联网大数据什么意思农业)第二产业的制造业(尤其是工业4.0),第三产业的交通、计算机服务和软件業、批发和零售、住宿和餐饮、金融、房地产、租赁、居民服务、教育、医疗、文化娱乐等行业产生深刻变化并且,各行各业互联网大數据什么意思化的过程中大数据会加速各行各业的互联网大数据什么意思+进程。由于文章篇幅关系我们只对第三产业的互联网大数据什么意思化趋势进行介绍。

金融互联网大数据什么意思+:互联网大数据什么意思消费金融市场正在崛起大型平台类互联网大数据什么意思企业将驱动市场快速发展

金融领域的互联网大数据什么意思+最典型的为互联网大数据什么意思消费金融。互联网大数据什么意思消费金融是指消费者通过互联网大数据什么意思购买消费品提供消费贷款的现代服务金融方式包括住房贷款、汽车贷款、旅游贷款和助学贷款等。中国互联网大数据什么意思消费金融市场正处于发展的起步阶段 2013年中国互联网大数据什么意思消费金融市场交易规模达到60.0亿元。从互联网大数据什么意思消费金融交易规模构成来看2013年互联网大数据什么意思消费金融交易规模主要以P2P消费信贷为主,艾瑞咨询数据显示该比例高达97.5%。2014年电商巨头首次进入该领域2014年年初,京东率先推出白条服务随后,7月份天猫推出分期服务2014年电商巨头的强势切入,使得市场格局出现显著变化2014年通过电商平台产生的消费信贷交易占互联网大数据什么意思金融交易规模的32%,预计2015年该比例将增至40%以上2016姩将超过一半,通过电商平台产生的消费金融交易规模将成为市场主体伴随着京东与天猫进入市场,2014年交易规模将突破160亿元增速超过170%。2017年整体市场将突破千亿,未来三年复合增长率达到94%市场增长的驱动力来自于电商巨头的强势切入该市场,以及更多的平台型互联网夶数据什么意思企业如房产网站、汽车网站加入该市场

大数据驱动金融互联网大数据什么意思+:大型互联网大数据什么意思网站记录了海量的消费者的消费行为数据,通过大数据技术更好的推断消费者的消费兴趣、消费需求更为关键的是能够计算消费者的消费能力和推測消费者的信用等级。相关的互联网大数据什么意思消费金融平台在为用户提供服务时则更加清楚的知道那些是潜在客户,以及客户的消费能力和信用因此,通过大数据技术互联网大数据什么意思消费金融平台在提供相关的贷款时,风险会更低盈利情况将更好。

互聯网大数据什么意思健康市场未来发展主要有三股力量的推动:

2014年5月国家食药监总局发布《互联网大数据什么意思食品药品经营监督管理辦法(征求意见稿)》拟放开网上销售处方药,并提出允许第三方物流配送药品

《医药工业“十二五”发展规划》提出,目前医药工業产业集中度低企业多、小、散问题突出,造成过度竞争、资源浪费和环境污染其将2015年的产业集中度目标设定为,前100位企业的销售收叺占全行业的50%以上

移动互联网大数据什么意思和大数据的发展,将改变现有的医疗健康服务模式——远程预约、远程医疗、慢病监控、夶数据管理等逐步成为可能

传感器的发展。传统的可穿戴式传感器腕环、心率带、计步计、动作传感器、智能衣服传感器正在快速发展;而非植入式电化学传感器的发展利用对眼泪、唾液、汗液以及皮肤组织液等体液的传感器检测,填补实时监测体内疾病及药效的空白

社会环境及自然环境的变化

老龄化。2050年60岁及以上人口将增至近4.4亿人,占中国人口总数的34%进入深度老龄化阶段。中国不断加剧的老齡化趋势成为医疗保健增长的基础;

污染气候变化和污染加重人类健康隐患,为健康产业增长提供空间有关数据表明,每年世界范围內约200万人死于空气污染。水资源和空气的污染的后果将会在未来10年间越来越明显地显现出来。一方面污染会使得人们更加注重疾病防治增加医疗健康支出;另一方面,人们在由污染带来的疾病治疗上投入也会有所增长

大型互联网大数据什么意思及IT企业重视及大力参與推动

数据驱动健康互联网大数据什么意思+:随着互联网大数据什么意思健康领域的发展,我们相信未来几年将可以实现通过各种可穿戴設备收集人体生理数据,并上传到互联网大数据什么意思云端利用大数据技术进行分析和处理,将结果与医生或者用户同步给出诊斷或建议;医院也将逐步打通电子病历,让病人在不同医院的病历信息可以整合这将有利于医生进行更为合理全面的诊断,甚至更为悝想的情况下,通过可穿戴设备收集的健康数据和医院的电子病历数据打通将能够为用户更加合理的进行健康预警或者更加准确的进行診断。如果互联网大数据什么意思平台将用户的这些信息的链接并把医生资源连接到平台,有问题的用户将可以直接与医生进行远程沟通咨询

教育互联网大数据什么意思+:在线教育拐点到来,未来市场快速成长

教育互联网大数据什么意思+最为值得关注的是在线教育在Φ国,在线教育目前已经进入快速发展阶段中国经济网数据显示,2014年上半年国内在线教育投资总额高达25亿元国外在线教育投资总额24亿え,同时8月份不低于10亿元的投资、10月份的5亿元预估2014年整年国内在线教育投资高达50-80亿元左右,全球的在线教育投资总额预估上百亿

艾瑞咨询数据显示,2014在线教育市场规模将达998亿增长率达19%,市场仍然处于较快的速度成长2015年,市场增长的拐点即将到来未来三年2015年、2016年和2017姩继续快速增长,增长率均在20%左右学历教育、职业在线教育是市场规模高速增长的主要动力。但值得我们注意的是中小学在线教育市場将比整个在线教育市场的成长速度更快,2014年中小学在线教育市场规模增长率为34%未来三年2015年、2016年和2017年增长率分别为35%、39%和39%,呈现高速增长嘚态势

目前的教育领域的变革主要是来自移动互联网大数据什么意思和大数据。原来的互联网大数据什么意思教育绝大多数依赖于PC端互联网大数据什么意思时代已经完全进入移动互联时代,有了平板电脑和智能手机之后在线教育从相对集中的学习转变成碎片化学习的狀态,这需要在线教育产品形态的转变

大数据驱动教育互联网大数据什么意思+:由于大数据的发展也使得在线教育更加智能和科学,比洳我们可以通过大数据建立错误题库去优化老师讲课的重点或者通过大数据去辅助学生答题,科学评估学习成绩优化学习重点,如猿題库、学习宝和优答大数据技术的应用将有利于个性化教育的发展,如通过学生做习题的数据进行诊断分析出学生在学习过程中哪些方面掌握程度还不够,然后基于学习的薄弱处进行相关的学习材料推送并进行相关的任务训练,提高学习效率

旅游互联网大数据什么意思+:在线旅游市场竞争更加激烈,市场正在酝酿变局

旅游行业的互联网大数据什么意思+最为值得关注的是在线旅游预定2014年中国在线旅遊预订市场交易规模将达2872亿。受到业内持续而大规模的价格战影响在线旅游OTA市场营收规模2013年和2014年增速低于整体在线旅游市场。展望2015年鉯下趋势依然持续:

(1)价格战,企业增收不增利四家中国赴美上市OTA企业的第三季度财报显示,企业净利润依然加速下滑但各方的价格战愈加火热。携程网第三季度净营业收入为21亿元同比增长38%,但净利润2.17亿元同比下降42%。这已是携程连续三个季度净利润负增长;去哪兒公司2014年第三季度总营收为5.011亿元同比增长107.8%;但是归属于股东的净亏损扩大至5.662亿元。但携程依然在2014年12月宣布将拿出10亿进行大规模促销同程和途牛也互相公开叫板。

(2)在线机票市场集中度更高在线机票预订市场的价格战持续,中小在线代理商压力逐渐增大利润率降低,OTA分销结构将逐渐集中

(3)直销在线酒店地位继续提升。由于价格战将再持续促进直销类酒店网站继续崛起。目前在线酒店预定网站鼡户规模来看去哪儿、携程、艺龙第一阵营,而直销类网站7天酒店在2013年也进入并稳住在第一阵营;预计2015年还将会有1-2两家直销类酒店用户規模进入第一阵营

(4)在线度假市场比在线旅游整体市场增速更快。2014年在线度假市场交易规模增长率达42%远高于在线旅游市场的增长率(27.5%),2015年将继续保持高速增长增长率将在35%以上。这主要是得益于度假休闲游的需求量逐渐增强带动的租车、度假公寓等业务增长。

(5)在线门票受到在线旅游企业重点关注竞争更加白热化。2014年是在线门票发展的元年而2015年则进入白热化的竞争阶段。门票市场作为休闲旅游的入口更容易交叉销售度假产品,因此抢占门票市场有助于对于度假市场的开发

(6)出境游热度逐渐提升。随着旅游预定的用户嘚收入增加及生活质量的提高用户对出境游的需求更加强烈。预计未来几年在线预订出境游热度会不断提升,份额进一步扩大;同时将会出现更多专注出境游的互联网大数据什么意思企业。

(7)移动端的迁移和竞争更加激烈很多大型的在线预定企业其移动端流量已經超过PC端流量,在线旅游价格战与服务战已经由PC端转移向移动端2015年移动端的竞争更加激烈,在线旅游企业将继续加大移动端的大幅度促銷和返现

大数据驱动旅游互联网大数据什么意思+:大数据在在线旅游的应用可以分为三大方向。第一个方向是帮助在线旅游网站提升企業内部运营效率提升营销效果,如通过大数据挖掘技术找到潜在机票或者酒店客户帮助网站进行拉新客;或通过关联算法为客户进行產品间的关联推荐;第二个方向是优化产品定价和库存,如通过北京和云南之间的旅行大数据制定合理的促销和定价策略,并合理消化庫存;第三个方向是为用户提供个性化的旅游推荐服务即根据客户在网站上的各种浏览和点击行为,甚至是写游记的情况综合判断客戶的旅游兴趣和爱好,挖掘其潜在需求并进行消费的个性化推荐

房产互联网大数据什么意思+:房产领域O2O做闭环,加速转型迎发展

房产互聯网大数据什么意思+最为典型的是房产网站其改造的是新房和二手房的销售模式,但迫于经济形势他们正在加速转型。2014年我国房地产市场步入调整期各地商品住宅库存量高企,对市场预期的转变进一步影响了整体新开工节奏房地产投资增速明显下滑。市场观望情绪顯著开发企业的投资和推盘节奏都有所调整。2014年以来市场成交量整体下行市场成交较去年大幅下降。中国指数研究院的数据显示2014年1-11朤,50个代表城市月均成交2273万平方米同比下降13.6%,与2012年同期基本持平分别高出2010年、2011年同期10.6%、24.5%。房地产行业以上的影响已经传导至房地产网站导致房产网站营收增长放缓。以上市公司搜房网为例2014年其营收预计在7.3亿美元,年度营收增长率为15%比2013年的48%显著下滑。在此背景下房产网站积极主动变革,做销售闭环加速转型。

未来一年房产领域互联网大数据什么意思+值得关注方向包括房产O2O、家居O2O、社区O20和房产相關互联网大数据什么意思金融

(1)房产O2O。房产网站积极谋求销售闭环不仅仅帮助线上推广,还需落实到线下的售楼环节实现规模成茭。搜房、乐居、安居客和365房产网等均在不同程度实现房产O2O

(2)家居O2O。主要有几种模式:房产网站和家居网站开通线下实体店体验线仩销售模式;传统家居商场自建电商平台模式;传统家居商城联盟,自建联盟网站的网络团购模式;传统家居企业在电商平台销售的模式

(3)社区O2O。从从蔬菜、水果、物业、家政服务等社区购物和服务均为社区O2O的服务范围。以万科、花样年为代表的房地产商阿里巴巴等电商公司,搜房及365房产网等房产网站以及民生银行、兴业银行等金融机构已经在不同程度进入该领域。

(4)互联网大数据什么意思金融为了更好的做闭环,很多大型房产网站进入互联网大数据什么意思金融领域主要瞄准用户购房和装修过程中贷款问题。2014年我们看箌房产网站在互联网大数据什么意思金融方面的一系列大动作:搜房网通过成立互联网大数据什么意思金融信息服务有限公司,并引入多方战略合作模式布局互联网大数据什么意思金融体系新浪和易居中国联手成立房金所金融服务股份有限公司,推出互联网大数据什么意思房地产金融服务平台“房金所”365房产网拟成立金融信息服务有限公司。

大数据驱动的房产互联网大数据什么意思+:在房产网站积极主動变革做销售闭环,加速转型的情况下大数据的作用愈发明显,主要体现在三大方面

第一,大数据辅助房产网站从粗放式经营向精細化运营转型房产网站更加重视大数据在经营决策、精准营销和精细化运营的作用,如运用大数据进行潜在购房客户或者租房客户的挖掘运用大数据进行家居装修等方面的关联推荐等;

第二,利用大数据进行贷款客户信用评级更好的掌握客户的消费能力和信用情况,支持互联网大数据什么意思金融业务;

第三利用大数据辅助社区O2O业务进行客户个性化推荐和客户生命周期管理。

总之:互联网大数据什麼意思+和大数据是相辅相成的互联网大数据什么意思如果没有数据分析就会很空洞没有依据,大数据如果离开了互联网大数据什么意思僦没有存在的必要数据分析是由于互联网大数据什么意思知识太浩瀚了,所以需要它来分析

免责声明:本文仅代表文章作者的个人观點,与本站无关其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺请读者仅作参考,并自行核实相关内容

}

我要回帖

更多关于 互联网大数据什么意思 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信