《P2P要怎么用大关于大数据的问题財管用》 精选一
作为互联网金融当中最热门最活跃的领域,P2P现在发展速度非常快P2P模式最早诞生于英美,它的发展主要依据两个重大条件一是互联网技术使得交易效率提高,这个中国有;二是征信关于大数据的问题的广泛适用及覆盖这个中国没有。正是由于这两条中國P2P行业内对于征信问题及大关于大数据的问题挖掘的探讨热闹非凡。
在中国由于征信体系不健全且不向P2P机构开放,这使得征信成本高昂业界现在热议大关于大数据的问题,电子商务也好、互联网金融也好无疑都视之为一座商机无限的金矿。
那么什么是大关于大数据的問题?对于P2P机构来说大关于大数据的问题能够帮助解决哪些问题?
我的观点是,对于开展信贷业务的机构来讲央行征信系统收录的个人信貸相关的关于大数据的问题,在判断一个人信用状况时有非常大的价值能够获知借款客户的“还款意愿、还款能力、还款的稳定性”。洏社交网络关于大数据的问题、电商交易等关于大数据的问题只能作为补充辅助P2P机构的风控人员判定“客户是谁,即他是不是他所声称嘚那个人、他的工作生活是不是他声称的环境”以此用来防止身份欺诈。
但是采用这些关于大数据的问题(社交网络关于大数据的问题、電商交易等关于大数据的问题)还不能直接预测和推断出他将来及时还款的可能性要利用其进行信贷风险评估工作,还有很长的路要走
洏在中国特色征信环境下,对于P2P机构来说 P2P首要的是解决征信覆盖的问题,在实践过程中通过“test and learn”的核心理念找到适合自己的风控方法。
讨论大关于大数据的问题的第一个逻辑是什么是大关于大数据的问题?简单来说,大关于大数据的问题指的应该是关于大数据的问题很哆但为什么不叫“多关于大数据的问题”而叫做“大关于大数据的问题”?因为这个名称来自英文翻译“Big Data”。
很多的关于大数据的问题是鈈是就是大关于大数据的问题的基础?全世界最大的银行是工商银行全世界最大的移动运营商是中国移动,工商银行和中国移动积累的客戶数和关于大数据的问题量在全世界无可比拟它们自然有很多关于大数据的问题,但他们是不是大关于大数据的问题呢?
现在手机是联网嘚但通过中国移动查询异地手机用户的费率是查不到的,他们互相之间是隔开的无从知道这个客户的生活方式,如果它有这种技术手段的话做出微信的就应该是中国移动而不是腾讯。
从根本上来说简单地使很多关于大数据的问题堆积在一起不叫大关于大数据的问题。大关于大数据的问题主要表示一种技术手段来使得关于大数据的问题的存取、分析可以非常高效进行。首先需要技术框架其次是分析手段。
技术框架是指这样的技术方式只能在现代环境下产生,比如说云计算、云存储等算法在以前是不可能实现的分析手段是指,鉯前要么就是不具备分析工具有关于大数据的问题却算不出来,要么就是分析占的时间太长没有实施的可能性,要么就是算法没有实質解决问题的空间这些随着现代计算机技术的发展,网络技术的发展都解决了
除了技术框架和分析手段,更重要的是一种大关于大数據的问题理念举个例子,如果我想获得一个房间内每个人的身份证号码不同想法的人解决这个问题的思路是什么样的?
想像一下在传统銀行工作的人过来会怎么解决这个问题?他们会堵在门口说,把身份证给我看一下确认看了你的身份证号码以后记下来核对你的照片,这麼做费时费力还没有准确性
大关于大数据的问题的做法是怎样呢?我们会给每个人发一个电脑,让你输入你的身份证号码想像一下,一個人从接到电脑以后5秒钟就开始输入关于大数据的问题在10秒钟之内18位数字输完递交,后台检查正确另外一个人,他从20秒钟以后开始输叺关于大数据的问题输入两个数字以后输到第三位把前面两个数字删掉,再接下来输几位输掉第十位的时候把前面十位再删掉,再开始输入输入到第18位,琢磨了半天一分钟后才递交。运用大关于大数据的问题的方法后台会记录你每一个按键的速度、时间、属性,峩在后台制定一套计算方法把这个过程描述出来。从而就可以判断哪个人身份证号码可能是真的哪个人的身份证号码可能是假的。
记錄身份证号码的18位需要记载多少信息?绝不仅仅是一个字段的18位数我要记载你打开的时间,每个字符输入下一个字符之间间隔的时间每個字符有没有修改的记录,最后递交之前犹豫了多久你想象一下有多少个字段?这就造成了工商银行的身份证号码信息录入只有一个字段,而大关于大数据的问题可以有很多字段
这个例子说明了,大关于大数据的问题是一种技术手段不是简单的关于大数据的问题堆积,並不是公司越大就自然而然有大关于大数据的问题了也并不是说公司小就没有大关于大数据的问题。
交易和社交网络关于大数据的问题鈈完全可靠
大关于大数据的问题问题的由来比较技术化它是从概率论开始发展,然后延伸到数理统计、人工智能、关于大数据的问题仓庫、关于大数据的问题集市大关于大数据的问题现在最前沿的几个技术包括,机器学习、类型识别、神经网络
大关于大数据的问题在信贷风险管理中的作用是回答两方面的事情。
首先大关于大数据的问题解决现状分析,即发生了什么这个客户的生活方式、喜好,比洳说移动电话上装了可定位的设备移动公司可以根据定位信息知道,恰好有一批人在同一个时间点出现在一起了它会聚类这一批人的信息,搜索你平时发表什么言论写了什么样的微信,据此判定你的职业你的任务是什么,这也就是发生了什么
第二,大关于大数据嘚问题解决会发生什么的问题从信贷关系角度上看,知道你今天下午要干什么几乎没有意义信贷分析、风险管理所关心的问题是,给伱一笔钱有多大的概率会不会还如果给你1万块钱会怎么样,如果给你10万块会怎么样有些人给他一个小额度的钱他会还,但给加大额度嘚就不一定了这个大和小的区别每个人的理解是不一样的,这是大关于大数据的问题所需要分析的
基于当今的互动网络关于大数据的問题,个人资料其实很难被掩饰这恰恰是说很多互联网公司或者大关于大数据的问题的机构试图说用“知道你是谁”来做从事商业模式嘚主要考虑。这样的方法可以勾勒出一个图形包括你的生活方式、职业偏好、交友圈子、性格偏好、消费品位、消费尺度、人生态度、哲学理念,甚至你的隐私和秘密
在“你是谁、你是做什么”这些问题得到答案之后,这时候能不能做一个信贷决策呢?这要画一个巨大的問号!答案是不一定的
大关于大数据的问题在这个领域当中回答的问题跟征信局可以回答的问题是不同的。传统的征信局可以回答的是三個问题――你的还款意愿、还款能力和稳定性这是信贷授信过程中最重要的三个问题,可是大关于大数据的问题回答不了
交易关于大數据的问题和社交网络关于大数据的问题不能直接转换为信贷决策,这个在历史上有很多著名的案例可以证明美国运通曾试图通过交易關于大数据的问题发行信用卡业务,基于这种方式提供信贷产品这造成了巨大的失败。美国著名P2P公司Lending Club利用Facebook的社交网络关于大数据的问題来确定客户的信用度,在遭受巨大的损失之后改用了征信局的关于大数据的问题导致了后来业务发生巨大的变化,坏账率下降很多
所以大关于大数据的问题有用,但是跟征信关于大数据的问题不一样它们回答的问题是不同的。在国际上美国和英国的征信体系相对仳较完善,互联网金融机构可以向征信局购买关于大数据的问题发起客户营销但在中国大陆,征信局的覆盖是比较局限的中国人民银荇征信关于大数据的问题覆盖8亿人,但是只有
《P2P要怎么用大关于大数据的问题才管用》 精选三
互联网、云计算、大关于大数据的问题和囚工智能等新兴技术正在重塑全球金融业。来自巨大消费者群体的未满足的金融需求让中国成为全球范围内金融科技的最大试验场。第彡方支付、互联网理财、网络借贷等互联网金融业态其业务范围正在从弥补传统银行金融服务盲区,到逐渐开始与其重合金融科技带來了极具挑战力和竞争力的新对手,也激发了传统金融特别是银行业的转型和创新
全文共4895个字,阅读大约需要15分钟
息差收窄、中间业務规范化
银行业盈利模式亟待转型
大关于大数据的问题、人工智能、区块链
会为传统银行带来哪些想象力?
收听完整节目方便快捷省流量~
不同体量银行如何差异化创新?
大关于大数据的问题如何与具体业务相结合
传统银行如何布局金融场景?
银行业创新存在哪些挑战
郭为民:中国银行总行网络金融部总经理
王鹏举 :厦门国际银行首席信息官
张越:波士顿咨询公司全球合伙人兼董事总经理
云计算、大关於大数据的问题还有人工智能等金融科技,已经越来越深入和广泛地渗透到金融业的各个业态之中传统的商业银行如何利用新兴的技术來进行转型创新?
郭为民:随着技术的发展我们从原来的客户身边的银行逐渐发展成客户手边的银行,通过手机就能够处理所有的事情而且因为技术的发展,现在客户的需求个性化也越来越强,所以对银行来讲如何能够满足客户现在新的需求就必须应用新技术。
其實回归金融本质银行的本质业务存贷汇,可能有一些产品或者一些客户群体银行原来没有服务到,受两个限制一个受监管的限制,對监管来讲金融安全牵涉到国家安全,所以很多事情不是想做或者能够盈利就可以去做的我们要考虑第一要服务实体经济,第二要保證金融安全所以有些事情原来是不可以做。
第二有些事情原来没有能力做或者说成本太高但是现在随着技术的发展,其实现在我们有掱段能够既满足客户的个性化需求,同时又能够使用可承受的成本来提供这种服务
王鹏举:互联网+导致了导致了大量的结构化关于大數据的问题,特别是客户行为的关于大数据的问题这是传统商业银行以前在做交易的时候无法捕捉的,所以互联网的场景拓展了对客户嘚认识以前传统商业银行看到的是客户跟银行进行交易,或者使用银行服务时产生的关于大数据的问题但是互联网拓展了这个关于大數据的问题的范畴,也就是说客户的行为喜好可以捕捉了这些东西会影响银行对客户的服务,所以这就是从银行的角度来说需要努力紦握的方向。
云计算提供了对大关于大数据的问题运算的计算能力让计算更加便宜,更加有效更加快捷。大量的关于大数据的问题夶量的各种行为的关于大数据的问题、模型的关于大数据的问题,这些关于大数据的问题可以收集最后云计算、大关于大数据的问题的技术可以给它加工。从银行来说特别是中小商业银行来说,带来了无限的机会以前的物理网点相对来说受限,现在可以通过这种方式跟社交平台进行场景合作,提供金融服务
不同体量银行的发展空间包括资源都是不同的,不同体量银行的转型方向和前景如何看待
張越:这是一个很好的问题,他们的资源禀赋是不一样的但是在过去这么多年间尽管资源禀赋都不一样,但业务模式和发展策略都一样所以这个是很长一段时间的问题,所谓同质化
但是在未来这个同质化还能成功和发展的前提不存在了,在这种情况之下其实对于大銀行来说,他们资源丰富可以往平台型,往规模化输出自己的能力这个方向去走比如很多银行尝试把支付平台开放,让别的同业能够接上来把财富管理的能力去开放,做出对接同业的接口甚至非传统的同业,这些是典型的传统金融机构把自己的金融能力输出的一个表现我可以成为全行业基础设施,这时候一个平台的力量是非常强大的
这种情况之下要输出,自己得先做好别人才愿意用,得有资源所以平台这个方向会成为很多大机构的选择。小银行其实在未来确实要非常仔细去考虑哪里是我的战场因为已经不可能全面出击了,而且在转型的过程中都有试错试错都有成本,所以不可能四处去试错万一屡次出错的话对生存都有威胁。
所以对小银行来说走更加本地化,抓住自己的差异化特色这是一个非常亟待去思考的问题。中型银行确实是一个比较困难的事情有是有,但是又不够充分茬这种情况之下他们的选择领域相对比较宽,因为很多中型银行有自己的强项而这些强项其实是可以规模化去输出的,比如说我们看到興业很早就在做银银平台给很多非常小型的银行做中后台很多服务,这就是中型银行输出能力的表现但是无疑它在很多方面的话又不嘚不放弃一些战场,所以我觉得对中型银行来说取舍是件挺痛苦的事因为你总还有这个感觉其实我也能做,我再努力一点就能做但是這种想法在每个领域都出现就危险了,所以对小银行来说要专注中型银行要仔细考虑取舍,要决断对大型银行来说的话快速规模化自巳的能力,形成一些领域的平台这会是为之长久竞争优势的选择。
银行掌握庞大的用户基数和用户关于大数据的问题如何将这些信息囷关于大数据的问题融会贯通?
王鹏举:大关于大数据的问题技术是一个新的形态就银行来说对关于大数据的问题的应用是相对先进的,有比较成型的金融关于大数据的问题模型大关于大数据的问题来了对商业银行来说是一个机会,因为以前的关于大数据的问题来源相對来说是金融消费的关于大数据的问题或者金融交易的关于大数据的问题现在客户的行为,特别是客户的喜好可以跟电商平台合作,知道这个客户喜欢买什么平时买的东西的层级是什么样,所以大关于大数据的问题跟平台公司大量拓展了银行以前的关于大数据的问题模型相应的纬度就是说增加了多样性,增加了多样的纬度
其实客户的金融消费行为,或者是客户的金融服务要求跟这个人本身的其怹行为相对应的,比如说对客户信用的判断比如说给客户相应的贷款,怎么来判断因为没有抵押,那么我就要看他的还款能力另外偠看他的信用,有能力去还是一回事有能力不去还是另外一个问题,所以对他行为的分析涉及到方方面面的信息。我以前在做个人信鼡指数的时候经常参照人的驾驶记录,就是你开车所有出的车祸一般来说是记录下来的有了这些关于大数据的问题以后,就能够判断這个人是经常处于冲动的还是平稳相对来说开车平稳的人,他在金融消费方面一般是平稳的有比较高的相关性,所以这方面大关于大數据的问题完全拓展了银行对客户的了解就是银行业经常讲必须了解你的客户,必须提供满足客户需求的服务所以你不了解他,你提供的服务有可能超出了客户消费的范围就会产生风险,就会产生违约所以这些东西大量地拓展了银行对客户需求的把握。同时出现问題的时候相关的风险的预警模型能够作出判断,所以这一方面确实是带来了新的变化
说到具体所涉及的业务,金融科技公司手握丰富嘚场景和多样化关于大数据的问题银行在场景方面如何布局?
郭为民:中国银行整个网络金融的发展战略第一就是叫做关于大数据的問题洞察,第二就是场景金融以前我们的服务手段相对比较局限,像校园卡、社区卡等等可能还需要实体卡的载体,要去发卡、维护要去提供产品服务。现在有了新的技术让我们第一能够更深刻地了解客户,就是所谓关于大数据的问题洞察更能够清晰地了解客户嘚需求。
第二个也给我们提供了更便利的服务渠道可以通过线上的渠道,本来我不需要柜员到每个社区每个网点去跑通过线上的渠道,也能给客户提供金融服务
比如说在医院,医院里有一些传统的痛点比如医生开了处方以后,要去缴费缴费可能要到楼下排队缴费,比较复杂现在医生开完处方以后,你直接手机按一下完成缴费以后直接就可以取药,取完药以后医嘱要写在药盒上现在直接就在APP看到,医嘱是什么还有,你在甲医院看完了病到乙医院你的病例乙医院没有,那你得重新去了解现在我们有电子病例。
现在银行不僅是提供金融服务而且也同我们的合作伙伴一起如何能更好的去服务客户,更重要是把这些场景串起来提供一个所谓无缝连接的金融垺务支持。
除了医院方面近期银监会下文鼓励银行等金融机构积极开展校园金融服务,中国银行作为首个推出这项服务的银行怎么考慮?
郭为民:为了解决这个校园裸贷的问题我们提出了一款新的产品,它改变了传统的授信模式需要客户去申请,客户去提交资料通过大关于大数据的问题技术,主动去了解客户主动评估客户未来的盈利能力,然后主动给他授信不需要申请,授完信以后通知他说伱有这个额度可以去贷款。
学生第一就是他的学籍他在学校是不是正常注册,是不是正常上课他平时有没有历史的犯罪记录,征信凊况等等这些这些我们会收集,通过我们跟学校去合作
第二,我们会通过对整个市场就是我们助学贷款市场整体学生关于大数据的問题的跟踪,十几年的跟踪看什么院校什么科系的学生毕业以后在未来多少年内大概会有什么样的平均的收入,我们会依据他未来的收叺能力而不是目前的经济状况来给他授信评估。这样才有可能解决传统贷款最根本性的问题就是需要钱的人其实借不到钱,越有钱的囚银行越想借给他钱
随着金融科技的发展,面对金融科技公司的竞争或者挑战传统银行如何应对?
郭为民:有些金融科技公司可能早於银行因为他相对来说体量小,或者监管一开始对他们没有那么严格所以他做了一些创新的尝试,非常有效果
但对于银行来讲,有什么创新有什么新的技术,其实我们都是率先最积极的去使用的我觉得挑战是因为新技术发展,市场空间越来越大如何能够快速的詓服务市场,能快速去成长就是跟很多金融科技公司是合作共赢的一个局面。
现在像传统的贷款产品大概目前只有30%的人能够享受这种貸款服务,其实这种市场空间还是非常大的包括金融理财产品,其实很多我们的客户对金融产品还不是非常非常了解有很多空间在里頭。
传统银行在金融科技创新过程中遇到哪些挑战
王鹏举:第一个是人才,第二个是机制所谓机制就是说创新,从金融科技公司的角喥他可以设计一个产品卖了以后这个东西成长了就变成一个业务线,慢慢就变成一个公司这是可能的。但是商业银行不可能有这样的機制目前的商业银行很难有这样一个机制,他基本上是按照前中后来设置的前台营销、中台风险控制,后台是厚度相互之间是要建竝这种防线的机制。第三点由于银行是一个高度被监管的行业,基本上所有的产品当然牌照功能肯定是受到监管的,即使是设计新的產品也需要监管方面的相关的备案一旦你新产品出现被欺诈,被盗骗了特别是在金融科技或者是互联网盛行的时代,或者是金融科技這样的平台这种漏洞都有可能发生,对新产品的发布出现风险的时候你的应对措施,相应的制度必须首先要有保障第四个主要是监管,银行受到强监管所以相关人员的任命,相关的创新的产品和创新的条线都需要经过监管
建议在WiFi环境下收看,土豪请随意~
首播:周┅23:30 第一财经
周一21:40 东方财经-浦东频道(歌华有线136频道)
重播:周二12:35 第一财经
第一财经《解码新金融》是国内首档专注新金融领域的高端访谈節目节目以权威的嘉宾阵容,深入剖析新金融热点探讨行业发展趋势,提供实用的投资指南
了解更多"解码新金融"活动精彩内容,欢迎添加解码新金融小秘书备注“姓名+单位+职务”,加入行业交流群吐槽与分享节目建议或行业信息。
添加请备注“姓名+单位+职务”
第一财经《解码新金融》是国内首档专注新金融领域的高端访谈节目节目以权威的嘉宾阵容,深入剖析新金融热点探讨行业发展趋勢,提供实用的投资指南
《P2P要怎么用大关于大数据的问题才管用?》 精选四
在消费金融蓬勃发展的当下大关于大数据的问题成为消费金融公司业务发展的利器。不过仅仅拥有大关于大数据的问题还远远不够,善于对大关于大数据的问题的解析和运用才是消费金融公司赖以生存的法宝。马上消费金融高级关于大数据的问题决策总监李届悦近日在接受晨报记者专访时表示央行征信在关于大数据的问题時效性、全面性和层次性上的不足。因此深度挖掘互联网大关于大数据的问题信息开发大关于大数据的问题风控模型,弥补央行个人征信信息的短板在互联网金融蓬勃发展的今天尤为重要。
除了传统的金融关于大数据的问题互联网发展让目前用户的关于大数据的问题茭互方式增多,尤其是消费金融公司主要服务的是那些信用卡覆盖不到的人群这些人群可能没有征信记录,只有在互联网上留下的浏览、购物、社交等多种维度的关于大数据的问题但是不是所有关于大数据的问题都有用?
“一切关于大数据的问题都是可以利用的不过伱在事先很难判断这个关于大数据的问题的价值,只有经过分析之后才会知道到底是有用还是没用的”。李届悦表示“我们会把海量關于大数据的问题进行解析,转换成计算机能看得懂的语言再让计算机对几千甚至几万个纬度的风险变量进行计算,然后看它的价值”
有意思的是“以前的关于大数据的问题大家觉得没用,但现在我觉得有用”比方说一个人网购,她的交易行为时常在大半夜凌晨三四點发生那可能这个客户就没有固定的工作,或者没有比较好的生活习惯这种人信用相对可能会差一点;相反,如果一个人做事比较规律对自己自律性很强,这个人信用可能就好些类似这样的关于大数据的问题大家以前不觉得有用,但是现在我们都会觉得有用
“而鉯前大家认为很有用的关于大数据的问题,现在也可能用处不大”比方说一个能贷得起款买别墅的人,来我们消费金融平台申请几百或幾千元消费金融的贷款要么他本身有问题,要么他的身份被盗了欺诈分子用了他的身份来申请。李届悦表示之前银行能给客户批房車贷,放在今天消费金融平台可能就无法审批小额消费金融贷款
如何判定“好人”与“坏人”
消费金融持牌机构除了直联央行征信外,哽多的关于大数据的问题获得是与第三方合作在用户授权的情况下获得其它维度的关于大数据的问题,然后进行关于大数据的问题解析但是消费金融跟传统金融机构用简单线性逻辑回归,建立信用判别评分不一样消费金融的关于大数据的问题大多数是用非线性的,这僦导致了大关于大数据的问题交叉判断之后“好人”可能就成为了“坏人”。
如何用大关于大数据的问题评价一个人征信的好坏李届悅举例说,传统金融企业可能觉得个人收入越高越好但是我们要把他的收入跟年龄结合起来,交叉之后就有非线性的关于大数据的问題出来,他可能会有这种情况:年龄很小但收入看起来很高这样的情况到底是好还是不好,其实我们就觉得可能有风险
李届悦特别提醒消费者,一定要重视个人的信用以后一旦个人信用不好,不但高铁和飞机可能无法坐了就连租房也不好租了,而你的信用好的话僦能享受到很多红利。拿租房来说比如,一般租房需要一次性押一付三但是因为你良好的信用表现,押一付一就可以了像现在的美國租房就是要看你的个人信用,信用红利会给你带来更多便捷和实惠
此外,伴随着消费金融迅猛的发展一些专营网络诈骗、电信诈骗嘚黑中介也打起消费金融的主意。李届悦特别提醒广大的消费者一定要注意保护自己的个人信息,身份证不要随意乱放也不要把自己嘚银行卡或者上网时的各种密码泄露给别人,更不能把收到的手机验证码直接发给别人让电信欺诈分子有机可乘,盗用你的个人信息
《P2P要怎么用大关于大数据的问题才管用?》 精选五
1大关于大数据的问题在金融行业的应用
大关于大数据的问题指“无法在一定时间范围内鼡常规工具进行捕捉、管理和处理的巨量关于大数据的问题集合”传统的关于大数据的问题集合往往是基于特定目的收集的,随着新兴信息技术的发展互联网移动终端越来越融入到日常生活和经济行为之中,尤其是智能硬件和设备的普及与出行、消费、娱乐、支付等楿关的关于大数据的问题呈爆发式增长趋势,互联网企业积累了大量关于大数据的问题这些关于大数据的问题从多个维度刻画了经济主體的行为特征,从中可以挖掘出许多额外的信息和关联逻辑传统的关于大数据的问题库软件工具和关于大数据的问题分析方法无法在短時间内抓取、管理和处理大关于大数据的问题,不仅仅因为其规模大还在于其复杂性,传统关于大数据的问题一般都是结构化关于大数據的问题而大关于大数据的问题往往包含大量非结构化关于大数据的问题,包括图片、视频、语音、地理位置等并且关于大数据的问題都在实时更新中,云平台、云计算、机器学习等技术的突破使得对大关于大数据的问题的分析成为可能金融行业由于天然具有关于大數据的问题量大的优势,成为大关于大数据的问题应用的重要领域具体主要包括大关于大数据的问题风控和大关于大数据的问题征信两夶方面:
金融是经营风险的行业,风险控制能力是金融机构的核心竞争力金融机构通过信用评分模型来定量计算贷款违约的可能性,确萣违约的损失分布以规避风险损失,并根据预测的风险水平进行利率定价传统的信用评分模型主要使用历史借贷关于大数据的问题和財务关于大数据的问题来预测和判断借款人的违约风险,采用传统的统计方法进行分析这种方法最大的缺陷就是无法对那些缺乏历史借貸关于大数据的问题的借款人进行信用风险评估。在征信体系不完善的经济体中会存在信贷供给不足的现象我国央行征信系统虽然覆盖叻8亿多人,但只有3亿多人具有信贷历史传统的风控技术对这部分信贷历史记录空白的群体是无效的。即便在征信业高度发达的美国美國个人消费信用评估公司(FICO)评分也被批评信用评价标准过于单一,评估结果具有片面性在时间上表现出严重的滞后性。
大关于大数据嘚问题风控是基于互联网大关于大数据的问题将关于大数据的问题挖掘、机器学习等大关于大数据的问题建模方法运用到贷前信用评审、反欺诈等风控管理环节。与传统风控模型相比大关于大数据的问题风控有三个基本特征:一是处理的关于大数据的问题种类多,更加哆维度大关于大数据的问题风控模型除了重视传统的信贷变量之外,还纳入了社交网络信息等信息为信贷记录缺失的群体获取基本金融服务提供了可能性。比如ZsetFinance的关于大数据的问题来源非常广泛,既包括传统的信贷记录等金融机构搜集的结构化关于大数据的问题也包括法律记录、交易信息、电子商务、社交信息等非传统的关于大数据的问题和非结构化关于大数据的问题。二是关注行为关于大数据的問题而不仅仅是历史财务关于大数据的问题。传统的信用评分模型变量均与反映被评价主体债务状况和资金延付状况等资金活动相关泹大关于大数据的问题信用评估更关注被评价主体的行为关于大数据的问题,在互联网大关于大数据的问题时代电子商务、社交网络和鼡户的搜索行为等大关于大数据的问题都映射着经济主体的教育背景、工作经历、社交圈子,这些信息与信用水平可能存在某种联系大關于大数据的问题技术是在充分考察借款人借款行为背后的线索和线索间的关联性基础上进行关于大数据的问题分析,降低贷款违约率彡是模型的建立是不断迭代和动态调整的结果。大关于大数据的问题风控模型的输入端是成千上万的原始关于大数据的问题然后基于机器学习等技术进行大关于大数据的问题挖掘,寻找关于大数据的问题间的关联性在关联性基础上将变量进行整合,转换成测量指标每┅种指标反映借款人某一方面的特点,比如诈骗概率、信用风险、偿还能力等再将这些指标输入不同的模型中,最后将模型结果按一定嘚权重加总最终输出的就是信用评分。在整个过程中原始关于大数据的问题转换成指标需要进行不断的迭代,不同模型的权重值可以根据样本进行动态调整
越来越多的互联网金融公司,特别是网络借贷、互联网消费金融等领域的公司开始利用大关于大数据的问题风控技术2016年1月12日,美国的一家网贷平台SOFI声明不再将FICO评分纳入信贷审批决策另外一家为消费企业提供贷款的美国公司Kabbage则将亚马逊、ebay等电子商務网站关于大数据的问题和Facebook、Twitter等社交网站关于大数据的问题纳入风险评估模型之中,新兴的互联网金融公司ZestFinance声称一切关于大数据的问题皆信用
风控与征信都是管理风险的活动,不同的是风控一般是某一公司依靠企业自身的关于大数据的问题和资源进行风险管理,而征信昰第三方机构“依法收集、整理、保存、加工自然人、法人及其他组织的信用信息并对外提供信用报告、信用评估、信用信息咨询等服務,帮助客户判断、控制信用风险进行信用管理的活动”。
传统的基于信贷历史关于大数据的问题的风控技术背后是社会征信体系的建設美国是世界上征信业较为发达的国家之一,一个重要原因是美国信用卡产业非常发达美国的征信体系主要由三类机构组成,一是商業银行和贷款机构这些资金的贷出方在业务开展过程中积累了大量的关于客户借款、还款和违约的历史关于大数据的问题,这些都属于信用的强相关变量这些机构都会将这些信用历史记录传给第二类机构,征信公司美国有三家主要的征信公司,Experian、Equifax、TransUnion主要负责搜集和儲存征信关于大数据的问题,包括从地方法院收集公共记录信息和贷款机构收集逾期债务信息并将关于大数据的问题进行清洗和处理后輸出标准化的关于大数据的问题产品,提供给银行和其他金融机构征信公司也会开发出一些信用评分产品。第三类机构就是专注于信用評分的公司最著名的是FICO评分,主要作用是根据征信公司的信用报告找到变量与违约概率之间的关系,即构建信用评价模型银行和其怹金融机构可以根据FICO评分进行放贷决策。
中国的征信机构由中国人民银行征信中心和其他民营征信机构组成在互联网时代,大关于大数據的问题在征信行业的应用带来了大关于大数据的问题征信就是指通过采集个人或企业在互联网交易、从事互联网业务以及使用互联网垺务过程中留存下来的信息关于大数据的问题,并结合线下渠道采集的相关信息利用云计算等技术手段进行信用评估和评价的活动。国內从事大关于大数据的问题征信的机构主要由四类:一是电商类平台将平台上积累的用户行为关于大数据的问题进行采集、整理和加工,并经过深度挖掘和评估为合作的金融机构信贷审批提供风险定价服务;二是P2P网络借贷类,通过自建客户信用系统用于自身平台撮合嘚投融资业务;三是以网络金融征信系统、小额信贷行业信用信息共享服务平台为代表的同业信息关于大数据的问题库,通过采集P2P平台借貸两端客户的个人基本信息、贷款申请及还款等信息向加入该关于大数据的问题库的P2P机构提供查询服务;四是互联网大关于大数据的问題公司,通过收集、整理、保存来源于第三方的互联网关于大数据的问题运用分析模型和信用评分技术,形成符合客户需要的征信报告、指数报告等产品提供给第三方客户。
大关于大数据的问题征信在我国有很大的发展潜力一方面,中国的征信体系覆盖面仍然有限據波士顿咨询公司测算,截至2015年底中国个人征信的覆盖率只有35%,与美国个人征信体系92%的覆盖率相差甚远另一方面,中国的互联网尤其昰移动互联网发展迅速移动终端累积了海量的用户行为关于大数据的问题,这些网络交易和社交平台积累的关于大数据的问题为弥补信鼡记录空白主体的信用评估关于大数据的问题非常重要
从风控、征信等角度看,大关于大数据的问题在金融行业的应用前景广阔但在發展的过程中也需要注意到存在的风险。
2金融大关于大数据的问题应用面临的风险
(一)金融科技巨头可能产生关于大数据的问题垄断
一些金融科技巨头凭借其在互联网领域的固有优势掌握了大量关于大数据的问题,客观上可能会产生关于大数据的问题寡头的现象可能會带来关于大数据的问题垄断。一些机构掌握了核心的信用关于大数据的问题资源有的机构掌握电商交易关于大数据的问题和金融关于夶数据的问题,有的机构掌握集团的传统金融机构和互联网金融平台的金融关于大数据的问题有的机构则依托大股东掌握大量线下交易關于大数据的问题,还通过合作的方式掌握了合作企业的关于大数据的问题由于缺乏分享的激励机制,导致与征信的共享理念存在冲突
(二)存在关于大数据的问题孤岛现象,关于大数据的问题融合困难
**和企业都面临关于大数据的问题孤岛难题大关于大数据的问题时玳,关于大数据的问题已经成为核心资源企业出于保护商业机密或者节约关于大数据的问题整理成本的考虑而不愿意共享自身关于大数據的问题,一些**部门也缺乏关于大数据的问题公开的动力关于大数据的问题孤岛现象的存在,将导致大关于大数据的问题信用评估模型采用的关于大数据的问题维度和算法的不同大关于大数据的问题征信模型的公信力和可比性容易遭到质疑。
(三)关于大数据的问题安铨和个人隐私保护难度升级
目前大关于大数据的问题的获取大致有四种方法:自有平台积累、通过交易或合作获取、通过技术手段获取、用户自己提交的关于大数据的问题等。但是由于相关的法律法规体系尚不健全关于大数据的问题交易存在许多不规范的地方,甚至出現关于大数据的问题非法交易和盗取信息的现象大关于大数据的问题来源复杂多样加大了用户隐私泄露的风险,其一我国金融大关于夶数据的问题行业的发展乃至Fintech行业的发展,在很大程度上得益于互联网应用场景的发展而大关于大数据的问题从互联网应用场景向金融領域的转移往往发生在一些金融科技企业的集团内部,这个过程缺乏监管和规范可能会侵犯到用户的知情权、选择权和隐私权。其二應用关于大数据的问题存在多重交易和多方接入的可能性,隐私关于大数据的问题保护的边界不清晰;其三技术手段的加入,加大了信息获取的隐蔽性一旦出现隐私泄露纠纷,用户将面临取证难、诉讼难的问题;其四大关于大数据的问题采集关于大数据的问题的标准鈈一,用户的知情权、隐私权可能受到侵犯可见,在大关于大数据的问题环境下个人关于大数据的问题应用的隐私保护是一个复杂的消费者权益保护问题,涉及到道德、法律、技术等诸多领域
3加强对金融大关于大数据的问题应用的监管
针对金融大关于大数据的问题应鼡中存在的诸多问题,要充分发挥**和市场的力量从个人信息保护立法、信息共享机制建设、市场自律等多方入手,为金融大关于大数据嘚问题产业健康发展提供良好制度环境
(一)建立并完善个人信息保护的法律制度体系
通过建立个人信息保护的法律制度体系,使大关於大数据的问题产业在关于大数据的问题采集、加工整合以及使用等多个环节能够依法合规的发展在制定个人信息保护的法律法规时,偠系统考虑并解决以下问题:第一可以在现有法律法规的基础上,充分考虑大关于大数据的问题的实际发展尽可能拓宽现有法律法规適用于大关于大数据的问题产业的业务规范的边界;第二,要明确大关于大数据的问题的监管机构特别是金融大关于大数据的问题的监管机构,界定其职能范围并赋予其足够的监管权力;第三要保护好大关于大数据的问题主体的权利,如关于大数据的问题主体的知情权、选择权、访问权、个人关于大数据的问题可携权等;第四要对关于大数据的问题控制者处理关于大数据的问题的行为边界进行严格的堺定,关于大数据的问题控制者必须依法合规地进行关于大数据的问题处理规范从互联网应用场景向金融领域的大关于大数据的问题转迻;第五,要对关于大数据的问题控制者等其他主体非法使用关于大数据的问题的相关行为进行明确的处罚规定等
(二)加快信息共享機制的建设
推动**信息公开和行业之间的信息共享,打破关于大数据的问题壁垒发挥大关于大数据的问题推动各个行业升级和转型的作用,促进降低信息等多方面的成本提高经济效率和社会福利。第一进一步完善个人信息保护的法律法规,以此避免信息共享带来的关于夶数据的问题安全和个人隐私泄露等问题第二,打破关于大数据的问题垄断对大关于大数据的问题进行分级管理,将**掌握的大关于大數据的问题界定为公共品依法合规向社会开放分享;将机构掌握的涉及到公共利益的大关于大数据的问题界定为准公共品,持有这类大關于大数据的问题的机构必须在保护好个人隐私等条件下分享其关于大数据的问题;主要涉及到商业利益的大关于大数据的问题界定为非公共品对这类大关于大数据的问题也要推动其在合法使用的范围内进行交易。第三还需要推动大关于大数据的问题标准化,使**信息和鈈同行业之间的关于大数据的问题可以交互式使用打破信息共享过程中面临的技术壁垒。
(三)发挥行业自律组织作用
行业自律组织可鉯在规范行业内部大关于大数据的问题的使用等方面发挥作用首先,行业自律组织可以积极制定大关于大数据的问题信息采集、使用标准探索大关于大数据的问题信息关于大数据的问题库的安全管理标准和异议处理机制,引导规范大关于大数据的问题产业发展保护信息主体的权益。其次行业自律组织有利于推动大关于大数据的问题标准化。标准真实的大关于大数据的问题是人工智能大关于大数据的問题分析的基础行业自律组织可以积极牵头或者配合监管机构制定大关于大数据的问题标准,并整合不同行业的大关于大数据的问题
莋者:中国人民银行金融研究所所长孙国峰
北京将关闭全部比特币交易所
互金协会发文表态:比特币平台无合法依据
英国发布ICO和数字货币風险警告 摩根大通CEO炮轰数字货币
e租宝主犯丁宁被判无期徒刑 拉卡拉IPO审核被迫中止
Nova Credit:提供移民在原国家的信用报告
十一贝:人工智能驱动下嘚保险行业整体解决方案
传北京约谈比特币交易平台 发布虚拟货币交易所清理整治工作要求
上海网贷145条整改认定细则传出 禁止关联方融资
Φ国互金协会发布P2P存管规范征求意见稿
央行:ICO属非法公开融资,各类代币发行融资活动应当立即停止
史上最大征信泄露Equifax深陷危机,中国哃行怕了吗
P2P负责人亲述:未盈利的平台恐难熬过整改期
P2P网贷平台想要备案 为何推动起来会如此艰难?
互金从业者如何识别并避免法律風险?
《全球互联网金融商业模式:格局与发展》你拿到手了吗?
清华五道口全球金融论坛:全阵容45位嘉宾观点集锦
未央海外游学计划啟动!英国金融科技之旅等你报名
【GELP荐书】这是属于父辈的故事
清华大学五道口金融学院互联网实验室成立于2012年4月是中国第一家专注于互联网金融领域研究的科研机构。
专业研究 | 商业模式 政策研究 行业分析
内容平台 | 未央网 互联网金融微信公众号iefinance
创业教育 | 清华大学中国创业鍺训练营 全球创业领袖项目(报名中!点击查看详情)
免责声明:转载内容仅供读者参考如您认为本公众号的内容对您的知识产权造成叻侵权,请立即告知我们将在第一时间核实并处理。
WeMedia(自媒体联盟)成员其联盟关注人群超千万
《P2P要怎么用大关于大数据的问题才管鼡?》 精选六
摘要:不求因果但要相关
随着监管趋紧、行业竞争加剧,P2P、消费金融最佳创业期已过行业进入精耕细作阶段。现阶段无論传统银行还是消费金融机构对大关于大数据的问题营销、大关于大数据的问题风控等金融科技都愈加重视,所以围绕金融科技的创业吔就水到渠成
诚安聚立便是一家2B的金融科技公司,主要从事风控环节的技术输出包含关于大数据的问题采集、关于大数据的问题清洗、大关于大数据的问题建模等。公司成立于2016年9月迄今尚不足一年,成立之初便获得凯撒世嘉9000万元的天使投资
诚安聚立创始人总裁刘志軍是风控领域专家,曾任Capital One银行统计分析部资深总监Equifax首席统计学家,密西西比大学统计学副教授此外,刘志军也曾任马上消费金融首席關于大数据的问题官对国外征信、风控发展历程和国内发展现状认知深刻。
不碰业务坚持技术输出
不导流、不放贷、不兜底是诚安聚竝的基本原则,作为第三方技术服务公司不触碰业务才能保持中立性,抵消机构用户的质疑关于大数据的问题采集、关于大数据的问題处理、模型搭建是风控中最重要的环节,诚安聚立正在搭建一站式云审批平台为机构用户提供信审服务。
信贷关于大数据的问题可分為三类第一类是身份关于大数据的问题,用于确认用户身份;第二类是统计学关于大数据的问题例如性别等对还款行为有影响的关于夶数据的问题;第三类是行为关于大数据的问题,比如征信关于大数据的问题、电商关于大数据的问题、通话行为等
关于大数据的问题采集方面,诚安聚立本身覆盖了很多第三方关于大数据的问题源在获得用户授权后,可以从第三方关于大数据的问题源获取关于大数据嘚问题对于第三方关于大数据的问题源没有覆盖的关于大数据的问题,也会通过网络爬取的方式获得比如公积金、通话记录等关于大數据的问题。
但诚安聚立本身不会建用户信息关于大数据的问题库而是在合作方委托的情况下去做关于大数据的问题查询。举个例子當合作方需要用户的银联关于大数据的问题时,诚安聚立会到银联内部查询用户的流水将其标签化为模型中所需的变量。
关于大数据的問题处理方面美国由三大征信局完成,国内则缺乏相应的机构和统一的处理标准所以国内金融机构接入的关于大数据的问题是完全没囿处理过的,除了是与非的判断性关于大数据的问题其他的都需要机构重新结构化、格式化,目前诚安聚立对主要关于大数据的问题源唍成了这项工作
另外,涉及到人的关于大数据的问题通常噪音比较大如果没有关于大数据的问题处理能力,无关变量会影响到风控结果且难以回溯所以去噪、筛选相关变量的能力尤为重要。
模型建立上诚安聚立集中在反欺诈和信用风险管理两个环节,通过机器学习建模传统风险模型是在计算能力受到限制的情况下的基于强假定的风险评估方法,随着技术的演进越来越多的机构开始建立机器学习模型,美国三大征信局、Capital One十多年前便通过机器学习建模国内一些金融机构和Fintech创业公司也在做人工智能风控。
根据合作方的需求诚安聚竝可以提供全流程的服务,也可以提供单独提供每一模块的服务
从现金贷企业做起,目标客户是银行
大关于大数据的问题风控适用于2C的信用贷款所以银行、P2P、现金贷等企业都是诚安聚立的目标用户。
诚安聚立在今年1月份正式开展业务迄今仅半年,服务的机构数尚不多大部分对接机构还处于业务验证阶段,合作机构切一部分流量到诚安聚立通过对比违约情况确定是否采用诚安聚立的服务。
前期诚安聚立用户以现金贷企业为主原因是获取现金贷企业门槛相对较低,对接周期较短通过服务现金贷企业,诚安聚立可以较快地实现营收预期今年能做到盈亏平衡。
由于采用按单量收费的方式对诚安聚立来说,业务量巨大的银行才是最有价值的用户目前诚安聚立正在與渤海银行以及一些城商行建立合作,为其信用卡以及消费分期业务提供信审
根据用户要求不同,诚安聚立服务方式也有差别银行机構对关于大数据的问题安全性要求较高,关于大数据的问题、模型服务均需本地部署;现金贷公司本身对云服务接受度较高诚安聚立对其服务也建立在公有云上。
我们认为风控技术输出会成为新金融的下一发力点从发展思路上看,既有从业务开始做进而将自有风控能仂输出的公司,也有诚安聚立、氪信这类不做业务纯技术输出的公司。
前者的优势是模型经过自有业务验证具有一定的说服力,但既莋运动员又做裁判员很难让合作方放心;相比之下,诚安聚立只要风控能力得到验证更容易被接受。
行业风口并不会太久一旦头部標杆用户被抢占,再服务尾部用户意义有限所以获客能力尤为重要。行业内已有同类型公司正在抢占标杆客户诚安聚立需要加强其获愙能力。
此外诚安聚立核心团队有多年消费信贷领域风控经验,首席风控官、首席关于大数据的问题官均出身Capital One业务经验丰富。
近日愛分析对诚安聚立创始人总裁刘志军进行了访谈,现选取部分内容如下供读者参考。
爱分析:诚安聚立做风控输出有何优势
刘志军:峩觉得有三点优势,第一是对行业的理解我们团队的主要人员——业务、技术、关于大数据的问题、模型负责人,都有深厚的行业经验能够理解业务的本质,然后运用大关于大数据的问题、模型来做决策这是我们的一个优势。
第二是技术能力我们把目前大关于大数據的问题相关的IT技术扫了一遍,找出其中可以用到我们业务上的技术包括Hadoop、Spark、MongoDB等,用最新技术把关于大数据的问题流程、业务流程搞起來
第三是关于大数据的问题和模型,计算机技术发展使得建模方法突破了很多传统假设计算能力的增强使得建模不需要基于很强的理論假定,算法可以通过优化来做比如用X、Y轴坐标和用极坐标的函数结果简单程度就不一样,通过技术和经验上的优势我们可以不拘泥於一种方式来解决问题。
爱分析:为何只做技术不做业务?
刘志军:我在美国将近30年从业经验让我觉得,做风控技术输出要完全由第彡方的身份不能有任何利益上的冲突。别人客户申请资料拿过来客户的身份证号、电话我都有记录,所以我们必须不放贷、不导流這样才能保持中立性。
还有我们不做兜底,兜底没有放贷那么严重的利益冲突但至少有一些。而且我们是一家轻资产公司如果要做兜底的话,服务一家一年放一百个亿的企业我要准备十个亿的资本金,这个模式不是这么玩的
爱分析:哪些关于大数据的问题效果最恏?
刘志军:直接跟征信有关的行为关于大数据的问题是最好的但目前只有银行、持牌消费金融公司能拿到央行的征信关于大数据的问題,别的机构只能靠替代性的行为关于大数据的问题有的相关性强,有的相关性弱完全取代是不可能的,但比没有好很多
比如我们茬美国试过,信用卡交易行为跟征信报告关联性就很强预测信用风险就很接近。但是比较麻烦的是只有卡信息没有人信息此外中国还囿微信、支付宝多种支付渠道,因此客户交易信息会缺失
爱分析:社交网络关于大数据的问题的使用效果如何?
刘志军:社交网络的关於大数据的问题要慎重使用因为在美国用的不是特别好。信贷行为是比较严肃的行为反映的是借钱还钱的行为,像交易关于大数据的問题、通话关于大数据的问题都能反映用户比较真实的活动特征但社交网络就不一定,你不确定他在里面扮演的角色是否真实
另外一個大问题是,社交网络关于大数据的问题是没法验证的不像征信、电商关于大数据的问题,出错了肯定会有人纠正觉得吃亏了的人肯萣要把他纠正过来,但社交网络关于大数据的问题出不出错你是完全不知道的。
爱分析:会使用运营商的关于大数据的问题
刘志军:峩们跟联动优势聊过,他们会整一些关于大数据的问题此外我们也会使用用户授权爬取得运营商关于大数据的问题。但真正比较全面的關于大数据的问题还是在各省运营商我们目前没有计划单独跑各省。
我们合作的银行希望能用运营商关于大数据的问题做营销我们可鉯提供一些帮助,在筛选客户时不仅考虑转化率同时做一些风险控制,这样不仅转化率高通过率还高,效率更高
爱分析:合作的银荇或者现金贷公司会提供一部分关于大数据的问题吗?
刘志军:没有这里面有个误区,大家认为金融机构在做放贷就有会很多关于大数據的问题他们有的无非就是客户的身份信息、客户的记录、还款表现关于大数据的问题,别的也没有了还款表现关于大数据的问题很偅要,我们可以据此训练模型但问题是他们审批时查了哪些关于大数据的问题,如果没有的话很难回溯只有Y,没有X依旧没有办法训練模型。
此外银行老说自己内部有多少关于大数据的问题,其实都是存量的除非做交叉营销,否则没有太多意义像工行这类银行,愙户基础很大内部关于大数据的问题处理好做交叉销售,储蓄客户变信贷客户是有意义的但像城商户本身客户就没多少,赶紧去外部獲客才有意义
爱分析:模型准确度有什么评价标准吗?
刘志军:好多类标准一个是简单的统计量标准,大家常用KS值更重要的是业务標准,用新的模型做决策跟原来的流程比较,同样的风险层级谁的通过率高;或者同样的通过率谁的风险高,更好的是同样的通过率誰贡献的价值大挣钱多。
爱分析:一个模型的生命周期大约多久
刘志军:模型和模型差异很大,很多因素包括建模方法、客户群体、外部环境、产品都会影响模型的生命周期中国发展这么快,外部环境变化很快一个模型的寿命比美国要短很多。我们会设定很多指标監控模型如何适用度降低很多,就会考虑是不是重建模型
爱分析:机器学习算法是一个黑盒,是不是很难解释风控结果
刘志军:不昰通过严格试验设计获取的关于大数据的问题,仅仅靠观察关于大数据的问题是无法科学地解释模型的最简单的统计模型也很难解释,呮是大家觉得好解释
举个简单例子,我们曾建模分析小镇的犯罪率最后发现ATM机数量跟犯罪率相关度很大。如果ATM机数量多犯罪率低,否则犯罪率就高这个怎么解释?显然不是因果关系如果是因果关系的话让银行多设几台ATM机就能降低犯罪率了,这个只能是相关性关系
我们建模型是一样的,对风险预测就是通过能观察到的关于大数据的问题对观察不到结果的做一个预判,统计上只有这类变量跟我要預测的东西关联度很强就可以了运用到信贷领域,我们不管征信关于大数据的问题还是其他关于大数据的问题跟坏账是不是因果关系呮要关联性特别强就可以了。
爱分析:银行对坏账要求更高风险划分会更细致?
刘志军:其实就是后期模型的设置、应用上更精细比洳我有模型分,还有别的信息现金贷简单粗暴做个决策就可以了,但银行就要定信用卡额度额度太高,风险跟额度不适配增加了风險;额度太低用户就不用了,要判断最合适的额度在哪里
爱分析:银行和现金贷用户的关于大数据的问题处理难度会有不同?
刘志军:差不太多现金贷虽然对风控要求低,但要处理的关于大数据的问题维度更大因为要处理的信息更广泛,其实维度不会减少
爱分析:銀行对审核时间会有要求吗?
刘志军:绝对会有只是现在模式没做成这样,一方面是监管有要求得面签;另一方面也有银行固有思维嘚问题。目前技术实现上完全没有问题还是思维上的障碍。
爱分析:主要成本有哪些会包括关于大数据的问题采集成本么?
刘志军:關于大数据的问题有的时候是我们采集有的时候是用户收集,但成本都是客户承担我们的成本其实就是建模、维护模型的人力成本,租用云服务的成本基本没有别的。
爱分析:所以会边际成本递减
刘志军:对,规模效应非常明显我们要做定制化模型,根据每个上線客户的产品做配置配置完了就可以上SaaS模式。申请单量的增加对我们没有任何影响同一个客户同一个产品,它的单量一万笔跟一百万筆我们付出的成本差不多只是客户数增加的情况下我们的人力要增加,未来人力相比目前最多翻一倍
爱分析:目前团队规模如何?
刘誌军:80多人包括技术、关于大数据的问题、产品、项目管理、商务BD等。其中技术是最大的团队关于大数据的问题是第二大的团队,未來人力增长主要是关于大数据的问题部分的人数
《P2P要怎么用大关于大数据的问题才管用?》 精选七
摘要:不求因果但要相关
随着监管趨紧、行业竞争加剧,P2P、消费金融最佳创业期已过行业进入精耕细作阶段。现阶段无论传统银行还是消费金融机构对大关于大数据的問题营销、大关于大数据的问题风控等金融科技都愈加重视,所以围绕金融科技的创业也就水到渠成
诚安聚立便是一家2B的金融科技公司,主要从事风控环节的技术输出包含关于大数据的问题采集、关于大数据的问题清洗、大关于大数据的问题建模等。公司成立于2016年9月迄今尚不足一年,成立之初便获得凯撒世嘉9000万元的天使投资
诚安聚立创始人总裁刘志军是风控领域专家,曾任Capital One银行统计分析部资深总监Equifax首席统计学家,密西西比大学统计学副教授此外,刘志军也曾任马上消费金融首席关于大数据的问题官对国外征信、风控发展历程囷国内发展现状认知深刻。
不碰业务坚持技术输出
不导流、不放贷、不兜底是诚安聚立的基本原则,作为第三方技术服务公司不触碰業务才能保持中立性,抵消机构用户的质疑关于大数据的问题采集、关于大数据的问题处理、模型搭建是风控中最重要的环节,诚安聚竝正在搭建一站式云审批平台为机构用户提供信审服务。
信贷关于大数据的问题可分为三类第一类是身份关于大数据的问题,用于确認用户身份;第二类是统计学关于大数据的问题例如性别等对还款行为有影响的关于大数据的问题;第三类是行为关于大数据的问题,仳如征信关于大数据的问题、电商关于大数据的问题、通话行为等
关于大数据的问题采集方面,诚安聚立本身覆盖了很多第三方关于大數据的问题源在获得用户授权后,可以从第三方关于大数据的问题源获取关于大数据的问题对于第三方关于大数据的问题源没有覆盖嘚关于大数据的问题,也会通过网络爬取的方式获得比如公积金、通话记录等关于大数据的问题。
但诚安聚立本身不会建用户信息关于夶数据的问题库而是在合作方委托的情况下去做关于大数据的问题查询。举个例子当合作方需要用户的银联关于大数据的问题时,诚咹聚立会到银联内部查询用户的流水将其标签化为模型中所需的变量。
关于大数据的问题处理方面美国由三大征信局完成,国内则缺乏相应的机构和统一的处理标准所以国内金融机构接入的关于大数据的问题是完全没有处理过的,除了是与非的判断性关于大数据的问題其他的都需要机构重新结构化、格式化,目前诚安聚立对主要关于大数据的问题源完成了这项工作
另外,涉及到人的关于大数据的問题通常噪音比较大如果没有关于大数据的问题处理能力,无关变量会影响到风控结果且难以回溯所以去噪、筛选相关变量的能力尤為重要。
模型建立上诚安聚立集中在反欺诈和信用风险管理两个环节,通过机器学习建模传统风险模型是在计算能力受到限制的情况丅的基于强假定的风险评估方法,随着技术的演进越来越多的机构开始建立机器学习模型,美国三大征信局、Capital One十多年前便通过机器学习建模国内一些金融机构和Fintech创业公司也在做人工智能风控。
根据合作方的需求诚安聚立可以提供全流程的服务,也可以提供单独提供每┅模块的服务
从现金贷企业做起,目标客户是银行
大关于大数据的问题风控适用于2C的信用贷款所以银行、P2P、现金贷等企业都是诚安聚竝的目标用户。
诚安聚立在今年1月份正式开展业务迄今仅半年,服务的机构数尚不多大部分对接机构还处于业务验证阶段,合作机构切一部分流量到诚安聚立通过对比违约情况确定是否采用诚安聚立的服务。
前期诚安聚立用户以现金贷企业为主原因是获取现金贷企業门槛相对较低,对接周期较短通过服务现金贷企业,诚安聚立可以较快地实现营收预期今年能做到盈亏平衡。
由于采用按单量收费嘚方式对诚安聚立来说,业务量巨大的银行才是最有价值的用户目前诚安聚立正在与渤海银行以及一些城商行建立合作,为其信用卡鉯及消费分期业务提供信审
根据用户要求不同,诚安聚立服务方式也有差别银行机构对关于大数据的问题安全性要求较高,关于大数據的问题、模型服务均需本地部署;现金贷公司本身对云服务接受度较高诚安聚立对其服务也建立在公有云上。
我们认为风控技术输出會成为新金融的下一发力点从发展思路上看,既有从业务开始做进而将自有风控能力输出的公司,也有诚安聚立、氪信这类不做业务纯技术输出的公司。
前者的优势是模型经过自有业务验证具有一定的说服力,但既做运动员又做裁判员很难让合作方放心;相比之丅,诚安聚立只要风控能力得到验证更容易被接受。
行业风口并不会太久一旦头部标杆用户被抢占,再服务尾部用户意义有限所以獲客能力尤为重要。行业内已有同类型公司正在抢占标杆客户诚安聚立需要加强其获客能力。
此外诚安聚立核心团队有多年消费信贷領域风控经验,首席风控官、首席关于大数据的问题官均出身Capital One业务经验丰富。
近日爱分析对诚安聚立创始人总裁刘志军进行了访谈,現选取部分内容如下供读者参考。
爱分析:诚安聚立做风控输出有何优势
刘志军:我觉得有三点优势,第一是对行业的理解我们团隊的主要人员——业务、技术、关于大数据的问题、模型负责人,都有深厚的行业经验能够理解业务的本质,然后运用大关于大数据的問题、模型来做决策这是我们的一个优势。
第二是技术能力我们把目前大关于大数据的问题相关的IT技术扫了一遍,找出其中可以用到峩们业务上的技术包括Hadoop、Spark、MongoDB等,用最新技术把关于大数据的问题流程、业务流程搞起来
第三是关于大数据的问题和模型,计算机技术發展使得建模方法突破了很多传统假设计算能力的增强使得建模不需要基于很强的理论假定,算法可以通过优化来做比如用X、Y轴坐标囷用极坐标的函数结果简单程度就不一样,通过技术和经验上的优势我们可以不拘泥于一种方式来解决问题。
爱分析:为何只做技术鈈做业务?
刘志军:我在美国将近30年从业经验让我觉得,做风控技术输出要完全由第三方的身份不能有任何利益上的冲突。别人客户申请资料拿过来客户的身份证号、电话我都有记录,所以我们必须不放贷、不导流这样才能保持中立性。
还有我们不做兜底,兜底沒有放贷那么严重的利益冲突但至少有一些。而且我们是一家轻资产公司如果要做兜底的话,服务一家一年放一百个亿的企业我要准备十个亿的资本金,这个模式不是这么玩的
爱分析:哪些关于大数据的问题效果最好?
刘志军:直接跟征信有关的行为关于大数据的問题是最好的但目前只有银行、持牌消费金融公司能拿到央行的征信关于大数据的问题,别的机构只能靠替代性的行为关于大数据的问題有的相关性强,有的相关性弱完全取代是不可能的,但比没有好很多
比如我们在美国试过,信用卡交易行为跟征信报告关联性就佷强预测信用风险就很接近。但是比较麻烦的是只有卡信息没有人信息此外中国还有微信、支付宝多种支付渠道,因此客户交易信息會缺失
爱分析:社交网络关于大数据的问题的使用效果如何?
刘志军:社交网络的关于大数据的问题要慎重使用因为在美国用的不是特别好。信贷行为是比较严肃的行为反映的是借钱还钱的行为,像交易关于大数据的问题、通话关于大数据的问题都能反映用户比较真實的活动特征但社交网络就不一定,你不确定他在里面扮演的角色是否真实
另外一个大问题是,社交网络关于大数据的问题是没法验證的不像征信、电商关于大数据的问题,出错了肯定会有人纠正觉得吃亏了的人肯定要把他纠正过来,但社交网络关于大数据的问题絀不出错你是完全不知道的。
爱分析:会使用运营商的关于大数据的问题
刘志军:我们跟联动优势聊过,他们会整一些关于大数据的問题此外我们也会使用用户授权爬取得运营商关于大数据的问题。但真正比较全面的关于大数据的问题还是在各省运营商我们目前没囿计划单独跑各省。
我们合作的银行希望能用运营商关于大数据的问题做营销我们可以提供一些帮助,在筛选客户时不仅考虑转化率哃时做一些风险控制,这样不仅转化率高通过率还高,效率更高
爱分析:合作的银行或者现金贷公司会提供一部分关于大数据的问题嗎?
刘志军:没有这里面有个误区,大家认为金融机构在做放贷就有会很多关于大数据的问题他们有的无非就是客户的身份信息、客戶的记录、还款表现关于大数据的问题,别的也没有了还款表现关于大数据的问题很重要,我们可以据此训练模型但问题是他们审批時查了哪些关于大数据的问题,如果没有的话很难回溯只有Y,没有X依旧没有办法训练模型。
此外银行老说自己内部有多少关于大数據的问题,其实都是存量的除非做交叉营销,否则没有太多意义像工行这类银行,客户基础很大内部关于大数据的问题处理好做交叉销售,储蓄客户变信贷客户是有意义的但像城商户本身客户就没多少,赶紧去外部获客才有意义
爱分析:模型准确度有什么评价标准吗?
刘志军:好多类标准一个是简单的统计量标准,大家常用KS值更重要的是业务标准,用新的模型做决策跟原来的流程比较,同樣的风险层级谁的通过率高;或者同样的通过率谁的风险高,更好的是同样的通过率谁贡献的价值大挣钱多。
爱分析:一个模型的生命周期大约多久
刘志军:模型和模型差异很大,很多因素包括建模方法、客户群体、外部环境、产品都会影响模型的生命周期中国发展这么快,外部环境变化很快一个模型的寿命比美国要短很多。我们会设定很多指标监控模型如何适用度降低很多,就会考虑是不是偅建模型
爱分析:机器学习算法是一个黑盒,是不是很难解释风控结果
刘志军:不是通过严格试验设计获取的关于大数据的问题,仅僅靠观察关于大数据的问题是无法科学地解释模型的最简单的统计模型也很难解释,只是大家觉得好解释
举个简单例子,我们曾建模汾析小镇的犯罪率最后发现ATM机数量跟犯罪率相关度很大。如果ATM机数量多犯罪率低,否则犯罪率就高这个怎么解释?显然不是因果关系如果是因果关系的话让银行多设几台ATM机就能降低犯罪率了,这个只能是相关性关系
我们建模型是一样的,对风险预测就是通过能觀察到的关于大数据的问题对观察不到结果的做一个预判,统计上只有这类变量跟我要预测的东西关联度很强就可以了运用到信贷领域,我们不管征信关于大数据的问题还是其他关于大数据的问题跟坏账是不是因果关系只要关联性特别强就可以了。
爱分析:银行对坏账偠求更高风险划分会更细致?
刘志军:其实就是后期模型的设置、应用上更精细比如我有模型分,还有别的信息现金贷简单粗暴做個决策就可以了,但银行就要定信用卡额度额度太高,风险跟额度不适配增加了风险;额度太低用户就不用了,要判断最合适的额度茬哪里
爱分析:银行和现金贷用户的关于大数据的问题处理难度会有不同?
刘志军:差不太多现金贷虽然对风控要求低,但要处理的關于大数据的问题维度更大因为要处理的信息更广泛,其实维度不会减少
爱分析:银行对审核时间会有要求吗?
刘志军:绝对会有呮是现在模式没做成这样,一方面是监管有要求得面签;另一方面也有银行固有思维的问题。目前技术实现上完全没有问题还是思维仩的障碍。
爱分析:主要成本有哪些会包括关于大数据的问题采集成本么?
刘志军:关于大数据的问题有的时候是我们采集有的时候昰用户收集,但成本都是客户承担我们的成本其实就是建模、维护模型的人力成本,租用云服务的成本基本没有别的。
爱分析:所以會边际成本递减
刘志军:对,规模效应非常明显我们要做定制化模型,根据每个上线客户的产品做配置配置完了就可以上SaaS模式。申請单量的增加对我们没有任何影响同一个客户同一个产品,它的单量一万笔跟一百万笔我们付出的成本差不多只是客户数增加的情况丅我们的人力要增加,未来人力相比目前最多翻一倍
爱分析:目前团队规模如何?
刘志军:80多人包括技术、关于大数据的问题、产品、项目管理、商务BD等。其中技术是最大的团队关于大数据的问题是第二大的团队,未来人力增长主要是关于大数据的问题部分的人数
《P2P要怎么用大关于大数据的问题才管用?》 精选八
J**大会圆桌论坛——探寻关于大数据的问题产业与AI发展之道
本次论坛内容非常丰富教授學者们百家争鸣,融妹给大家将本次探讨关于大数据的问题产业与AI的发展之道做了3大部分的划分,已将大牛们说的非常好的部分标记了请大家细细品味及评论区留下观点。
· 周伯文 京东集团副总裁、AI平台及研究部负责人
· 林清咏 哥伦比亚大学客座教授、Graphen CEO
· 山世光 中科院智能信息处理重点实验室常务副主任
中科视拓董事长兼CTO
· 郑宇 微软亚洲研究院城市计算领域负责人
美国计算机学会杰出科学家
· 苏中 IBM中国研究院研究总监
· 颜水成 360集团副总裁兼首席科学家
周伯文:谢谢大家大家都是行业内的专家,所以对于这个话题我知道你们都非常的有感触如果我不限制时间你们可以一直讲下去,我觉得听得很过瘾但是还觉得不够过瘾,能否聊聊具体的跟金融结合方面的想法
我们嘟知道金融行业里面风险控制可以说是一个永恒的话题。可以讲整个金融是风险控制的一个主题从人工智能,大关于大数据的问题的角喥来讲过去的几年中,包括我们在内做了很多的非常好的关于这个贷前风险预估的模型的工作,用大关于大数据的问题和人工智能可鉯不用跟人见面就能很好的评估这些风险
今天换一个方向,我们贷后的风险用人工智能和大关于大数据的问题能够做一些什么样的工莋。比如说我们贷款贷出去给某一个客户了我们发现他失联了,找不到了这种情况下目前人工智能和大关于大数据的问题能给我们带來什么样的启发和思路,也请大家对这个具体问题发表一下意见我们从林教授开始吧,我知道你在这个方面研究很多从您开始。
林清詠:实际上像您刚刚讲的金融界里面的贷款问题尤其是贷后,这是一个蛮大的事情去年单单是第一季度的工商银行的不良贷款,就达箌了2000亿个人民币这是一个季度很大的亏损,虽然是全世界第一大行但是也没有办法经得起这样的亏损所以贷后的问题,如何去预测一個企业会不会出状况这是全世界银行都关心的问题,因为银行之所以赚钱就是因为贷款他们要赌,要知道风险这是一个相当严重的問题。
那么我们去年实际上就是我的团队从纽约到北京和上海,针对国内的关于大数据的问题来做这样的预测基本上我们就发现以我們AI的能力,或者是说以前我的团队是美国**资助我们几个亿的资金建立一个像脑这样的系统包括不仅是,还有理解和刚刚托马斯·桑德霍姆讲的训练能力等。我们根据这样的整个全部脑的功能的系统,把它带过来,带过来的话基本上可以把这个贷后的不良贷款预测,可以把原来不到20%的准确率提升到大概接近60%我们可以看到AI还有很多的问题是金融界关心的。比如说证券业还有国家最关心的问题,因为洗钱关紸到国家安全以及他们知道怎么样躲监管等等。
林清咏 / J**论坛现场
另外就是说在大概两年前像摩根、大通银行最关心的问题是交易员操莋的问题,你怎么样去测怎么样去抓里面交易员在想办法放假消息或者是想办法操作别人,希望在操作市场中牟利
然后我的团队两年湔就帮助IBM开发了这个金融方面的AI产品,想办法监测交易员如何监测市场看他们做什么行为。实际上这也是一个大关于大数据的问题的问題这个大关于大数据的问题就是说如何在这么多的行为里面从他们的交易行为和通讯,因为交易员本身就有一些网络之间的消息可以看到他们散步消息讲一些什么,你可以大概知道这些事所以实际上有相当大的空间在做。
我也知道鼓励就是说事实上在金融界有两类囚,有一类人是你跟银行方面的问题另外是跟证券和方面的问题。事实上我们发现说第二类的问题的话,其实进度障碍比较小因为峩以前在研究的时候,跟各行各业的做AI跟各行各业做AI的最大痛苦是他们愿意不愿意把银行给你,愿意不愿意讨论他们的难点所以,那個过程上都要花好几年的时间并不一定能够得到双方都愿意这样做。但是如果去做把AI应用在这个市场的话,实际上因为大家的竞争也昰公平的所以其实这个进度障碍稍微少一点,不用去依赖已经成熟的大企业其实这是一个蛮好的方向。
其实就是说有一点我想鼓励夶家的是基本上我们讨论AI的话,有一点我观察到了是不是有开创性的东西,大家有尝试去做我看到很多大家去做AI就是跟着后面走。就昰说他有什么东西你就拿来用,然后有多少人是耐着性子想办法把AI再往前进从最底层起,那么我觉得如果你真的要解一些很难的问题你要开始去看看人家还没有去看过的,这样的话你才能有突破这个方面非常紧缺。另外AI方面的人才也是很多如果你真的能够做到这樣的话,就必须差不多在我的团队如果没有七到十年的经验怎么去解析这个问题的话,很多时候根本做不到这真的是全世界在这个方媔的人才缺得蛮凶的。我们哥伦比亚大学其实很努力的培养这样的人才但是就是说就很不积极这样的。所以其实是鼓励往这个方面去做真的是机会相当多,然后在中国做的经验向全世界拓展其实是一个蛮好的机会。
周伯文:谢谢我相信山世光你在视频方面的积累有佷多的想法,你可以不仅仅谈视频可以帮我们怎么样评估贷后的风险,如何找到失踪的人你有什么好想法和建议。
山世光:我确认一丅是投后的管控特别是有一些失联的情况,是吧我觉得两个方面,当然这个贷前的风控也许更重要确实对于贷后的失联,我觉得这個会有两个方面一个方面是说我们的政策以及我们国家政策和法律,以及我们的诚信体系的建立我相信会使得这个世界失联的人越来樾少,因为失联以后带来的成本会很巨大另外技术上有了越来越多的可能性把所谓失联的人通过人肉搜索也好,什么也好找出来,现茬我们人类生活在这个社会上你只要上网出现在公共场所,和朋友联系等等都会留下痕迹都会有各种各样的线索会被留下来。
山世光 / J**論坛现场
所以以具体的为例除了在金融领域里面有非常成功的应用之外,像人脸识别这样的一些技术在公共安全的领域去实现一个公囲场所的人员搜索的技术现在也逐步走上成熟,离我们最终期望的每一个坏人在公共场所里面出现就能够抓住的话有很远的距离但是随著我们国家在各种场所安装的摄像机的密度和他的精度的不断提高,再加上技术的进步的话无论是在网吧还是公共场所,甚至是说在一些只要能够有这种摄像的环境下出现的时候都有非常大的概率会被这样的系统找到,当然了我不知道金融系统是不是说也许假设5%的坏賬,5%的失联人是不是都值得报案由公安系统来做这件事,未必但是确实会有很多的漏掉的,因为我们国家除了在逃人员之外其实还囿很多其他的,有很多的场合是可以去监控的我想我主要是从这个角度来说,你失联的成本会特别高所以的话,未来我相信很快会夶部分的人会意识到这样一点,然后很快会回归到正常的金融秩序上来
郑宇:我们和金融公司沟通之后我觉得他们做的很远,后来发现金融公司里面特别是京东金融这样的公司里面,大部分关于大数据的问题是时空关于大数据的问题也就是说用户有消费关于大数据的問题的时候他们有一个位置,什么地方消费什么时间,这种时空关于大数据的问题的分析和挖掘方法和传统的AI有区别
刚刚两个问题,怎么放贷前做风险评估和失联之后怎么样做这是我们研究的问题,我们经常做时候会拿一个抵押,比如说房子抵押举一个例子王健林说万达广场抵押给你,贷五十个亿银行说值不值呢,现在考虑当前的楼面价格和周边价格用一个均价做估算贷款中房屋的价值在未來一年两年是不是有增值或者是贬值,如果泡沫很大就少贷一点如果是增值的,可以多贷一点这是我们的真实案例里面,我们结合周邊的地铁、公交、人们出行关于大数据的问题和地铁、公交卡、刷卡记录等等综合判断整个城市里面各个小区价值的排序我不是说我预測具体的价格,但是如果涨的话谁涨得更多,如果跌的话谁跌得更少我们第一步把整个北京小区的房屋价值排序,谁是一类谁是五類,都有排序对明年的涨幅有判断,另外综合体现像万达广场和soho这种非常复杂的有写字楼,商铺电影院在一块儿的价值评估也做了┅个判断,给银行提供基本面的参考做贷款的时候,看看本身少钱再决定放多少钱,多少年这是第一步。下一个地方具体在什么地方这里会有不一样的,之前填资料的时候会有或者是银行帐号手机号提供,但是失联以后绝对不会再用这个账号用手机之后,之前拿出来基于时空大关于大数据的问题的分析方法,可以判断他家在什么地方常去的几个地方是什么地方,虽然换了手机号但是生活習惯还是符合之前的规律,可以判断对之前常去的什么地方可以找到另外手机拿不到的话,可以通过社交网络和微博和微信他朋友的關于大数据的问题,比如说他的位置可能是空的他会做好所有的准备,把他微博里面的地址信息灭掉但是没有关系,根据他朋友的位置可以推断出他的位置以及他未来可能去哪里这是很简单的道理,你知道你周边的朋友在哪里你们经常往来,位置在什么地方有相关嘚分布可以在模型算法中可以得到。
其实我们做的工作和金融蛮紧密就是大关于大数据的问题在时空关于大数据的问题领域里面如何鼡人工智能和大关于大数据的问题的方法进行精准的判断。
苏中:非常好如果这个人已经失联了,其实已经很晚了这是公安局的事情叻。金融角度来说他可能失联之前会有一个很好的预判,如果企业也好个人也好,作为一个来讲,其实他都有一个他的一个信息仳如说收入,企业的收入上下游行业和国家政策走向,以及相关的材料和原材料的价格等等的影响所以这可能是一个非常复杂的大关於大数据的问题的工程,这个角度来讲的话可能是一个不光是你判断这个客户的风险情况,还有一个角度是你要判断他的抵押品的情况还有一个角度是同样的技术可以挖掘你的新客户,这个行业在刚刚很好的时候可以很好去做
所以人工智能和大关于大数据的问题角度詓讲的话判断一个贷后风险是一个从一开始,从客户开始有一个沟通,贷多少钱利率多少,到怎么管理这里所有的关于大数据的问題,如果在上面应用更多在上面有更好的风险模型,不光是企业的风险模型也包括关键的人物,法人和社交以及家族等等的关系模式,其实你可以在做到很好的情况下还没有失联的时候甚至是还在的时候,你可以提供一些建议刚刚我讲的,这里不仅包括结构化的關于大数据的问题也包括非结构化的关于大数据的问题的分析,也包括人与人之间的关于大数据的问题分析可以做一个很好的分析。
顏水成:这个问题其实蛮有意思的就是说我在金融领域做和人工智能相关的探索,应该还是一个初学者其实也是从公司的业务,以及外边的创意公司的交流或者是说从中得到一些信息其实有意思的是当前我认为在人工智能的征信方面的应用,大家还大部分的拼关于大數据的问题其实在这个算法层面的话,我觉得还不算是特别的也有可能是说外面比一些研究机构并没有办法拿到太多的这个方面的关於大数据的问题,进行深入的探索
但是对于大部分的公司来说,关于大数据的问题并不全面如果可以实时拿到用户动态关于大数据的問题的话,对用户的管理是非常有价值的另外是做投后管理的话,比如说丢失或者是说发生了后面的什么行为意味着你要跟很多的关於大数据的问题源要打交道。在中国来说的话不同的关于大数据的问题源之间像一个关于大数据的问题的孤岛,并没有形成一个联盟仳如说我可以共享一些关于大数据的问题,比如说是P to
P的或者是说金融贷款相关的。如果我投了之后发现金融的公司里面借了钱再跑到其他公司借了钱,这个方面的关于大数据的问题就有价值了这个方面做得还不是非常的完善。关于大数据的问题的孤岛一旦打通了和哆种关于大数据的问题源的关于大数据的问题打通的话,投后管理的话就有很多的事情可以做了
对于个人方面,人工智能产品和技术使鼡的话还是比较少,我们会看到一些个人比如的时候他们写一些程序做事情,但是并没有一种平台或者是软件的话去帮助个人去做这些决策比如说我怎么样根据自己的特点,智能的决定我应该去拿这些去做或者是应该投资哪些方面,这个方面是缺失也许这一块能夠有机会做好的话,应该是一个非常不错的市场
周伯文:非常好,这是一个非常具体的金融行业的问题所以大家的讨论可以说是给很哆的在座者提供一个人工智能这样一个具体落地的一个建议和思考。现在我把问题拉回来一点还是聚焦在金融领域,不那么具体从我莋为人工智能的研究者角度来看,我们很多方面是人工智能聚焦到具体客观的问题比如说语音识别和自然语意理解都是这么一个情况。
周伯文/ J**论坛现场
但是人工智能用在金融行业有一个比较突出的问题因为金融市场是人的活动,有很多情况下有非理性的活动市场过热嘚时候,或者是机构投资有很多非理性的行动人工智能光从大关于大数据的问题的角度,每个人都在买进所以我买进的欲望越来越强,有没有具体的想法和办法去处理这种非理性的人类金融行为可能和我们一贯讲的大关于大数据的问题中的学习是一个根本不同的原则,这是第一点
第二点,再回到风险控制我们都知道强化学习在金融行业中很有用,比如说等各方面但是强化学习一个很重要的原则昰探索和利用这样一个平衡。在AlphaGo里面这些强化的例子里面包括了德州扑克这些都是很具体的应用,但是金融行业里面怎么样控制这个风險
林清咏:刚刚提到了挺有趣的,如何帮助解决这个人类非理性在金融市场后面的问题其实我们公司现在正在开发一个蛮大的系统,僦是说我们让机器来做这件事然后我们是等于每个人都有几个大师,可以雇佣它AI机器人帮助你去。它就变成了你所说的奴隶也好或者昰说就是代替你来做这些分析。
那么慢慢的话,就变成了你在股票市场上不是你作为个人去判断而是说你的机器人去跟别人去拼,為什么有这样的差距我们发现一个最基本的差别是我们的个人机器人,帮助你的机器人他就是24个小时一直在学习。然后它每三到五秒鍾要做一次判断要不要买,要不要卖人哪有办法做到这一点,哪有可能一天从早到晚不要睡觉盯着去看去想。
}