互联网金融行业如何玩转大数据?

中国计算机报 2019-03-13 10:14:13

  P2P网贷平台积木盒子上线两年,注册用户近110万,交易总额达86亿元;获1000万美元A轮、3719万美元B轮、8400万美元C轮融资。是什么让它如此受资本青睐?是什么让它发展如此迅猛?炙手可热的互联网金融行业属性是外因,而数据化运营的企业理念则是更为重要的内因。

  积木盒子,北京乐融多源信息技术公司旗下P2P网贷平台,2013年8月7日上线至今两年,注册用户已近110万,交易总额达86亿元。2014年2月,上线仅半年积木盒子就获1000万美元A轮融资;2014年9月获3719万美元B轮融资;2015年4月,获8400万美元C轮融资。是什么让积木盒子如此受资本青睐?是什么让它发展如此迅猛?

  炙手可热的互联网金融行业属性是外因,而数据化运营的企业理念则是更为重要的内因。

  始于风控 数据驱动

  8月6日,立秋前两日,京城难得一见蓝天白云的好天儿,在位于北京朝阳西大望路的温特莱中心26层积木盒子前台招待区,从上到下通透的玻璃落地窗让人视野开阔,精神气爽;而一门之隔的办公区内,一帮80后、90后,朝气蓬勃,忙得热火朝天。




  就是在这儿,记者采访了积木盒子金融大数据应用中心副总裁张良贵,听这位计量经济学博士出身、已有10年金融从业经验的青年才俊把积木盒子的数据化运营之道娓娓道来。

  其实,包括积木盒子在内的P2P网络信贷公司的业务逻辑与传统金融机构本质上都是一样的:一端是融资,另一端是投资,做好信息对接和风险管控,解决“钱多的人没地方投资,没钱的人找不到地方借钱”的问题。只不过,P2P可以借助互联网提升服务和效率。

  “互联网金融的本质是将体验、效率融入金融业务,是‘互联网+’的典型应用。而积木盒子的价值就在于为融资人和投资人提供更好的服务,达到极致的用户体验。”张良贵说。

  他向记者介绍,积木盒子是在“企乐汇”的基础上发展起来的:早在积木盒子诞生之前,为风控而生的企乐汇是通过一套移动端数据采集工具加数据处理系统,为融资企业和金融机构提供尽职调查、数据咨询服务的。它建立了一套360度的实地尽职调查机制,确保所有项目来源信息有据可查,最大范围内降低项目风险。目前,企乐汇已经独立成为公司,进行品牌运作,积木盒子大部分项目都委托给它进行实地调查。

  企乐汇工作人员到实地考察项目企业,通过照相拍摄等方式收集资料,得到影像、文字资料。对于实地考察和签约过程,积木盒子通过GPS定位和出行轨迹记录等技术手段进行监督。而收集回来的资料,经过加工处理之后的数据再和源于政府部门、金融机构、征信系统、核心商圈等的权威调查数据进行汇总,导入积木盒子的数据分析系统,通过自建的模型分析计算得出企业项目经营评估结果,保障项目安全。

  除了实地走访,积木盒子还利用四重保证金等模式在可控范围内把风险降到最低。另外,积木盒子已经与民生银行签约进行资金托管,是P2P领域第一家与银行签约进行资金托管的公司。如此一来,一旦项目出现风险,银行可以冻结账户确保资金安全。

  对于尽职调查得回的纸制资料,积木盒子会进行数据化处理,比如一份文字申请书有上百个字段,IT人员会将上百个字段完全打散,导入数据库,以供后面做单个企业追踪、横向比较或垂直分析使用。

  积木盒子就是从一开始在企业端培育数据采集和处理能力,再转型做的P2P平台。在融资端,积木盒子面向中小微企业提供经营贷款和面向个人提供消费贷款融资服务。而在投资端,积木盒子以敏捷、简单、直接的网站页面和操作风格汇聚投资者进行在线投资理财。

  自建大数据平台

  “为了服务好融资和投资这两大群体,我们在产品设计、风险控制、渠道准入等方面需要做很多工作,形成、积累大量内生数据和外生数据,为大数据分析与应用提供必备的基础。而通过数据分析则可以支撑企业运营的各个环节。”张良贵说。

  正是源于数据对业务发展的重要性和公司管理层对数据的重视,自公司创始,积木盒子就由张良贵组建了大数据团队,自建大数据平台。目前该团队人数已达30人,分别负责数据采集处理、数据分析管理,以及与基础平台、工具、算法和可视化相关的工作。

  大数据可以提高决策支持,要实现大数据的高效应用,需要构建基础设施平台,即大数据平台,积木盒子为构建高效的大数据平台一直在努力。大数据平台有三大功能,即数据模块、工具模块和可视化模块。

  积木盒子的数据源主要有三块:自有的交易数据,如投资记录、信贷审批记录等,通过第三方合作的数据和在互联网公开抓取的数据。交易数据作为内生数据,为大数据分析平台提供了大量数据样本,而外生数据则是需要从过载的互联网信息中甄别,对传统数据进行有效的补充,从而建立欺诈规则、违约预警和进行运营监测等。

  就分析工具而言,张良贵坦言,市场上成熟的工具灵活性差,相对灵活可用的分析工具又太散了,清洗、交互、可视化都需要单独找工具,还得用第三方开源包一层才能用。而目前,他们用Python语言自己开发分析工具,因为Python可以把用C、java等语言编写的工具按照它自己的范式包起来实现通用调用。

  在报表、数据可视化方面,积木盒子与永洪BI合作。在大数据平台的搭建方面,张良贵分享了几条他的经验:组件库和规则库是未来大数据应用的主要产品,数据仓库和API应用接口能够保证积木盒子的数据应用更具有便利移植性、拓展性,形成闭环的数据生态链是关键。

  张良贵介绍,积木盒子应用大数据的思路是数据+工具+场景:数据大集中,形成API可以规范调用的数据仓库;场景就是业务模式,是数据应用逻辑所在;工具为实现数据和场景的有效对接而存在,包括调度、展示与预警等。

  应用场景是数据的灵魂

  积木盒子目前的交易数据量并不大,如果不包括影像、音频等资料,其数据量级目前就在几百GB左右。但张良贵强调,最关键的并不是看你拥有的数据量有多大,而是如何结合场景组织有效数据加以分析得出结论,从而产生的价值有多大。

  在张良贵看来,数据的应用一定是与业务生态紧密绑定的,这样才能实现闭环的数据链,得到的分析模型与结论才能更好地指导业务实践。换句话说,场景是非常重要的。积木盒子的场景包括风控、用户行为体验和营销策略绩效等。“应用场景是数据的灵魂,可以让数据更有生命感。”张良贵说。

  “对积木盒子而言,数据支撑已经从最初的风控覆盖到全部部门了,我们的报表从最初的一两张,到现在的200多张,数据的价值正在逐步展现。”张良贵介绍,投资人对数据最敏感,大数据团队会定期向董事会提供数据全面、准确的报表。

  业务部门最关心用户体验,他们需要定期提供重点客户排序、投资额度排序、流失特征挖掘等数据,以此调整激励策略。以用户分层为例,大数据团队会根据用户投资额度、投资频次、时间进行分层,比如额度大、投资多的大用户一旦出现流失或者处于流失的边缘,就可以预警通知客服人员“你的大客户要走掉了,要不要进行电话关怀”等。

  运营部门需要数据进行成本分析,了解用户转化率、转化成本、转化周期等。而为了保障正常的运营,把握好投资人收益、融资人成本之间的平衡,大数据团队特别开发的“痛苦指数”来动态显示这种均衡性,每天运营部门和公司管理者都可以看到,是不是存在融资项目过多或者投资过多的情况,以把握业务良性状态发展。

  风控部门需要做贷前审查和贷后跟踪数据分析,贷前审查包括欺诈信息核查,针对企业的360度的细致审查;贷后分析主要考察企业贷后的现金流分布,会通过项目还款的时间分散度、项目分散度、渠道分散度来优化风控政策。“风险端运营监测是重中之重,对系统风险和个体风险要求有更精准的研判,为实现这一目标,数据层、工具层和逻辑层要达到高度配合。”

  张良贵称,大数据的典型特征就是弱相关、多维度。不像传统金融机构拥有庞大的数据积累,对于积木盒子而言,所有的数据都是相关的,但真实性、完整性有缺陷,需要多维度去分析,进行多维校验。他以公司近期针对个人信贷推出的“读秒”产品为例介绍,“读秒”作为一个线上放贷产品,在风控方面就要求申请人必须五个要素合一,即从各个数据源来的身份证号、手机号、银行卡和地址、单位信息要一致才能放贷。因为只有五要素合一,再加上时间维度,才可以排除一个人的欺诈风险。

  “数据是肯定能产生价值的,但需要一个积累的过程,渗透到公司运营的所有环节,就会产生巨大价值。”而数据的价值却不仅限于此,对积木盒子而言,数据走向开放,聚焦更多主题,孵化更多商业机会则是更大的目标。

  这不,催收部门就主动来找张良贵要数据来了。催收部门以往就是针对坏账、准坏账拼命给人打电话催收款,而现在催收部门也有了数据的概念,希望能从张良贵这拿到除了催收对象的电话之外的更多数据,包括住址、经常的联系人、爱好、社交关系等大数据,以提高其工作效果。数据驱动的尽调业务企乐汇已经独立运营,或许下一步,数据驱动的催收业务也会是不错的商业机会呢。

  数据势必走向开放

  同一个数据源,不同的人使用角度不一样,价值就不一样。“把所有数据都紧紧握在自己手里是没有多大意义的。”张良贵说,就像去哪儿等公司都提供开放式的数据,谁可以建模一样,对积木盒子而言,“数据分隐私和非隐私的。除了跟特定应用场景绑定很紧密的、像交易数据等类似隐私数据我们会封闭,其他一些共性数据我们会公开。我们目前有两个库,企业库和人物库,不做清洗的话,前者有700万个,后者有800万个。像基于人物库的用户画像、关系图谱等数据分析工作可能外包出去。未来,积木盒子可能将80%的数据包出去,放在一个开放的平台上,只要有人觉得数据有价值,就可以自己建模分析。分析项目如有价值,积木盒子会对它进行项目孵化。”

  据了解,积木盒子和中国人民大学的大数据合作项目就是这个概念。“我们提供数据,人民大学学生提交研究报告,不仅要给报告,还提交支持这个报告后的主题数据库。主题库的价值要远比宽泛的大数据仓库高。”张良贵说,“积木盒子最开始是数据驱动场景,但场景丰富到一定程度会慢慢地会回到数据,数据越来越大之后,肯定不是靠一个人或几个人就能挖掘出其价值的,一定是在一个开放的平台上,让更多的人参与进来,而积木盒子可以反过来帮助这些人,孵化这些项目。”

  数据的价值毋庸置疑,不管自己变现还是通过催生新的业务形式。这也正是积木盒子创始人、CEO董骏一直强调的思路——始于数据,回到数据。

专注企业级报道,影响信息化决策。中国计算机报关注IT行业技术和应用,聚焦新市场、新模式、新应用。欢迎关注中国计算机报微信,或是作者微信号,让我们一起畅谈产业巨变。

Copyright © 网络金融论坛论坛@2017