首页 - 财经 - 产业观察 - 正文

圆桌对话一:大数据征信 “垃圾进垃圾出”怎么破?

来源:21世纪经济报道 作者:包慧 2015-12-17 08:36:10
关注证券之星官方微博:

主持

董希淼:恒丰银行研究院院长

对话

杨晓军:陆金所副董事长

邱寒:前海征信总经理

孔令强:中诚信征信董事长

童邗川:华道征信常务副总裁

周治翰:开鑫贷总经理

征信市场规模有多大?

主持人:很多人说2015年是“征信元年”,在征信元年,关于征信市场规模问题大家怎么看,征信是互联网金融的“水电煤”吗?

杨晓军:我们现在这个市场(P2P)里据说有3-4年没有征信记录,这跟我们原来金融基础设施的落后有关系。这个市场有多大呢?要回答这个问题可能取决于以后个人征信的公司到底能提供什么样的服务,服务质量是如何。

大数据能够判断征信必须是突破传统线性的数据,更多的是关系型的数据来提供比原有征信机构更准确的判断。目前来看由于数据的分割,个人征信公司用关系型的数据来判断,来提出比原来征信、银行的数据更高质量信息可能还比较困难。以后征信市场有多大,还取决于提供的服务有多大。

邱寒:征信就应该是互联网,不仅仅是互联网金融,应该是金融的“水电煤”,说到水电煤是公用事业,今后市场有多大我想用电来举例子,当年电刚刚被发现的时候,最大的用途是使用电灯、照明,如果按照那个时候的用法可以估算市场流量可能会严重低估。

现在征信最大的应用场景是借贷,如果问我今天的规模我完全可以按照市场的借贷规模估算用量,中国一共13亿人口,最多也就1亿人有信贷需求。多少次用征信,征信每一次查询用多少钱,这很容易算出市场规模。

但这样的方式计算出市场规模合适吗?我觉得不合适。

互联网大数据的征信发展是刚刚开始,还处在婴儿期的水准,今后的发展从估算它的用量和市场规模来看,更取决于这个应用场景的拓展。前海征信从6月份开始对外推出,到今天为止的客户里面还是以借贷的场景为多,但越来越多非借贷场景在加入。市场容量可能会需要用发展的观点来看。

孔令强:第一,征信绝对是金融的“基础设施”,也是金融发展的“高速公路”。

第二,前段时间我也是在梳理行业市场容量的逻辑。券商抛出来1000多亿,逻辑是基于前期征信是基础设施,应用的场景是无限在扩充。

征信市场规模怎么算,像美国除去三大征信中心以外有400到500家数据公司,围绕征信市场去做的市场算不算金融?如果算的话,别说1000亿了,中国奔着1万亿也不为过。

主持人:前段时间我们是看到了券商分析,国内的各种征信在1000亿左右,有人认为这个数字被高估了,显然邱总跟孔总不太赞成这个数字。

邱寒:就借贷而言是被高估了。

主持人:如果从借贷拓展到非借贷领域,这个数字可能是被低估?

邱寒:是的。

孔令强:逻辑很简单,美国转换率有多少,单价是多少,转换率有多少一乘就出来了。国内也是,但是国内定位是现在这种技术规模,这种衍生逻辑是值得推敲的。仅信贷本身而言我同意邱总的观点。

主持人:想象空间很大,关键看应用场景怎么拓展。

童邗川:两个问题一个是不是基础设施,第二个规模有多大。第一个问题我回答,是。金融风险定价涉及到风控,风控涉及到征信,怎么绕也绕不开。可能不光是互联网金融要讨论的问题,我觉得往大里说就是整个社会质押型经济往信用型经济转变的问题。所以说征信是一个基础产业。

规模问题,平安证券的报告说是100亿,富国银行说350亿美元,就是2000亿。征信中心每天查询量企业25万次,个人大概164万次。前三个季度数据企业的查询是6000万次,个人查询是4个亿。简单的一些数据大家都会做一些推测。

周治翰:征信业务跟传统基础设施领域相比有不像的地方,因为它的成本是不一样的。基础设施比如像邮政、自来水、供电有普遍服务的概念。邮政不管跨多少大山,跨多少河流也要送到。偏远的角落电网也要覆盖。但现在大数据的环境下,这点似乎就被弱化了。

大数据征信需要“试金石”

主持人:去年美国国家消费者法律中心,对美国主要大数据公司调研,发了一个报告,叫“大数据征信对个人征信的大十问”,称进入大数据征信公司的数据50%左右是错误的,不完整的,有问题的,所以是垃圾。基于进入源头存在垃圾,出去的征信报告,征信分析的一些产品也认为存在垃圾。对于垃圾进垃圾出各位怎么看?

邱寒:接手前海征信之前我负责平安集团大数据的工作。做数据跟挖矿有点像。数据里面是存在价值的,就像每个矿有一定的含金量。数据也分为含金量高和低。

我觉得要解决大数据垃圾进垃圾出,需要两个重要的前提条件。

第一得有试金石,你自己得懂挖什么矿,别不知道自己挖的什么。没有积累过任何历史逾期的信息就没有试金石,没有试金石的时候怎么样鉴别矿产价值的丰富程度是值得怀疑的。

第二是挖矿的技术,刚才都讲了天然的矿产当中没有一个百分之百的,不可能说挖到的是纯粹的金子。即使非常干净结构化的数据,中间也存在交易。数据质量有问题,真实性有问题,这就是做数据的人天天在面临的问题。怎么样去把这个数据鉴别出来,哪一些是真,哪一些是假,怎么样把假的数据给过滤掉,把这些噪音给过滤掉,留下最为有用的一部分。

有没有垃圾进、垃圾出的情况,有。有垃圾怕不怕?我觉得不怕,只要有试金石的技术不成为问题。

孔令强:所谓的垃圾进、垃圾出,焦点是出的是不是垃圾,出的是金子一定不会垃圾进,而这个核心的问题在哪呢?拿美国统计数据来,是针对互联网大数据征信,不被主流征信市场所覆盖的人群,他没有金融强项和数据支撑,直接更准确判断征信的水平、信用水平,就拿一些弱相关数据访问。而在大量的实践当中会发现,超过50%这样的机构预测性是很低的,这种预测性的结果拿出来是垃圾出。

比如这个问题最早的时候我碰到过,就是做企业的信用评级,我们在各省的时候跟地方深度和小微企业金融做信贷评级。遇到最大的问题是报表失真,做假,花一千块钱盖章出来审计报告,拿那个审计报告不敢用。我们评级分析师要到企业去看他们账,记账凭证,看销售能力,看供应商,把收入和利润反算出来来判断,尽量的来把这个水分挤掉,也就是把垃圾分解出来。为什么会这样?真的是缺乏手段。

童邗川:我个人的理解,大数据在征信上,实际上还是能起到非常大的作用。举个最简单的例子讲,征信是什么?征信这里面我想讲两个,一个是征信主要解决三个问题,一、你是你,二、你的还款能力,三、你的还款意愿。在反欺诈的问题上,大数据可以起到相当大的作用。

垃圾进,垃圾出的现象这肯定会有。在进的时候严格把关,在征信的数据准确性和相关性上严格把关。

周治翰:还是说应用的问题。开鑫贷之前有一个股东,拿的是我们江苏的企业征信牌照,有什么优势呢?是建设江苏全省的600多家小贷公司的后台系统,小贷日常经营数据,每一笔放贷的借款人这些数据全部在它后台实时录入的,按道理来说,这个数据说小也不小,还蛮大的。而且这个数据根据监管部门的要求入实录入,我们应用这些数据依然发现有问题。

但是有问题不代表不用这个数据,还是能够通过一些手段去把真实的情况鉴别出来。我们用非现场发现问题的苗头,根据蛛丝马迹结合现场的筛查基本上八九不离十,可能我们后台基于这些数据我们工作了四五天,到现场一两天把这个帐翻一翻,验证一下就非常好了。

杨晓军:大数据征信存在的问题,传统金融历史上也存在过的,也是一些征信不可靠性,在2008年金融危机体现最充分的。欧洲的银行说过一句话,说信用评级机构不能够依靠买账。我们看到很多很垃圾的CDO、CDS债权都被评为很高的级别。所以征信这种东西作为金融决策的一个参考,一种辅助手段,本身也存在着一定的问题。现在征信行业开始用大数据的时候,肯定也会遇到一些技术上,或者方法上存在的问题,会有一个发展的阶段。

当大数据进入到金融行业以后,我个人观点是未来金融决策也会发生很大的变化。一些技术的应用改变金融决策的方式。

(本报记者 包慧 整理报道)( 编辑 辛继召)

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-