正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2016-11-22 21:47
征信行业黑市数据泛滥,是解不了的死结?

一本财经的深度调查《征信之乱》发布之后,刺破征信行业的那层窗户纸——数据之乱,是行业不可言说的秘密,却也是绕不过的硬伤。


征信行业,正处在特殊的“空档期”,一边是,行业监管尚未成型;一边是,行业乱象暗流涌动。


待发牌机构,如履薄冰,担忧监管层看到行业乱象,会“一刀切”。


中国征信行业,本有“换道超车”欧美的机会,却因为数据黑产盛行,恐怕存在劣币驱逐良币的风险。

征信行业正在紧张揣摩监管的“圣意”,是飘扬的红领巾,还是冰冷的闸刀?


1、行业的暗疮


“能不能帮我们联系黑客?我们想购买数据”,《征信之乱》发布后,后台最多的,是如此的留言。


有说“公司在冲用户量”,也有“公司融资困难,只能节约成本”,不管理由多悲情壮阔,实际上,他们对黑市数据垂涎已久,只是苦于没有渠道。


对于黑市数据的混乱和隐患,他们也极为了解。但在低价和暴利面前,大部分人会选择铤而走险。


可见,黑市数据的地下交易,已是行业的暗疮——没有人愿意揭开这个伤疤,这里满溢着欲望的脓汁。


就在昨日(11月21日),中国青年政治学院互联网法治研究中心发布了《中国个人信息安全和隐私保护报告》,从100多万的调查样本中,让人意识到,个人数据的外泄,已达到触目惊心的地步。


72%的人群认为,个人信息泄露问题严重。而81%的人,骚扰电话来电时,就知道姓名或单位等个人信息(详情见下表)



实际上,黑产的可怕,远超我们想象。


黑客KK称,地下黑市交易数据,几乎可以涵盖一个人所有“可想到的信息”,包括购买记录、定位信息、开房记录,甚至在某某网页上的停留时间。


黑产数据,已可以从200多个维度了解一个人,“甚至比你自己更了解你自己”。


近两年,因为征信和大数据的兴起,给黑市注入了大量资金,推动黑市数据的迭代更新和流动交易。


“因为购买需求旺盛,每个月黑市上的数据都会翻新一轮”,KK称,黑市数据的流动速度,印证了市场的繁荣。


2、换道超车的机会


一边是黑市数据的急速涌动,一边是领头羊的乱中建序。


个人征信的的前行者,正试图为这个敏感而核心的行业,披荆斩棘,探出一条新路来。


中国的征信行业,完全有机会换道超车。


美国的征信体系,是市场主导型的,征信机构几乎都是民营性质。而其数据的来源,主要是银行和相关金融机构的信用信息。比如,费尔艾萨克公司推出了信用分模型——FICO分,已经成为世界通用的一种评分模型。


据中国网数据,在中国,截至2016年3月底,央行征信共收录8.85亿自然人数据,有信贷记录的自然人数3.7亿人,没有信贷记录的人多达5亿。这也意味着,中国还存在大量的“零征信”、“弱征信”人群——他们游离在央行征信体系之外,甚至没有迈进过银行,比如农民、蓝领、学生等。


正因为如此,也让中国征信体系的搭建,有了一些“曲线救国”的奇招。



中国一些征信公司,试图寻找一些看起来无关紧要的数据背后的逻辑,创新评分模型。


芝麻信用评分打通了淘宝的数据,以及支付宝的金融产品数据,包括花呗、借呗、余额宝等。芝麻信用分的风控模型中,网络消费、网络金融行为,成了一个重要的征信参考维度。


芝麻信用资深数据科学家赵星,曾在2016年中国科技金融FinTech创新大会上,曾经揭秘芝麻信用分的模型——采取“分群评分”,将有相同特征、画像、参数的人,放在一个模型中去分析。比如,有过逾期记录的人,会划分成一个群体。


“同样的交易行为,可能在不同的群体中,具有不同的意义”,赵星举例称,同样是在淘宝上购买了一件奢侈品,如果是一个已入中年的用户,可能是一个“加分项”,证明其财力雄厚。如果是一个刚毕业的大学生,又在多个平台有借贷行为,可能就是一个过度消费的“减分项”。


“我们也一直在挖掘,用户的购买习惯,和信用值之间的联系”,赵星称,比如,喜欢为家庭购置物品的人,比如孩子的尿布、奶粉,家里老人的保健品等,可能会更守信。


实际上,美国也有约5000万成年人没有征信局记录。于是FICO推出了FICO XD产品,通过电信运营商数据、水电煤数据、金融交易数据等判断个人的征信状况,和中国路径相似。


Viktor Mayer在《大数据时代》中提出,在小数据时代,我们总是试图寻找事物间的因果关系,也就是所谓的“线性关系”。随着数据越来越多,因果关系变得不再那么重要,而寻找数据的关联性,探求“是什么”,比知道“为什么”更重要。


美国沃尔玛连锁店通过大数据,发现了一个有趣的现象:尿布和啤酒摆在一起,销量会双双增加了。这是因为,美国的妇女们经常会嘱咐丈夫,下班后为孩子买尿布。而丈夫在买完尿布之后,又会顺手买回自己爱喝的啤酒。


美国的征信机构益百利,可以根据人的信用卡记录,预测个人的收入情况。FICO的首席执行官更是扬言:“我知道你明天会做什么。”Viktor Mayer称,在大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”,了解其中的关联性即可。


而腾讯征信,也试图在社交信息的基础上,寻找其关联性。比如QQ群、QQ好友、说说、相册,甚至QQ音乐,也作为了参考维度。充了“QQ会员”,会不会成为一个加分项?



据称,除了微信支付、QQ钱包等金融产品外,腾讯正在无所不用其极的扩大维度,比如很多银行都在微信上开通了公众号,向用户发送消费数据;微信支付也推出了信用卡还款功能,以此采集更多金融数据。


说白了,其大概的模型是“社交+金融”。


除了蚂蚁金服和腾讯外,拉卡拉“考拉分”、华道征信“猪猪分”等,也都在做一些新的尝试。


因此,征信行业将其称为中国“换道超车”的时代。


3、监管的空档期


尽管是一个超车时代,却是一个极度危险的时代——所有的人都在急速行驶,但却没有交警和红绿灯。实际上,现在是征信行业最特殊的一个阶段,征信专家们将其称为“空档期”。


2015年1月,央行发布《关于做好个人征信业务准备工作的通知》,要求8家市场化机构做好个人征信业务的准备工作。然而近两年过去,牌照迟迟没有发放。



一边是,监管体系还没有建立,一边是大量市场化的乱象,暗流涌动。


很多公司以“大数据公司”的名义,开展“征信业务”。这些都被市场分析人士认为是“行业隐患”,“开展征信业务,又不在监管范围之内,信息安全才难以保障”。


“其实,购买数据的大部分是一些较小的公司,他们目的就是挣点小钱,而大的公司则会相对谨慎,更爱惜自己的羽毛”,业内专家称。


黑市上的数据尽管便宜,但极为“不干净”,极难保证信用评价的公信力。


考拉征信总裁李广雨,曾对媒体透露过考拉征信的数据来源,主要是两个:来自股东拉卡拉的数据,有一亿个人支付数据、数百万小微个体工商户的银行卡收单数据,还有合作伙伴51job有招聘求职数据。除了这些“特色”数据之外,其余来自政府部门的公开数据,合作企业的数据,如电商、电信运营商等。


而京东金融的数据,也类似蚂蚁金服,大部分数据来源京东上的购物、消费、理财、众筹等。


媒体曾报告,芝麻信用分的数据源头,除了淘宝和支付宝的数据,还有三部分:


  • 来自政府合作数据,比如法院、社保、公积金等;

  • 还有一些来自合作的企业,比如一些采用芝麻信用分的消费金融、网贷平台等,其借贷纪录也会反馈回来;

  • 当然,还有一些用户自己提供的数据,比如学历、车辆信息。芝麻信用会在用户授权后从相应的政府部门调取相应数据,进一步核实。


行业的前行者,走得如履薄冰,而急功近利者,却着急牟利。“很多投机取巧的创业者,只是想乘着这个空档期,捞一笔”,一位业内人士指出,这个“空档期”存在的时间过长,将可能给行业带来“毁灭性”伤害。


不止一位业内高管提出自己的担忧,害怕监管层看到了行业乱象之后,采取一刀切的方式,“放弃市场化道路,征信让国有机构来主导”。


“这无疑是在开倒车,让刚具雏形的征信行业,倒退到原点”,一位业内专家提出,现在最好的方式,是像支付行业的管理一样,尽早发牌照,让机构在监管之下,合法合规来做。


参照支付行业的发展历史,牌照的发放,的确在一定程度上,遏制行业的乱象。截止今年年初,央行共吊销了3家公司的支付牌照,对于不合规的公司,直接淘汰,防止行业的恶性竞争,出现“劣币驱逐良币”的现象。


如果黑市上购买数据的公司,成本降低,反而能获取暴利,谁还愿意安心合法采集数据?


“对征信机构的数据,需要进行溯源清查”,该业内专家称,在征信行业,对于数据不合规的公司,进行监管和淘汰,避免黑市上数据的流进征信领域。


而行业自律,恐怕也只能在牌照发放之后才能践行。“没有牌照,没有一个合法身份,大家怎么可能聚在一起成为一个行业?”业内人士称。


站在十字路口的征信行业,正在等待最终的抉择。但这个抉择,也并非全来自监管层的“圣意”。在远见和短视之间,还需要来一场理性与欲望的角斗。


更多深度内容,欢迎关注微信公众号“一本财经”,ID:yibencaijing

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: