扫码打开虎嗅APP
如果只看微信公众号、微博大V、直播红人的造假行为,只能看到简单的操作,比如公众号刷阅读量,刷点赞,直播通过机器或者水军制造假观众。深层次上,我们需要从数据造假黑产业的技术内核出发,回溯产业链的各个环节,才能透过表面看到数据造假给互联网行业带来多大的影响和破坏力。
数据造假不仅发生在网红经济,也肆虐于游戏、电商、互联网金融等领域,每个领域的造假手段略不一样,但是根基相同。
大部分数据造假公司职能无非就是刷公众号阅读、点赞,他们的系统还能模仿人工做出的各种操作,如游戏的登陆注册和各种玩游戏动作。
a公司是一个典型的数据造假公司,他们开发的技术在市面上属于最强之一。
它的作业流程包含技术系统、核心资源和业务系统。其中,业务系统是对接客户的业务需求。
技术系统的核心能力是通过一台手机,模拟出成千上万台看起来真实的手机,然后操作这些模拟的手机执行各种刷单刷量任务。
当你使用一台安卓手机,点击手机里的App, App读取Android操作系统的底层数据,将手机标识数据包括IMEI号、品牌、Wi-Fi等传回App的服务器,告知有一台手机正在激活和使用App,服务器响应并回传应用数据。
这个造假技术系统的做法是,改造Android操作系统,将Android操作系统的数据接口截断,把自己生成的数据接口接入系统,做到IMEI号,SIM卡号,电话号码三码合一。
这些数据参数包括IMEI 、ISI 、Mac地址、区域经纬度坐标、手机串号、安卓ID号、手机号码、品牌、信号、SSID、路由、Wi-Fi、IP。造假技术系统可以自由控制手机唯一标识,使得每一个访问App的操作看起来像是来自一台真实的手机。
在成功改造Android底层系统的基础上,技术系统分为执行单元、数据库模块、应用模块、调度模块。
执行单元:通过一台手机模拟上几十万到上百万台手机,据a公司介绍,利用华为荣耀的一款手机,他们可以模拟出50万台看起来是真人在用的手机。他们在办公室放几百台手机,一百兆光纤,就能模拟出海量的手机协同工作。
数据库模块:通过机器生成或者通过资源获取需要模拟的手机参数,包括IMEI号、Wi-Fi、IP和手机号。
应用模块:操作脚本,指挥上百万台模拟的手机在目标应用上进行操作不同行为,包括登陆、点赞、阅读、打赏。
调度模块:为了对抗大平台的反欺诈系统,模拟手机的操作必需看起来和真实用户的使用行为接近。因此在操作的时间点——几百万台手机在什么时候开机,什么时候登陆,切换到什么应用——需要由调度模块执行。程序员只需要模拟真人使用行为画时间曲线,调度模块即可自动执行。
通过这样的系统,还可以生成大量的微信号,操作微信号来刷阅读量,轻而易举。
前段时间腾讯出手干掉刷量的做法,是通过一个很简单做法。腾讯和三大运营商形成了数据对接,可以看到手机号是否是真实的用户在使用,通过甄别虚假的手机号,很快把刷阅读量打下来。
但是这项打击手段却刺激了华强北这样的手机市场的一项黑业务的增长:通过木马来获取低价老人机的真实电话号码。因此,这涉及我们前面说到的一个数据造假公司的重要部分,即核心资源。在这个场景里,核心资源是真实手机号。
整个移动互联网产业伴随着CP业务成长。在黑产圈子里,CP意味着暗扣(通过木马扣流量、扣费)等暴利做法。但是CP业务被打击严重,已经消停了很多。
微信等新移动平台的兴起,让CP以前积累的木马技术有了新用武之地。
华强北的老板们,将木马装在一两百块钱的老人机的系统底层中,用户看不到。手机卖出去后,操作木马给手机发短信,就能收集到手机号码。通过真实的手机号码来申请微信号,一个微信号可以卖100多块。这样的手机出货量在华强北高达上亿。
据一个华强北老板称,一个月出货量200万台,国内占1/3,其他是国外,比如印度东南亚,也就是刷量生意也开始转向国外。正是因为真实手机申请的微信号那么值钱,所以手机才能卖那么便宜。
这些微信号的刷量,腾讯的机制是没有办法拦截的。因此可以预见,不久之后,公众号刷量会再度火起来。
而这部分微信号除了刷量,还可以干所有真实人做的事情。某些公司搜集这些微信号,加了大量模特女孩为好友,再将这些女孩的账号内容复制出来,造出一大批假的模特女孩微信号,然后不断加陌生人,收取红包。
我们所看到的网红经济中的造假,只是众多造假产业中的冰山一角。
数据造假涉及众多的链条,整个造假产业已经高度工业化,分工精细明确,而且,链条的头部,通向的是水面上的上市公司、互联网圈的各种大佬。
我们以为玩家只有那么一些刷量公司或者华强北老板,那只是表面假象。上述的华强北老板,单纯从生产假微信号,每年的收入能到达到上亿。
造假产业的收入和利润,背后是整个中国经济的各种大玩家。
以电商和金融造假为例。
在数据造假中,跟支付相关的造假尤其有资源难度。通过假账号,类似美女账号,色情视频,最终将用户引到支付,用户支付后发现被骗,就会对平台和支付公司有大量投诉。
在黑产圈中,支付接口的“抗投诉”能力是一个核心能力。而一般的玩家是无法具备这种能力,背后需要大玩家来支撑。
在电商刷单中,有一种做法是通过电视盒子和家用路由器来刷单。它们在安装盒子和路由器的时候,装上木马,从而获取用户的各种电商账号,然后操作这些电商账号,帮助各种电商公司刷单。而要操作这些动作,并不是一般的刷单公司可以做的。
因此,微信公众号数据缩水,对网红经济、造假产业的影响并不大。数据造假产业,是中国互联网经济的影子,折射的是各种玩家在水下的欲望。
在一级市场,VC投资了互联网公司,进入击鼓传花的游戏,VC是“鼓励”数据造假的,这样公司才能更快拿到下一轮钱,一轮轮传送到上市。
在二级市场,大量的传统公司在转型,进行互联网+改造。但是改造何其艰难,有多少互联网公司在倒闭,何况传统的上市公司?因此上市公司参与到数据造假,将造假产生的收入作为“互联网+”并入到公司收入,推动股价。
这些才是数据造假真正的推手。同样,这些力量和欲望也是网红经济的真正推手,所谓网红经济泡沫破裂,是表面的理解。