扫码打开虎嗅APP
本文来自微信公众号:运营研究社(ID:U_quan),作者:套路编辑部,头图来自:视觉中国
前段时间,我们写了篇爆文,然后就发现,怎么回事?别人居然洗了我们的稿子,还标了原创!
我就纳闷了,微信不是早就加强了原创保护机制了吗?为什么这些人还这么猖狂呢?
一气之下,套路编辑部决定“亲自下海”,去看看洗稿到底是咋回事!
根据网上的资料,我加入了几个洗稿群。说实话,我挺意外的,他们居然明目张胆地用“洗稿”、“伪原创”这些字眼作为群名称。这也从侧面说明,其实很多人对于“洗稿”已经见怪不怪了。
不过,在这之中,伪原创群里的一则“改写医疗问答”的兼职引起了我的注意。
医疗问答也能伪原创?这可是关乎健康的大事啊!出于一个媒体人的“正义感”(嗯!),我决定深挖一下这里面是怎么回事!
医疗网站的问答居然也是洗稿的?
在我联系了发兼职的那个人后,他给我发了一个登陆账号和“问答标准”(相当于SOP)。想要成为“洗稿”兼职,还得先试稿(也是很严格了 )。
再看看这个“问答审核标准”,我觉得有点奇怪。
第一,需要修改医生回答的内容,并且修改率要达到 30%。如果只是修改自己平台不符合规范的内容,为什么连医生的回答也要修改呢?难道,兼职能比医生更专业吗?
第二,需要修改问题描述,包括患者信息。如果是对不符合“提问规范”的问题进行修改,为什么要规定“必须要修改原数据(即患者信息)”呢?
为了测验一下,我还是根据这个“审核标准”,找了一个“怎么治疗中暑?”的问题进行修改。
根据“对原数据进行修改”的要求,我把“室友”的身份修改为“男朋友”,再把一些语句调整了一下。
再根据平台要求的在医生回答部分“对原数据的内容修改需要达到 30%”,我在百度找了一些治疗中暑的方法又补充了一下。
结果,我修改的问答就这样审核通过了。
可是经过我的修改,现在的患者信息已经不是原来的患者信息了,医生回答也不完全是专业医生给出的回答,而是我这个兼职。
看到这里,其实已经可以看出“洗稿”的端倪了。看起来好像是修改平台内部“不符合内容规范”的问答,但实际上更像是在把“别的医生和患者”的问答进行二次加工。
当然,在法制社会,咱们讲话还是要讲证据的。于是,我找了几条问答在网上一搜,果然让我找到了“原稿”。
比如,我前面修改的这个关于“中暑”的问题,我就在其他平台看到一模一样的患者和医生回答。
原网站问答
再比如“你好我想咨询下我的是痔疮吗?”这个问题,其实就是直接把“39问医生”网站上的问题和医生回答搬运过来,然后进行修改。
39问医生的原问答
知了平台的“待修改”问答
还有,这个关于“耳鸣”的问题,不管是患者的年龄、症状,还是医生的回答,完全一模一样。
39问医生的原问答
知了平台的“待修改”问答
到这里,我们可以合理推测,这个平台的问答其实是通过爬取其他平台的问答,然后再进行二次加工的,也就是“洗稿”。
作为一个平时有点小病小痛都会上百度查一查的人,终于恍然大悟,难怪平时在有些网站上看到的一些医疗问答,总觉得有些雷同。且不说本身“洗稿”就是一种可耻的行为,让兼职对医生的专业问答进行修改,这真的靠谱吗?
说回这个“洗稿”事件,其实这个洗稿流程很简单,甚至相比起软件洗稿来说,都显得有些不够智能和高效。不过,在体验过程中,我始终有一个疑惑。这个所谓的“审核问答”是不是官方默许的行为呢?
因为在这个网址的首页,有这样一段公告,看起来像是官方给出的通知,而且域名也很官方。但是,作为一个讲证据的孩子,没有实锤咱也不敢说啊,万一是平台的作者为了什么不良目的搞出来的平台呢?
为了搞清楚这回事情,我便继续深度探究了一下。结果我在百度一搜索,发现这个平台一直在招聘。
这个医疗平台的首页,也在发布招聘信息(但就不明确地跟你说招聘的是啥)。顺着首页的招聘信息,我把两个官方工作人员的微信都给加了。
官网招聘Banner
官网招聘信息
其中一个小姐姐很热情地回复了我,她告诉我如果是个人的话,就只能参与兼职,还美其名曰是“审核问答帖子”......
再看看她给我发过来的“审核标准”,跟之前那个人给我发的其实一模一样。
难道,之前在 QQ 群招兼职的就是官方的工作人员?
在我正疑惑的时候,另一个工作人员也通过我的微信好友请求了。这位大哥直接给我甩了两个文档,一个是前面就看过的审核标准,另一个则是名为“开通代理流程”的文档。
代理??
看了这个文档之后,我发现,原来我在不知不觉中成为了别人的“子账号"。
开通代理账号流程
也就是说,这个所谓的“审核兼职”就是这样的。官方会招募两种人,一种是兼职、一种是代理。兼职和代理干的事情都一样,就是“审核问答”,只不过代理还可以自己发布兼职,一方面帮官方招人,另一方面也给自己赚分成。
在我发现这个医疗平台的内容居然是“洗稿”的时候,其实不是特别意外,有时候有点小病小痛去百度的时候,就会发现很多“在线问诊”平台的答案都很雷同。
这让我想到了去年因为“洗稿之嫌“被推上风口浪尖的马蜂窝。根据当时曝光该事件的乎睿数据的报告,马蜂窝平台有 85% 的内容是从携程、艺龙、美团、Agoda 等平台上“搬运”的。
除此之外,还有很多内容平台也被爆料过“洗稿”其他平台的内容。
不管这些内容是平台“爬虫”所为,还是依赖平台所生的灰产,不可否认的是,很多网站、App 前期为了有足够的内容数据,可能就会以“爬虫”或者“人工伪原创”等方式来生产内容。
这不是个例,更像是一个行业的潜规则。
除了平台雇佣,还有人靠洗稿薅羊毛?
除了“医疗问答们”的洗稿之外,其实在这些洗稿群,我看到的更多的洗稿是头条号、大鱼号、百家号等内容平台的洗稿。
记得在前几个月前,公众号三表龙门阵就发表了一篇文章《河南女孩露露给我上了一堂七万的课》,讲的就是他的企鹅号被盗用且改名为“娱乐与露露”,在平台发表大量的娱乐文章。
仅仅 60 天,露露赚了70000+。
图源:三表龙门阵
类似的被盗账号还有不少,比如我们运营研究社就被改成了娱乐号“闵敏与娱乐”,而且每天都会发 5 篇原创。
其实,这些所谓的“露露”、“闵敏”就是“养号集团”的赚钱工具。
早在 2017 年,腾讯就计划拿出 100 亿补贴企鹅号上的优秀作者,其他各大平台也不甘示弱,纷纷投放巨额补贴吸引内容生产者入驻平台,让他们为平台持续产出内容。
内容这块肥肉随之被众多谋利者盯上,他们成立起“养号集团”,在这些内容平台上发布大量的所谓“爆文”,以此薅平台的内容补贴。
之前我一直很疑惑,为什么这些“养号集团”的产稿速度能够如此之快,有人说是“洗稿软件”的功劳。
那为什么软件洗出来的稿能够躲得过平台的审核?并且大行其道这么久呢?
为了搞清楚这些问题,我只好(昧着良心)亲自体验一遍洗稿流程。
市面上的洗稿软件不计其数,有付费版的,有人戏称“299元智能AI洗稿机器人抱回家”;还有免费的,比如“小***网站”,我在上面输入一篇 3 千字的文章,只消 38.088 秒,一篇“洗”过的新文就出炉了。
不过机器目前还不像人“聪明”,洗出来的文章看着有点“傻”。机洗不灵的时候,还需要人工手洗。
为了了解手洗行情,我加了个洗稿群,打听得知,三千字以上的文章,算上改标题,50块钱可以洗一篇,对方承诺将文章重复率降到 10% 以下,还可以免费提供试洗一篇。
洗稿群里的这位老板补充说,他们团队有 30 多人,都是兼职的大学生,整个团队一天可以洗20多篇三千字的文章。其实就是一个“养号”小作坊。
经过一番探索,我终于找到了一个很牛批的软件,并加入了官方下载购买的 QQ 群。据说这个软件很多洗稿的人都在用。
不过,这个牛批的软件我试了好几次都下载不了,果然是没有“洗稿”的命吧?!
为了搞清楚这个软件是怎么用的,我只好把 QQ 群里的教程扒出来看了一遍。不看不知道,一看......这个软件确实“智能”。
从软件的首页可以看出它有 6 大功能,分别是“素材采集”、“标题采集”、“热点中心”、“文字审核”、“大神写书”和“文章检测”。这完全就是“洗稿一条龙”服务啊,把收集素材、洗稿和降重都给包了。
前面提到的“露露们”,果然都不是什么编辑,其实就是这种软件的“影子替身”罢了。
人家的“素材采集”功能也是很“强大”,只要输入你想写的选题“关键词”就可以找到很多相关的文章。在热点中心还可以找到实时热点,根据热点找到素材。我们编辑口中常说的“常规选题”和“热点选题”它一个软件全包了......
素材收集
热点中心
找到素材之后,就可以开始“洗稿”了。“洗稿”界面跟我们前面看到的医疗平台很像,左边是一篇“参考文章”(其实就是待洗稿文章),右边则是软件洗稿洗出来的效果。
在页面的右下角可以看到有很多文章类型的选择,像“娱乐故事类”,其实就是这些“养号公司”很喜欢写(洗)的文章。
洗稿完成之后,下一步就是进行“文章检测”了。整个文章检测的过程其实很像论文的“降重”,这个软件会进行全网搜索,当洗完的文章原创指数达标之后,软件就会提醒可以发布。
这个网站还很“贴心”地提供了“如何避开平台的审核机制”的小 Tips,并美其名曰“精修”。比如发布在百家号需要在头尾加入自己的观点,比如大鱼号和趣头条只要修改通顺就可以发。
看完整个洗稿流程,我算是明白了。如果是这样洗稿的话,像“露露们”一样一天生产 5 篇文章,完全不是问题......
之前在一篇文章的留言区看到有人说,她在应聘的时候,公司问她能不能一天写 10 篇稿子,言下之意就是要让她洗稿。当她表示自己想做原创的时候,面试官居然说“原创不如洗稿来得爆”。
这里真的想引用三表老师的一句话:
“平台不会无休止地补贴,依附黑产以为能天长地久,足够有远见吗?”
等哪一天这些平台没有了补贴,那些已经被“洗稿”蛀空的“养号公司”必将轰然倒下。
结语
深入了解完这些花式洗稿大法,我真的惊了。尤其万万没想到医疗网站里的问答内容都是洗出来的,不禁担心,这让我们“百度看病”的老父母们可怎么办呐?!
他们把网站当医生,殊不知看到的答案竟是洗出来的无脑“废话”。
还有那些薅内容补贴的羊毛党,简直就是批量制造文字垃圾的补贴收割机。
在写这篇文章的过程中,我常常有一种“气不打一处来”的感觉。尽管我们如此用力地抨击洗稿产业,但不得不承认,“洗稿”早就成为行业的潜规则,“洗稿产业”也成了无法根除的毒瘤。
利益驱动下,也许洗稿者一时半会儿根本不会收手,但我们还是希望,大家能够一起抵制洗稿,保护原创!
本文来自微信公众号:运营研究社(ID:U_quan),作者:套路编辑部,头图来自:视觉中国