正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2018-12-18 20:26

MIT研究组:别瞧不起僵尸粉,它们真能左右舆论

本文来自微信公众号:集智俱乐部(ID:swarma_org),作者:刘培源。


社交网络上的信息非常容易传播,这也给了不怀好意之人可乘之机。那些看似无关紧要的僵尸粉,可能就是某些人用来影响舆论的工具。


近日,来自麻省理工学院的团队发表了一项研究,通过分析 Twitter 上的机器人在舆论事件中的表现,证实了社交网络机器人可以对社交网络舆论产生很大的影响,不到用户总数1%的活跃机器人,就可能左右整个舆论风向!(论文:The Impact of Bots on Opinions in Social Networks


改变整个选情,仅需少数机器人?


2016年的美国大选,除了明面上的造势,在社交网络上也是暗流涌动,至今关于“有人恶意操控美国大选”的说法仍然不断。到底有没有人操控呢?MIT 的研究表明,至少有人利用机器人账号,试图影响双方在Twitter 上的支持度。



这是 Twitter 上讨论2016年第二次美国总统竞选辩论的用户网络可视化。节点大小与网络中观点追随者的数量成正比,节点颜色表示观点的价值取向,红色节点是支持唐纳德·特朗普的,蓝色节点是支持希拉里·克林顿的。我们可以看到,在这次辩论期间,双方在舆论上还是僵持状态。


研究者使用卷积神经网络和词嵌入技术,训练出了支持阵营分类模型,可以根据推文内容,给出用户观念的概率分布(支持希拉里还是特朗普)。在总的数据集77563个用户样本中,发现有非顽固用户有69861个,顽固用户有7702个,而这里面可能潜藏着许多僵尸粉。


揪出僵尸粉!


机器人账户都是自动发帖,内容不大会受到社交网络的影响,它们是顽固的,观点一般不会变。研究者只考虑机器人对其他用户观点的影响。所以首先要做的,就是识别出哪些用户实际上是机器人。



机器人、僵尸粉最大的特点是什么?是没人跟他互动。


研究者使用了MIT 研究者 Mesnards 和 Zaman (2018) 的算法,来识别机器人。这种算法能找出那些经常转发其他人推文、但很少被其他人@的账号。该算法与其他算法相比,精度更高,需要的数据量更少。(Zaman 算法的相关论文


机器人检测算法,会判断某用户是机器人的概率,但实际操作中研究者发现,该算法把几个经常转发但不常被@的真实用户也当做了机器人。所以研究者对有实名认证的 Twitter 用户做了筛查,把他们都归为真实用户。


最终,研究者确定了396个 Twitter 机器人,其中260个支持特朗普(红色),136个支持希拉里(蓝色)。这些机器人不到数据集用户量的0.5%。


以0.5为界,左侧支持希拉里,右侧支持特朗普


网络舆论模型:我们都受到偏执狂的影响


不论是真实的推特用户还是推特机器人,它们的三个基本操作是,关注、转发和评论(类似微博)。通过跟踪这些互动,研究者可以有效量化 Twitter 账号的行为。


直觉上,那些不太关注别人的用户,也不太可能关注你。而且社交圈子重叠很重要,如果 A 和 B 是好友,那么关注 A 的用户就有较大概率关注 B。虽然人们在收到新信息时会更新他们的观点,但这个过程会随着时间的推移而减弱,他们的观点会逐渐变得顽固。Zaman 认为,如果你已经掌握了很多信息,你就越来越难听从别人的观点,新说法不会改变你的看法。


该研究团队基于过往研究,给出了网络舆论模型的核心假设:


  1. 社交网络中的个人是基于其朋友推文中的观点,来更新自身的观点;


  2. 网络中某些用户的观点是顽固的,其观点不会轻易改变,而且顽固用户会推动其他用户(摇摆不定的中间派)改变观点。


根据观点的取向、强弱,把用户 i 的观点 θi 的范围设定在0~1的区间内,0表示绝对支持希拉里,1表示绝对支持特朗普。当用户的推文频率是 λ 时,网络舆论模型中,对于非顽固用户而言,其观点服从平衡方程:  

可以借助电路来理解这个公式,电路的总电压,等于各个并联电路的电压之和。一个用户的观点,等于他好友观点的之和。如果 i 的好友中有至少一个顽固用户,那这个方程就有唯一的解——最终决定非顽固用户观点的,其实是他好友里面的顽固派!


为了研究如何用网络模型来预测社交网络上的观点变化,该小组研究了用户推文观点和他所处社交网络的平均观点之间,有怎样的相关性。对于非顽固用户而言,其所处社交网络的平均观点(纵坐标)都集中在 0.4~0.5 区间及附近。



这意味着,顽固的推特机器人,有可能把用户观点拉向某个极端,因此可以用网络舆论模型,来研究机器人如何改变用户所在社交网络的平均观点。

初步实验:僵尸粉竟然能扭转乾坤!

为了验证这个网络舆论模型,研究者对2016年第二次选前辩论在 Twitter 上的讨论数据做分析。


x

研究者计算了四种情况下的网络舆情:没有机器人,只有支持特朗普的机器人,只有支持希拉里的机器人,以及所有机器人。由此得到了上面的观点累积分布图。


特征很明显,剔除机器人时,整体舆论是0.58,偏向希拉里;特朗普机器人将舆论使0.58转变了0.18,到0.76,而希拉里机器人将舆论使0.58转变了0.32,到了0.26。显然,支持希拉里的机器人对舆论的影响更明显!


为什么希拉里机器人数量比特朗普的少,但效果却强于特朗普的呢?


研究者做出两种可能的假设:


  1. 首先是希拉里机器人有更多的粉丝,它们接触的 Twitter 用户更多;


  2. 其次是希拉里机器人,推文频率更高。


毕竟按照网络舆论模型,非顽固用户比较容易受到那些高频发帖、粉丝众多的用户的影响。


进一步验证:剔除僵尸粉的影响会怎样?


为了验证上述假设的正误,首先统计了社交网络上,机器人和真人的关注数和被关注数。发现希拉里和特朗普的机器人的主要关注者,并非机器人,而是真实用户!而且它们的分布没有显著差异。这就排除了第一种假设——“希拉里机器人粉丝更多”。



研究者又考虑推文率,即在该时间段的数据集中的推文数量。可以观察到,机器人平均发帖数量超过人两个数量级以上,并且克林顿的机器人发帖频率明显高过特朗普的。而希拉里和特朗普的真实支持者,推文率几乎一致。



为了消除发帖次数引起的偏差,研究者以相同的推文率,重新计算了网络舆论情况。发现当推文率和真实的人相同时,机器人改变舆论的能力大大降低:



所以就得出结论,希拉里机器人比特朗普机器人数量更少,效果更好的原因,是其推文更多。这也进一步验证了网络舆论模型的有效性。  


社交媒体机器人,也许是潜在的炸弹



如果没有这些活跃的机器人,这次辩论后 Twitter 上特朗普的支持度可能会下降0.18,希拉里的支持度可能会下降0.32。 


麻省理工学院研究组的这项工作,最大的发现是,影响社交网络舆论所需要的机器人,其实是很少的。少数活跃的机器人,可以对网络舆论产生重大影响。


虽然社交媒体机器人不会带来物理威胁,但它们却可能有力影响到网络舆论。在微博里,各类水军已经经常出现在营销造势、危机公关中。虽然你能一眼识别出谁是水军,但仍然可能不知不觉地被他们影响。


这些机器人看似僵尸,发起声来,比人类响亮得多,可能只要几十个几百个就足够扭转舆论!


参考资料:

http://mitsloan.mit.edu/newsroom/articles/how-do-online-bots-shift-opinions/


本文来自微信公众号:集智俱乐部(ID:swarma_org),作者:刘培源。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

别打CALL,打钱

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: