扫码打开虎嗅APP
本文来自微信公众号:大数据文摘(ID:BigDataDigest),作者:文摘菌,题图来自:视觉中国
最近两天,X(原名Twitter,推特)突然更新了隐私政策,在2.1条例中,X明确写道:
We may use the information we collect and publicly available information to help train our machine learning or artificial intelligence models for the purposes outlined in this policy.
我们可能会使用收集到的信息和公开可用的信息来帮助训练我们的机器学习或人工智能模型。
这意味着一旦在X上发帖创作内容,就意味着同意了马斯克可以将内容拿去喂AI。
除了这一条可拿用户数据免费训练AI模型的条例外,新版隐私政策还提出:将从9月29日开始收集用户的生物识别数据、工作和教育信息。如果用户同意,X会出于安全等目的收集用户的生物识别信息,让账号更加安全。
图注:马斯克发怒,称要起诉微软
要知道,在马斯克前不久还威胁微软,要起诉它用X的数据训练AI。更是在ChatGPT刚上线一个月,就违背了收购推特之前签署的合同,关闭了OpenAI对Twitter“firehose”数据流的访问权限。
马斯克现在是X的实际控制人,其积极拥抱AI的做法和他所宣言的AI威胁论显然格格不入。他曾一度反对AI发展,也曾在《暂停大型人工智能研究》的公开信上签字,并不止一次在公开场合宣扬AI威胁论。
但行动上,却在美国内华达州成立了一家名为X.AI的人工智能(AI)公司,旨在与聊天机器人ChatGPT的开发公司OpenAI展开竞争。
换句话说,尽管视AI为洪水猛兽,马斯克从未停止过对AI方面的投资、研发。当下知名的AI公司OpenAI和DeepMind的融资历程中均有马斯克的足迹。
马斯克人工智能公司的独家Twitter数据
图注:推特隐私条款
X 隐私条款的这一更新最终有利于埃隆·马斯克今年四月推出的人工智能公司X.AI。
虽然X.AI主要致力于利用AI研究宇宙的本质,但马斯克也明确表示,公司将像OpenAI一样,为普通消费者和企业推出AI服务。
这其中包括开发大规模的AI模型,这类模型对数据的质量和数量有很高的要求,理想情况下,这些数据应该是无版权的。
Twitter有能力生成这种高质量的数据,并可能独家提供给X.AI使用。值得一提的是,Meta公司也通过其社交媒体平台提供数据,用于训练自家的AI模型。
自从埃隆·马斯克接手Twitter后,他一方面致力于防止数据被轻易地从平台上流出,另一方面也在改善平台上数据的质量。
比如说,他已经取消了对Twitter API的免费使用权限,转而推出了多种收费套餐,其价格从每月100美元至5000美元不等,而针对企业用户的套餐起价更是高达每月42,000美元。
马斯克还为那些愿意付费并专门在Twitter平台上发布内容的高影响力用户提供奖励,这些通常不包括是机器人账户。为了获取更多的曝光度,这些用户可能会减少引用开放网络的链接或其他来源。
图注:马斯克说只拿公开数据训练
同时,马斯克也激励优秀的内容创作者,方式是与他们分享由其内容所带来的广告收益。比如,他向记者承诺,如果他们直接在Twitter上发布文章,将会拥有更多的写作自由和更高的收入。
对此,有外国网友评论:
“他真实的意图是,请在X平台上发布独家内容,为我们的模型训练提供素材!”
But what he is really saying is, "Come and publish interesting information exclusively on X so that we can use it for our subsidiary companies and train our models on it!".
X/Twitter还会怎样做?
X(推特)自身并没有公开展示AI方面的野心,但其老板埃隆·马斯克却有。X.AI的公司号称探寻宇宙的真实本质,而恰好用户的生物识别数据和其他相关信息适用于支持这一高远的目标。
X.AI的主页也明确提到,它将与X进行密切合作,共同推进其宏伟任务。
其实,马斯克还有其他计划。他近期宣布,将推出一个与LinkedIn竞争的平台。他形容LinkedIn为“令人尴尬”,而X的版本则会很“酷”。这解释了为什么X会开始收集用户的工作和教育信息。此外,一些经认证的组织已经开始在平台上发布职位信息,而X也计划进一步开放这一功能。马斯克早在5月就暗示过这一点,并随后收购了一家求职匹配的科技公司Laski。
据悉,这些用户的数据除了用于推荐职位,收集的这些个人信息也可能用于精准广告推送。
还有一种可能是X会出售用户数据以获取收入。尽管目前没有明确证据表明这一点,但在社交媒体行业,这算是一种常见的做法。值得注意的是,在过去,Twitter主要是使用收集的用户数据来提升自身的服务质量,而并没有将数据用于第三方。
起底X.AI:最强华人天团
人工智能公司x.AI是7月12号成立的。
公司官网显示,x.AI团队由马斯克领导,成员来自DeepMind、OpenAI、Google Research、Microsoft Research、特斯拉以及多伦多大学。
目前官网显示创始团队成员目前共有 12 个人,以及一位顾问 Dan Hendrycks。
这些关键团队成员已经在人工智能研究和开发的最前沿做出了突出贡献。例如,Jimmy Ba是多伦多大学的助理教授,曾师从著名的人工智能先驱Geoffrey Hinton,后者在辞职前一直领导着谷歌的人工智能计划。ChristianSzegedy作为谷歌的研究科学家,多年来一直从事人工智能核心项目的研究工作。
而在这 12 位创始团队成员中,有 5 位是华人。Greg Yang(杨格)是 X.AI 的联合创始人,其大学时期的导师是丘成桐教授,之前是微软研究院的数学家和人工智能研究员。2018 年还曾获得本科生数学领域最高荣誉 Morgan Prize。
Yuhuai(Tony)Wu之前分别在OpenAI 和 DeepMind 都待过,在多伦多大学完成了博士学位,后在斯坦福大学完成了博士后工作。
张国栋(Guodong Zhang)是一名机器学习和人工智能领域的研究员,之前在微软亚洲研究院、Google Brain 和 Google DeepMind 都工作过。本科读的是浙江大学的信息工程专业,硕士和博士都在多伦多大学。本科阶段连续 3 年在 182 个人中排名第一,GPA 按照 100 分算是 92.7,按 4 分算是 3.96,曾获得中国大学生数学建模竞赛一等奖。
戴子航(Zihang Dai)工作经历之前分别在网易投资部、百度深度学习研究院、百度美国以及Google,最近的工作和 Yuhuai(Tony)Wu 一样,都在 Google 的 RS 团队。
Jimmy Ba是多伦多大学计算机科学助理教授, 2015年发表神·论文《Adam: A Method for Stochastic Optimization》,其博士毕业于多伦多大学,师从 Geoffrey Hinton、Brendan Frey 和 Ruslan Salakhutdinov。他的长期研究目标是构建具有类似人类效率和适应性的通用问题解决机器,其研究兴趣集中于深度神经网络的高效学习算法的开发。
显然,有最强脑力加持,加上推特天然的数据优势:“推特上有大量多模态数据,包括对话文本、图像和不断增长的长视频。”X.AI 真的能够打造出 AI 护城河,培育出无与伦比的 AI 竞争优势。
目前,X.AI除了和推特合作外,马斯克称x.AI将会与特斯拉在芯片方面合作,也许在AI软件方面也会合作,总之对特斯拉加快自动驾驶能力的发展将有互利作用。
参考来源:
https://the-decoder.com/elon-musks-xai-could-train-ai-models-on-your-twitter-data/
https://www.theverge.com/2023/7/12/23792553/elon-musk-xai-artificial-intelligence-company
https://stackdiary.com/x-can-now-use-posts-for-ai-training-as-per-terms-of-service/
https://twitter.com/DrJimFan/status/1679180398134448132
https://mp.weixin.qq.com/s/jJtRMPPvOo7D6Tj5ImtsdQ
https://mp.weixin.qq.com/s/5yKA2XbNDtzauF0L_yvnEw
本文来自微信公众号:大数据文摘(ID:BigDataDigest),作者:文摘菌