让郭德纲说英文段子的AI服务，在国内落地有多难？-虎嗅网

本文作者：游云庭（上海大邦律师事务所高级合伙人、知识产权律师），头图来自：视觉中国

文章摘要

本文讨论了HeyGen的人工智能服务在国内落地所需的手续和挑战。HeyGen提供的翻译服务属于深度合成技术，需要遵守相关法规和管理规定。此外，HeyGen的服务涉及个人敏感信息的出境问题，需要进行数据出境安全评估。文章还提到了HeyGen在知识产权侵权风险方面的问题。

• HeyGen的人工智能服务需要进行安全评估和算法备案

• HeyGen的服务涉及个人敏感信息的出境，需要履行相关合规义务

• HeyGen在知识产权侵权风险方面需要注意授权问题

近期网上出现了很多名人说外语的视频，比如郭德纲、赵本山说英文段子，霉霉、特朗普说中文，这背后其实一个叫HeyGen的人工智能服务在支持。笔者登录了HeyGen的网站，发现其并不向国内用户开放，服务付费渠道里没有微信和支付宝，而实际上HeyGen的创始人是两位华人，都毕业于同济大学。今天就来研究一下，HeyGen的人工智能服务如果要在国内落地，需要办理哪些手续？

HeyGen的翻译服务过程，根据笔者的实测过程如下：用户需要登录HeyGen网站，上传一段长度在30秒以上的包含人声的视频，然后HeyGen会翻译视频中的声音内容，并生成一段视频中的说话者说翻译后语言的视频。这个神奇的地方在于，生成的视频用的是原视频中说话者的嗓音，并且口型也和发音匹配。

原来，HeyGen的服务至少接入了其他三个人工智能引擎^[i]， ChatGPT-4负责翻译视频里的语音、然后用11labs的语音克隆提取的视频中说话者的嗓音特征，在新生成的视频中让说话者说出来，而wav2lip-2会对生成的新视频的人的唇部做口型同步。

一、HeyGen提供的服务属于深度合成服务

根据我国法规，HeyGen应属于深度合成技术，应受到监管。《互联网信息服务深度合成管理规定》的规定，深度合成技术，是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术。

ChatGPT-4的翻译视频里的语音，属于生成或者编辑文本内容的技术；11labs的语音克隆提取的视频中说话者的嗓音特征，属于生成或者编辑语音内容的技术；wav2lip-2对生成的新视频的人的唇部做口型同步，属于生成或者编辑图像、视频内容中生物特征的技术。均属于《互联网信息服务深度合成管理规定》规定的业务场景。深度合成服务提供者有很多义务，具体包括：

1. 常规的合规义务

如不得危害国家安全、社会公共利益、不得侵害他人合法权益；不得制作、传播虚假新闻；建立健全用户注册、算法机制机理审核、科技伦理审查、信息发布审核、数据安全、个人信息保护、反电信网络诈骗、应急处置等管理制度；具有安全可控的技术保障措施规定等。

2. 人工智能服务义务

提供人脸、人声等生物识别信息编辑功能的，应当提示深度合成服务使用者依法告知被编辑的个人，并取得其单独同意；服务生成或者编辑的信息内容，应当添加标识等。

3. 备案和评估手续

HeyGen如果在国内提供服务，要不要做备案和安全评估？2023年4月的《生成式人工智能服务管理办法（征求意见稿）》规定：利用生成式人工智能产品向公众提供服务前，应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。据此，HeyGen以及其接入的ChatGPT-4、11labs、wav2lip-2均应该做安全评估和算法备案。

但2023年7月发布的《生成式人工智能服务管理暂行办法》把这条改了：提供具有舆论属性或者社会动员能力的生成式人工智能服务的，应当按照国家有关规定开展安全评估，并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。也就是说，只有具有舆论属性或者社会动员能力的生成式人工智能服务才需要做安全评估和算法备案。

但就笔者了解的实践情况，在国内提供服务的文心一言等类似ChatGPT的产品都是需要安全评估和算法备案的，国内以API方式接入ChatGPT的产品基本都被叫停了，可能就是因为其没有做安全评估和算法备案。所以，接入ChatGPT的HeyGen服务如果服务要落地，也需要做安全评估和算法备案。

我国政府对互联网进行的监管比较严格，如果在中国境内向公众提供应用深度合成技术的，要遵守的国内其他法律法规还包括《中华人民共和国网络安全法》《互联网信息服务管理办法》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》等。

二、HeyGen提供的服务涉及个人敏感信息的出境

个人信息的数据出境分为两种情况，一种是数据处理者将境内的数据传输、储存在中国境外；另一种是，数据处理者将境内的数据存储在境外，但是境外的机构、组织或者个人可以访问或调用，但必须屏蔽身份信息。如果要向国内用户提供服务，HeyGen的服务器可以架设在国内，并限制身份信息的出境，这可以解决一部分数据出境问题。

但HeyGen的服务需要使用者上传视频，视频中直接包含可以识别身份的用户的肖像和声音，wav2lip-2、11labs会对人的肖像和语音进行分析，都会提取人的特征文件，如声纹、面部特征和唇形，这些都是生物识别特征，属于敏感个人信息。HeyGen如果拟将从中国国内取得的敏感个人信息传输至境外的，也应当进行数据出境安全评估，并在申报材料中列明敏感个人信息的数量与字段。因为其服务是面向公众的，一旦提供，一定会达到敏感个人信息超过1万人次的监管触发点。

所以哪怕HeyGen的服务器在国内，如果支撑其服务的ChatGPT、wav2lip-2、11labs的服务器都在国外的，其还是要履行敏感个人信息出境的合规义务。同时，ChatGPT的服务目前仍屏蔽中国地区的IP访问，微软必应搜索引擎在海外嵌入了ChatGPT的人工智能服务，但国内也无法使用其人工智能部分。HeyGen即便想给中国用户提供服务，ChatGPT的开发者OpenAI公司也未必会同意。从以上分析看，就目前的政策和法律环境HeyGen想要在国内落地服务，合规方面的挑战还是不小的。

最后说一下人身权和知识产权的侵权风险问题，由于HeyGen提供的是面向用户的一对一视频翻译转换服务，网站并不会向公众发布转换后的内容，所以HeyGen的知识产权的侵权风险较小。但用户如果用HeyGen将他人的讲话视频生成了翻译后的内容发布到网上，就需要取得很多授权。

比如你传了郭德纲的相声视频，就需要取得郭德纲的肖像权、声音权的授权、相声视频的录像制作者权和相声文字内容版权授权，缺少任何一个都可能涉嫌侵权，大家有兴趣的，也可以参考本人之前写的《“AI孙燕姿”有哪些知识产权和法律问题？》一文，那里面的论述比较详细。当然，郭德纲是公众人物，这种无伤大雅的传播其可能未必会维权，但如果其想维权的，发布视频者打官司肯定会输。

参考文献：[i] https://www.techopedia.com/definition/heygen

本文作者：游云庭（上海大邦律师事务所高级合伙人、知识产权律师）。电话：8621-52134900，Email: yytbest@gmail.com，本文仅代表作者观点。

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

让郭德纲说英文段子的AI服务，在国内落地有多难？

最新评论

大 家 都 在 看

大 家 都 在 搜

大家都在看

大家都在搜