AIGC之后，让我们实现镜头自由-虎嗅网

本文来自微信公众号：糖总总（ID：clairetangmedia），作者：糖总总，头图来自：作者供图

一

大家最近好吗？

我最近有一些心得，也特地来问候问候。

离上次汇报牛津读书脱层皮的经历竟然又有一年多了，我果然是你萌所说的年更作者。

我大部分时间都在伦敦东城区猫着，工作和学习，一边适应新地方、新行业、新文化，同时一边思考三十而立的生活。

简单而言，对这个问题实话说我还没啥答案。

哪里都有好，哪里都有不好，一万句省略后，就说句，我还真挺想家的。

主要是我的中国胃作怪也？

吃其他的都觉得缺点啥。不过最近我感觉好多同胞来伦敦，中国超市开的更多了，超市里的乡音也很多。

工作时，最近也很容易碰到中国人，特别是AI和技术相关的这块。每次一对接发现对方可以讲普通话，就觉得好开心。

二

之前文章里提过，我目前在的公司是做 AI 内容生成的，也就是 AIGC （AI Generated Content）。

过去一年 AIGC 这块发生的巨大变化更不用我来叙述，我只是想表达，之前有关科技浪潮的文章里提过的一个关于技术奇点（Singularity）来临的观点：

未来学家雷蒙德·库茨魏尔（Ray Kurzweil）把这种人类科技进步的加速发展称作加速回报定律（Law of Accelerating Returns）。

他认为整个 20 世纪 100 年的进步，按照 2000 年的速度只要 20 年就能达成 —— 2000 年的发展速度是 20 世纪平均发展速度的 5 倍。2014 年开始，只要花 7 年（2021年），就能达到又一个 20 世纪一百年的进步。

他提过，那 2030 年的世界可能就能把我们吓一大跳，2050 年的世界会变得面目全非。

还记得我之前提过的这个曲线吗？那个转折点就是奇点所在。

我真的觉得，我们目前站在这个点上。

像互联网先驱 Tim OReilly 说的那样，技术变革都是这样按照“逐渐地，然后突然地”趋势的浪潮发展的。

关键是自己要做点什么，可以有意义地参与。

三

不过，千万别觉得我在伦敦找工作的时候，脑子里有带着这些宏大牛B的理论，事实上完全没有。

我只是给自己定了几点原则：

1. 尽量找好的人一起工作。创始人和创始团队的素质和人品，决定了团队能力能不能更好发挥，大家是否能同甘共苦。

特别是共苦这点。最好的小伙伴和导师都是创业时候，或者因为创业相关的原因认识的。

我们互相见过最艰难时刻最差的一面，竟然还是朋友，真不容易。

2. 尽量和内容变革相关。从传统媒体 Media 到 PGC（Professional Generated Content），再到 UGC （User Generated Content），读我公众号时间长的同学可能记得，我就是对内容感兴趣。

一直在试图搞明白，互联网传播方式的巨大变革，对内容生成带来的社会影响（可以看公众号内目录：糖总总的媒体课）。我在牛津做的研究生课题也是Z世代的视频内容生成。

多一句嘴，我强调变革，是因为光从内容生产本身可能会容易一叶障目。因为直到 AIGC 之前，内容生产的成本都非常高（文章后面有专门讲），如果简单去比如做一个新媒体的小编，十有八九时间会被大量的成产过程占据，而不够时间去研究新的图景。

我比较关注变化向的东西。做事要抓关键，做四两拨千斤的事情。

我想起来笑来老师其实之前经常讲，不要被特定媒体的形态绑住。不要陷在更高效地手工给村庄取水，要思考怎么先自动化搭建水渠。即使，刚开始的时候，手工的方法见效更快。你要稳得住。

这也一直是我为什么近几年不执着于更新内容的原因，因为太占精力了，还有很多东西需要学。

当然，这也给自己年更这个状态，找个冠冕堂皇借口，不要介意。

3. 尽量和内容生成的新技术相关。我入职我现在公司的时候，牛津的互联网中心是学校里讨论 AI 对社会影响最前沿的地方了，但当时讨论 AI，也大多数是在 AI 的道德层面和数据保护层面。

AI 在当时还没有变成内容生成的杠杆。

在牛津的时候我参与了一个 Entrepreneural Program，当时有很多 start-up 在这个创业中心孵化。

我选了一个离内容生成最近的，也就是现在的公司。刚开始我们是在做 3D 生成的 Nerf 技术，帮助大家产生镜像一般的虚拟现实内容。

随着 AIGC 相关研究的井喷，我们结合 AI 生成视频和 3D，在内部的 Creative Lab 孵化了一系列技术。

我当时并没有想到 AIGC 会变成一个专有名词，然后突然 AI 生成内容的奇点来临：按照内容的视觉化难度层级来看，大家看到文字和图片的 AIGC 内容只是前奏 - 视频、游戏、3D 都会继续按照奇点的速度发展。

我记得年初，有一天在家里高兴地鼓掌：一直研究的 Media-PGC-UGC-AIGC 这条脉络竟然连起来了。

四

讲述 AIGC 的意义之前，我们先来说说镜头这个概念，因为极大可以帮助理解。

媒体出身的我，某种意义上我一直是不喜欢镜头的。

这不仅仅是，我自己觉得自己不上相的原因。

Camera 是人类的一个伟大发明。从小孔成像实验到现代电影的发展，镜头背后也叠加了几个世纪的技术buff。

我所谓的不喜欢，是从社会学的意义上来说的。镜头是记录和反映现实的一种强有力媒介。

观察现实的视角，就是镜头在塑造的。

大众媒介的变化，核心就是镜头塑造权利和能力的去中心化，特别是智能手机出现之后。

其实大家都是在围着镜头转：

新闻用镜头传递正在发生的事实（理论理想情况下）；
广告用镜头创造吸引人的视觉；电影和电影用镜头语言传达故事的情感和节奏；
短视频和智能手机把前面一众都极简化；
直播本身不新鲜，新闻行业对于反常事件的会用镜头在线的方式体现。只是如今在电商和娱乐行业，因为商业模式的连通，镜头前生活变成了一个 7 X 24 小时不间断的现象（不一定是好现象）。

媒体和注意力本身是有二八法则的，所以无论技术如何变化，一定会有 20% （甚至更少的比例）能够得到 80% （甚至更多）的注意力。

但是这个媒介造就的大众注意力聚焦点，很难让人不关注，更难做到公平公正。

关键是，谁在塑造，谁在看？

更关键的是，因为镜头的能耐，因为智能手机的普及性——越来越多的人为了镜头而活。

一部分是在镜头前表演自己的人生，另一部分是观看镜头上别人的人生。

“黑镜”实现了一般的感觉。

每次出门吃饭的时候，看到邻桌有漂亮姑娘以拍照和拍视频作为在餐馆的主要任务，我都想问问技术和互联网先驱们，这样的社会影响你们怎么看。

这点在北京和伦敦，没有啥区别。

五

其实我公众号的老读者都知道，我是很赞成掌握媒介素养（media literacy），让媒体能力成为自己的杠杆的。

我也一直在鼓励传统媒体的老朋友们勇敢迈出科技的这一步。

像前沿科技投资者 Naval 说的那样，新兴媒体和技术能力是重要的创业杠杆，和做传统商业不同，人的负担更小（permissionless）更容易scale up 。

但是真正的媒介素养，不只是能力的达成，而是某种程度上的自由运用。

一定要注意，是我们要拿捏媒体和技术，不是反过来。

我们应该用镜头记录值得记录的生活，而不是一切。

不要为了镜头而活。这样不自由。

不过你要问了，为什么说 AIGC 到一半，过来喷镜头啊？

其实这是我想到的，AI 生成内容对我而言的第一个意义 —— AIGC成为创作杠杆，帮我们实现镜头自由。

AI 生成内容，从这个角度可以理解成，很多内容不再需要镜头来反映，可让 AI 经过一定的训练，来想象某个人，某个事物和某个场景等等的样子——不再需要现实取景。

人类很快就可以减少不必要的因为镜头花费的，无谓的时间。

举个例子。

我这篇文章的题图，其实就是我们 Creative Lab 内部的 AI 工具生成的（还不成熟，只是原型实验）。

作者供图

仔细看其实左边有点点像我 —— 这是我和前端同事的虚拟合影，然后加上了我们小时候的样子。输入的内容只有我和他的自拍照，和一些风格咒语（text prompts）。输出内容等待了 10s 。

我并没有打开镜头来实现这张合影。

我的同事人在东欧，并不在伦敦。我俩开视频会议做个合影截图也没啥特别的意义。更何况，我们不可能在小时候认识，我俩也都没有高超的P图技术。

这对大众媒介而言，是革命性的 —— 最重要的介质被挑战，这意味着几个世纪以来，人类围绕镜头这样的介质，所塑造的所有内容生产流程和分工被打破。

我上面提到的围着镜头转的行业，都会经历大变革。因为奇点已经来临。

六

其实现在已经有很多关于 AI 所生成的内容真实性和道德性的讨论。我想说，这个问题太大，这篇文章的落脚点也不在宏观层面，而是个体自身。

AIGC 来临之前，内容真实性和道德性的问题本身就存在。媒介和内容永远是人性的照妖镜而已。

如何可以让 AIGC 成为更好的创作杠杆？

这里如果我们直接把这个问题喂给 GPT4，会很快能得到一个概貌：

样式迁移：人工智能可以在不同的图像和视频之间迁移风格，例如将一个普通照片转化为梵高或毕加索的画风。

场景生成：使用AIGC，可以生成虚拟的背景或场景，以模拟实际拍摄环境。这对于制作需要特定环境但预算有限的影片尤其有用。

角色插入：可以将AI生成的或实际拍摄的角色插入到另一个视频场景中，使其看起来像是在原地被拍摄的。

视频增强：通过AIGC，可以改进视频的质量，例如从低分辨率提升到高分辨率，或改善在差的光照条件下拍摄的视频。

面部和表情生成：AIGC可以生成各种面部和表情，这在广告和娱乐行业中有广泛的应用。

动画和3D模型生成：通过AIGC，可以快速生成3D模型或动画，大大缩短了传统的创作时间。

我选了一些跟我想说的主题相关的答案，基本是围绕镜头相关的内容制作来的：拍摄前的人物和场景准备，拍摄中的表演和拍摄之后的后期，以及视觉和创意效果增强等等。

你看，GPT4 其实已经减少了我这篇文章的创作成本 —— 减少我查找和描述基本事实的时间，我则可以聚焦在我的核心观点。

镜头相关创作成本的大大降低，这代表着 AIGC 可以帮助我们填补很多将想法具象化的视觉。

这其实不仅仅和专业的影视从业者有关 —— 我的判断是，很多写文章的作者，很可能变成视频创作者。

这点其实让我非常欣慰，因为这样让有想法的作者可以更好地讲故事。

Robert Mckee，电影制作和叙事技巧经典制作“故事”的作者，有一个核心观点就是，故事的核心不在表面（extrinsic）叙事，而是内在（intrinsic）价值。

好看的电影，画面可以很粗糙，但是可以很扎心。一个内在价值好的内容，起到的就是四两拨千斤的效果 —— 通过抓住 20% 的最重要的关键，实现80%的效果。

很多时候华而不实的电影制作是，80% 的制作花在了表面功夫。而很多很好的作者，卡在了镜头和拍摄这一环。

试想一个有想法的作者，再也不用担心出镜、演员、拍摄和后期的大部分成本。目前 AI 还只能实现通过文字输入，产生电影预告片一样的视觉。但是这是 0 到 1 的质变。

试想一个好看的生活方式网红，可以拍摄少量的经典照片，让 AI 让图片实现动感，短视频轻松可以完成。再也不用大部分时间用来摆拍生活场景，而是可以让数字分身去拼接相对重复的生活取景和拍摄。

深谙镜头这行的人，在镜头面前，对于如何安排时间，可能把握还多一些。最可能走偏的是以为开了镜头就能够拥有塑造注意力的能力，结果让时间面前，静静地流失 —— 成本特别高。

新媒体账户上多的几个数据，一生却被镜头拿捏，人间不值得。

期待看到镜头自由的时代，创作图景会出现怎样的改变。

期待镜头在大家生活中的占据比例，特别是不必要的部分，可以逐渐淡化。

希望全世界的漂亮姑娘们在餐馆里，都能不用摆拍，可以好好吃饭。

本文来自微信公众号：糖总总（ID：clairetangmedia），作者：糖总总

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

最新评论

大 家 都 在 看

大 家 都 在 搜

大家都在看

大家都在搜