正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2023-08-22 15:37

AIGC之后,让我们实现镜头自由

本文来自微信公众号:糖总总(ID:clairetangmedia),作者:糖总总,头图来自:作者供图




大家最近好吗?


我最近有一些心得,也特地来问候问候。


离上次汇报牛津读书脱层皮的经历竟然又有一年多了,我果然是你萌所说的年更作者。


我大部分时间都在伦敦东城区猫着,工作和学习,一边适应新地方、新行业、新文化,同时一边思考三十而立的生活。


简单而言,对这个问题实话说我还没啥答案。


哪里都有好,哪里都有不好,一万句省略后,就说句,我还真挺想家的。


主要是我的中国胃作怪也?


吃其他的都觉得缺点啥。不过最近我感觉好多同胞来伦敦,中国超市开的更多了,超市里的乡音也很多。


工作时,最近也很容易碰到中国人,特别是AI和技术相关的这块。每次一对接发现对方可以讲普通话,就觉得好开心。




之前文章里提过,我目前在的公司是做 AI 内容生成的,也就是 AIGC (AI Generated Content)


过去一年 AIGC 这块发生的巨大变化更不用我来叙述,我只是想表达,之前有关科技浪潮的文章里提过的一个关于技术奇点(Singularity)来临的观点:


未来学家雷蒙德·库茨魏尔(Ray Kurzweil)把这种人类科技进步的加速发展称作加速回报定律(Law of Accelerating Returns)


他认为整个 20 世纪 100 年的进步,按照 2000 年的速度只要 20 年就能达成 —— 2000 年的发展速度是 20 世纪平均发展速度的 5 倍。2014 年开始,只要花 7 年(2021年),就能达到又一个 20 世纪一百年的进步。 


他提过,那 2030 年的世界可能就能把我们吓一大跳,2050 年的世界会变得面目全非。


还记得我之前提过的这个曲线吗? 那个转折点就是奇点所在。


我真的觉得,我们目前站在这个点上。


像互联网先驱 Tim OReilly 说的那样,技术变革都是这样按照“逐渐地,然后突然地”趋势的浪潮发展的。


关键是自己要做点什么,可以有意义地参与。


 三


不过,千万别觉得我在伦敦找工作的时候,脑子里有带着这些宏大牛B的理论,事实上完全没有。


我只是给自己定了几点原则:


1. 尽量找好的人一起工作。创始人和创始团队的素质和人品,决定了团队能力能不能更好发挥,大家是否能同甘共苦。


特别是共苦这点。最好的小伙伴和导师都是创业时候,或者因为创业相关的原因认识的。


我们互相见过最艰难时刻最差的一面,竟然还是朋友,真不容易。


2. 尽量和内容变革相关。从传统媒体 Media 到 PGC(Professional Generated Content), 再到 UGC (User Generated Content), 读我公众号时间长的同学可能记得,我就是对内容感兴趣。


一直在试图搞明白,互联网传播方式的巨大变革,对内容生成带来的社会影响(可以看公众号内目录:糖总总的媒体课)。我在牛津做的研究生课题也是Z世代的视频内容生成。


多一句嘴,我强调变革,是因为光从内容生产本身可能会容易一叶障目。因为直到 AIGC 之前,内容生产的成本都非常高(文章后面有专门讲),如果简单去比如做一个新媒体的小编,十有八九时间会被大量的成产过程占据,而不够时间去研究新的图景。


我比较关注变化向的东西。做事要抓关键,做四两拨千斤的事情。


我想起来笑来老师其实之前经常讲,不要被特定媒体的形态绑住。不要陷在更高效地手工给村庄取水,要思考怎么先自动化搭建水渠。即使,刚开始的时候,手工的方法见效更快。你要稳得住。


这也一直是我为什么近几年不执着于更新内容的原因,因为太占精力了,还有很多东西需要学。


当然,这也给自己年更这个状态,找个冠冕堂皇借口,不要介意。


3. 尽量和内容生成的新技术相关。我入职我现在公司的时候,牛津的互联网中心是学校里讨论 AI 对社会影响最前沿的地方了,但当时讨论 AI,也大多数是在 AI 的道德层面和数据保护层面。


AI 在当时还没有变成内容生成的杠杆。


在牛津的时候我参与了一个 Entrepreneural Program,当时有很多 start-up 在这个创业中心孵化。


我选了一个离内容生成最近的,也就是现在的公司。刚开始我们是在做 3D 生成的 Nerf 技术,帮助大家产生镜像一般的虚拟现实内容。


随着 AIGC 相关研究的井喷,我们结合 AI 生成视频和 3D,在内部的 Creative Lab 孵化了一系列技术。


我当时并没有想到 AIGC 会变成一个专有名词,然后突然 AI 生成内容的奇点来临:按照内容的视觉化难度层级来看,大家看到文字和图片的 AIGC 内容只是前奏 - 视频、游戏、3D 都会继续按照奇点的速度发展。


我记得年初,有一天在家里高兴地鼓掌:一直研究的 Media-PGC-UGC-AIGC 这条脉络竟然连起来了。



讲述 AIGC 的意义之前,我们先来说说镜头这个概念,因为极大可以帮助理解。


媒体出身的我,某种意义上我一直是不喜欢镜头的。


这不仅仅是,我自己觉得自己不上相的原因。


Camera 是人类的一个伟大发明。从小孔成像实验到现代电影的发展,镜头背后也叠加了几个世纪的技术buff。


我所谓的不喜欢,是从社会学的意义上来说的。镜头是记录和反映现实的一种强有力媒介。


观察现实的视角,就是镜头在塑造的。


大众媒介的变化,核心就是镜头塑造权利和能力的去中心化,特别是智能手机出现之后。


其实大家都是在围着镜头转:


  • 新闻用镜头传递正在发生的事实(理论理想情况下)


  • 广告用镜头创造吸引人的视觉;电影和电影用镜头语言传达故事的情感和节奏;


  • 短视频和智能手机把前面一众都极简化;


  • 直播本身不新鲜,新闻行业对于反常事件的会用镜头在线的方式体现。只是如今在电商和娱乐行业,因为商业模式的连通,镜头前生活变成了一个 7 X 24 小时不间断的现象(不一定是好现象)


媒体和注意力本身是有二八法则的,所以无论技术如何变化,一定会有 20% (甚至更少的比例)能够得到 80% (甚至更多)的注意力。


但是这个媒介造就的大众注意力聚焦点,很难让人不关注,更难做到公平公正。


关键是,谁在塑造,谁在看?


更关键的是,因为镜头的能耐,因为智能手机的普及性——越来越多的人为了镜头而活。


一部分是在镜头前表演自己的人生,另一部分是观看镜头上别人的人生。


“黑镜”实现了一般的感觉。


每次出门吃饭的时候,看到邻桌有漂亮姑娘以拍照和拍视频作为在餐馆的主要任务,我都想问问技术和互联网先驱们,这样的社会影响你们怎么看。


这点在北京和伦敦,没有啥区别。



其实我公众号的老读者都知道,我是很赞成掌握媒介素养(media literacy),让媒体能力成为自己的杠杆的。


我也一直在鼓励传统媒体的老朋友们勇敢迈出科技的这一步


像前沿科技投资者 Naval 说的那样,新兴媒体和技术能力是重要的创业杠杆,和做传统商业不同,人的负担更小(permissionless)更容易scale up


但是真正的媒介素养,不只是能力的达成,而是某种程度上的自由运用。


一定要注意,是我们要拿捏媒体和技术,不是反过来。


我们应该用镜头记录值得记录的生活,而不是一切。


不要为了镜头而活。这样不自由。


不过你要问了,为什么说 AIGC 到一半,过来喷镜头啊?


其实这是我想到的,AI 生成内容对我而言的第一个意义 —— AIGC成为创作杠杆,帮我们实现镜头自由。


AI 生成内容,从这个角度可以理解成,很多内容不再需要镜头来反映,可让 AI 经过一定的训练,来想象某个人,某个事物和某个场景等等的样子——不再需要现实取景。


人类很快就可以减少不必要的因为镜头花费的,无谓的时间。


举个例子。


我这篇文章的题图,其实就是我们 Creative Lab 内部的 AI 工具生成的(还不成熟,只是原型实验)


作者供图


仔细看其实左边有点点像我 —— 这是我和前端同事的虚拟合影,然后加上了我们小时候的样子。输入的内容只有我和他的自拍照,和一些风格咒语(text prompts)。输出内容等待了 10s 。


我并没有打开镜头来实现这张合影。


我的同事人在东欧,并不在伦敦。我俩开视频会议做个合影截图也没啥特别的意义。更何况,我们不可能在小时候认识,我俩也都没有高超的P图技术。


这对大众媒介而言,是革命性的 —— 最重要的介质被挑战,这意味着几个世纪以来,人类围绕镜头这样的介质,所塑造的所有内容生产流程和分工被打破。


我上面提到的围着镜头转的行业,都会经历大变革。因为奇点已经来临。



其实现在已经有很多关于 AI 所生成的内容真实性和道德性的讨论。我想说,这个问题太大,这篇文章的落脚点也不在宏观层面,而是个体自身。


AIGC 来临之前,内容真实性和道德性的问题本身就存在。媒介和内容永远是人性的照妖镜而已。


如何可以让 AIGC 成为更好的创作杠杆?


这里如果我们直接把这个问题喂给 GPT4,会很快能得到一个概貌:


样式迁移:人工智能可以在不同的图像和视频之间迁移风格,例如将一个普通照片转化为梵高或毕加索的画风。 


场景生成:使用AIGC,可以生成虚拟的背景或场景,以模拟实际拍摄环境。这对于制作需要特定环境但预算有限的影片尤其有用。


角色插入:可以将AI生成的或实际拍摄的角色插入到另一个视频场景中,使其看起来像是在原地被拍摄的。


视频增强:通过AIGC,可以改进视频的质量,例如从低分辨率提升到高分辨率,或改善在差的光照条件下拍摄的视频。


面部和表情生成:AIGC可以生成各种面部和表情,这在广告和娱乐行业中有广泛的应用。 


动画和3D模型生成:通过AIGC,可以快速生成3D模型或动画,大大缩短了传统的创作时间。


我选了一些跟我想说的主题相关的答案,基本是围绕镜头相关的内容制作来的:拍摄前的人物和场景准备,拍摄中的表演和拍摄之后的后期,以及视觉和创意效果增强等等。


你看,GPT4 其实已经减少了我这篇文章的创作成本 —— 减少我查找和描述基本事实的时间,我则可以聚焦在我的核心观点。


镜头相关创作成本的大大降低,这代表着 AIGC 可以帮助我们填补很多将想法具象化的视觉。


这其实不仅仅和专业的影视从业者有关 —— 我的判断是,很多写文章的作者,很可能变成视频创作者。


这点其实让我非常欣慰,因为这样让有想法的作者可以更好地讲故事。


Robert Mckee, 电影制作和叙事技巧经典制作“故事”的作者,有一个核心观点就是,故事的核心不在表面(extrinsic)叙事,而是内在(intrinsic)价值。


好看的电影,画面可以很粗糙,但是可以很扎心。一个内在价值好的内容,起到的就是四两拨千斤的效果 —— 通过抓住 20% 的最重要的关键,实现80%的效果。


很多时候华而不实的电影制作是,80% 的制作花在了表面功夫。而很多很好的作者,卡在了镜头和拍摄这一环。


试想一个有想法的作者,再也不用担心出镜、演员、拍摄和后期的大部分成本。目前 AI 还只能实现通过文字输入,产生电影预告片一样的视觉。但是这是 0 到 1 的质变。


试想一个好看的生活方式网红,可以拍摄少量的经典照片,让 AI 让图片实现动感,短视频轻松可以完成。再也不用大部分时间用来摆拍生活场景,而是可以让数字分身去拼接相对重复的生活取景和拍摄。


深谙镜头这行的人,在镜头面前,对于如何安排时间,可能把握还多一些。最可能走偏的是以为开了镜头就能够拥有塑造注意力的能力,结果让时间面前,静静地流失 —— 成本特别高。


新媒体账户上多的几个数据,一生却被镜头拿捏,人间不值得。


期待看到镜头自由的时代,创作图景会出现怎样的改变。


期待镜头在大家生活中的占据比例,特别是不必要的部分,可以逐渐淡化。


希望全世界的漂亮姑娘们在餐馆里,都能不用摆拍,可以好好吃饭。


本文来自微信公众号:糖总总(ID:clairetangmedia),作者:糖总总

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
文集:
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: