扫码打开虎嗅APP
本文来自微信公众号: 深度训练营 ,编辑:黑佳慧,作者:深度营,原文标题:《杨一:后抖音时代,声音为何依然重要|媒笔记》
从2018年《忽左忽右》上线时对“长内容”的投入,到如今目睹中文播客成为“后抖音时代”里听众的“透气窗口”。十年的播客实践,让杨一的视野跨越了太平洋。他看到了美国播客依托公共广播体系生长出的叙事传统,同时亲历了中文播客在没有公共广播基础的背景下,从短视频算法中“硬挤出来”的市场化生长。
作为国内最早的播客创业者之一,杨一懂得如何用声音构建“陪伴感”,也要熟悉广告、品牌定制和会员订阅的商业模式。虽然经历过平台对“短平快”节奏的要求,但他坚持认为听众需要的是“主动选择的深度”。他不觉得视频播客是对音频的一种冲击,而是认为播客最核心的价值在于“真人信任度”——这种基于真实对话的温度与连接,是任何AI生成技术都无法模拟的稀缺资源。
如果你好奇“为什么中文播客跳过了美国的叙事类路线?”“为什么被新传学生吐槽的过时传播学理论,反而成为AI时代最保命的优势?”,抑或是“AI生成的播客能否替代真人?”,不妨听听这位播客前辈的思考。
以下是杨一的讲述:

为什么美国有《Serial》《This American Life》这样制作精良的叙事类播客,而中文播客的主流是《忽左忽右》《文化有限》这样的访谈/清谈/聊天节目?这源于两国广播体系迥异的历史传统与市场逻辑,是“基因”层面的区别。
美国的播客,是站在公共广播体系基础上成长繁荣的。NPR(美国国家公共电台)、PBS(美国公共广播电视公司)从上世纪70年代起,因其非商业化的公共使命,就在用纳税人的钱、听众的捐款,系统性地培育那种“不赚钱但有社会价值”的深度叙事内容。在这种土壤里成功的叙事播客,是公共广播体系几十年来的叙事人才和经验积累,在数字分发时代的一次集中释放。于是,美国市场演化出了结构清晰、模式多元的生态,分别是传统商业资源平移、公共使命驱动与纯粹市场创新三种路径。
而中国的传统广播,长期是商业逻辑主导,核心收入高度依赖广告,运营围绕“收听率”展开。在垄断性的渠道(无线电波资源、车载场景)保护下,它缺乏像美国公共广播那样,依靠财政拨款、听众捐款或基金会支持来长期培育“不赚钱但具有社会价值”的内容机制与内在动力。
所以,中文播客的爆发,跳过了“叙事类播客”这个高门槛阶段,直接进入了“长形式、真人陪伴式对谈”。它的驱动力不是经验和人才传承,而是“后抖音时代”的社会心理背景——短视频算法席卷互联网,用户对被动投喂的、碎片化的短内容产生厌倦,从而主动转向寻求一种可自主选择、能提供深度陪伴和真实交流感的音频内容。聊天播客恰好以最低的创作门槛和最强的真实感,丝滑承接了这样迫切的社会需求。
中国没有“真正意义上的小众”。哪怕播客渗透率只有10%,乘以庞大的人口基数,绝对用户规模也比很多国家的总人口还多,这是另一种“发达”。还有一种“发达”体现在活跃度较高、未完全固化的产业结构,以及对新形态、新商业模式的持续探索之中。
我向美国同行解释中文播客的发展时,通常会从“后抖音时代”讲起。
美国播客是在2014、2015年随着《Serial》的火爆而兴起的,而中文播客真正成规模,是2018年露头,2019年形成清晰起点,之后线性增长的。中文播客不是在自然偏向长内容的环境里出现,而是在短视频高度普及、算法主导一切的市场里生长出来的,是硬挤出来的。
2018年《忽左忽右》刚上线,音频平台建议我们把一期拆成三段,每段二十分钟,他们觉得大家只能听得进短节目。我们当时并不认同这种判断,谈不上是理性分析,更多是一种执拗——坚持做长内容。
后来成立JustPod,开始做用户调研,我们才真正看清了听众的需求。很多中文播客的听众来到这里,是因为他们在其他地方看到的,全是短的、碎片化的、由算法喂给他们的内容。他们需要一个能透气的窗口,一个能提供主动选择、长时间、真人陪伴的东西。
在2020年那个时间点,这种内容几乎只有播客能提供。那时没有鲁豫的《漫谈》,也没有《罗永浩的十字路口》,电视台的访谈节目几乎消失,视频平台也仅存像《圆桌派》《十三邀》等少数几档访谈节目。播客恰好成了算法主导的内容环境里的一块飞地。
从整体路径来看,中美播客的发展差异并不是由某一类内容决定的,而是由各自的媒介土壤塑造的。他们之间有一个大约五年的时间差。美国更早经历了音频播客的成熟、商业化和平台化,而中国是在短视频和算法主导的环境中开启了播客的增长周期。但到2025年,美国也已经经历了算法平台与短视频内容5-6年的洗礼,两个国家的两条路汇合到同一个议题上——视频播客兴起,以及它对以声音为主的播客形态带来挑战。
在我看来,中美播客发展的路径不同,但落点相同,可谓殊途同归。

2020年,我在北师港浸大(UIC)参与开设播客课程,我一直坚持,要想理解播客创作,就不能和人类广播一百年积累下来的经验割裂。
我会用8周课时讲广播百年发展史,对比中英美三个市场,看传统广播电视如何影响当地人的内容消费习惯,这些习惯又如何影响今天的播客认知和消费行为。实践课上,我们不要求传统小论文,而是让学生递交音频作品,把研究结论用声音表达出来。每学期我都会给新生做播客产业的分享,聊聊播客行业的新趋势和变化。
国外的播客教育走得更靠前。伦敦大学城市圣乔治学院在2023年开设了全球第一个播客方向的一年制文学硕士项目。纽约大学、哥伦比亚新闻学院也纷纷开设声音与播客课程,我自己也一直为伦敦大学学院(UCL)担任播客课程的业界导师,有的会直接与行业接轨,学生在学期中就有机会向业内人士提案,像“选秀”一样展示自己的节目创意。我曾经参加过伦敦城市大学的一个这类的实践活动,其中一个节目会去捕捉市面上能找到的各种灵异事件,做成一个大约六集的系列节目,现场反响很好,后来也被一个播客公司的老板挑中。
我认为,新闻学院把教学和播客结合,势在必行。播客教学,本质是传统意义上国内高校体系中“广播电视新闻学”的延伸。上一个时代的音频新闻是广播,这个时代是播客,下一个时代会进入AI声音新闻,播客就成了中间的过渡形态。如果我们在这个过渡期,不能及时捕捉受众心态的变化,并将其转化为知识和经验传授出去,就会错失应对未来变化的最佳窗口期。
如果学界和业界不尽快合力挖掘新闻业的本质与稀缺性,并像英国伦敦大学城市圣乔治学院那样,快速将符合市场、符合时代气息的内容创作思路和经验,通过教课、编教材、写论文固化积累下来,就很可能在AI时代被迅速代替。
很多新闻系学生觉得课堂知识过时,在我看来,那些是真的独家秘笈。
麦克卢汉说“媒介即讯息”。我在学传播学概论时听这话也是云里雾里,只能把它当成课堂笔记的一部分。直到我做播客,开始真正面对不同媒介形态之间的差异,才清楚感受到:内容不是独立存在的,它永远是在某种媒介形态里被呈现的。不同的媒介就像不同形状的杯子,可能是柱状杯、茶杯,而你的报道、采访、内容就是水。听众最终接收到的,是被杯子塑形后的东西。
我越来越能理解这些课程的价值。我们至少知道施拉姆、拉扎斯菲尔德、麦克卢汉,知道冷媒介、热媒介、知沟理论等。我不认为这些东西会随着技术变化而发生本质改变,它们只会在你职业的不同发展阶段被激活。在一个人人都能做内容的自媒体时代,新闻系学生更早有机会接触到有关传播本质的理论。发展史之所以重要,也是因为上一个时代的传播故事会在下一个时代不断重现,理解上一个时代的发展过程,就更有可能预测下一个时代的走向。
很多同学觉得课堂上的采访技巧过时了,那些不断挖掘、不断追问,甚至是“撬开他的嘴”的记者形象,好像不适用于今天的播客聊天。
其实不是技能过时了,而是它的姿态变了。
上个时代的新闻采访,记者被赋予“第四权”,过程带着一种审视性、挖掘性的姿态。而今天播客里的访谈状态完全不同,是一种更平视、更开放的对话。就像鲁豫在《慢谈》里意识到:今天做采访不可能再像当年那样拥有至高无上的权利;如果想从对方那里得到一个秘密,就要先分享一个自己的秘密;如果希望谈话持续下去,就必须对对方感兴趣的东西有认知,而不是站在一个完全旁观的位置。
但内核变了吗?答案是否定的。学新闻的人最知道怎么获取原始事实——调查力、在现场的突破能力、对未知问题的发掘能力、把已知问题之间建立联系的逻辑能力,而这些都是新闻专业实践中会训练的东西。这些AI做不到,它只能基于已有数据生产,无法创造新的事实。
写作能力能帮助制作人在大量信息之间重新建立结构,让听众感受到你当初感受到的东西。
一个调查或专题可能有十几个受访者,你如何在获得这么多素材后,回到最初的问题意识?如何让听众在有限的篇幅里理解你的路径?这需要依托写作。英文播客里大量叙事类节目,本质上就是在做音频版的特稿,结构必须优先,写作才是真正打动人的部分。
而在中文播客的语境里,大家更习惯在一个小时或一个半小时的陪伴式聆听中慢慢理解逻辑,写作不一定是刚需,但并不代表它没用。写作技能本身有跨媒介存在的基础,在叙事类、专题类内容里非常重要。
到了AI时代,这一点会更清晰。AI可以把你给的原始素材生成50个版本。300字的AI摘要,1000字的短报道,3000字的中篇故事,8000字的深度特稿。30秒的短视频,15分钟的解释视频,30分钟的电视访谈,1小时的纪录片……但内容从哪来、如何选择、如何判断,依然是人说了算。在纯粹的生产环节,怎么得到内容这碗“水”,才是核心价值和核心竞争力。

我发现中文播客的商业化图景呈现出多元、分散、并行探索的鲜明特征。最普及的是广告,它能让“很多播客都可以收到这个钱”,是一种相对普惠但高度依赖流量的路径,收入极为分散。
其次是品牌播客或企业音频服务,项目单价较高,但本质是To B的服务采购,品牌方购买的是包括策略、制作、传播在内的完整解决方案,而非单纯内容,收入规模可能不低,但只有少数有系统化服务能力的机构能吃到。
再有是付费与会员订阅,是大众视野里一种更直接的变现方式,依赖不可替代的内容价值,目前占比较小。至于线下活动、伴游团或周边商品等衍生变现,属于外围探索,比例更小。
在我看来,当前中文内容产业最真实的约束环境,并非是传统自上而下的行政指令,而是来自普通用户的举报和网络上的恶意评论所引发的舆情压力。平台出于维护自身安全与稳定的需要,会对这类民众自发形成的舆论压力做出反应,通常采取比官方要求更为严格的自我审查。
真正的审查压力是自下而上涌现的,源自“民众的汪洋大海”。标准是由分散的、情绪化的公众舆论即时塑造,而非清晰的条文规定。这也意味着,营造一个更为理性、包容的线上舆论环境,抵制举报文化的“平庸之恶”,是每一位内容消费者与创作者的共同责任。
最近一两个月,我在使用Google的NotebookLM。我把一篇论文丢给它帮我深度消化,它可以产出一期二十到三十分钟的、两个主持人对谈形式的中文播客。
我就通过听这个来拆解论文,获得核心信息:这篇论文到底在讲什么?用什么样的论据来论述?论述之后,哪些符合预期、哪些超出预期?作者认为它对未来的哪些场景可以复用?如果我觉得某个论点非常新、非常有价值,或者有让我“有感”的点,我就会再回到文本当中去细看。这大大提升了我的效率。那些论文有些是2020年下载的,这么多年我都没看过,但用NotebookLM,很短的一两周内,二三十篇论文我全都“听”掉了。
NotebookLM有几个很细致的地方。第一,我认为,它放下了人的固执和人的思维局限,脚本比我们写的所有脚本都好,没有任何“挣扎感”。第二,它说话保留了呼吸、说错话、口癖。真实的谈话里就是有呼吸的,适度的口癖可以增强“真人感”或“活人感”。很多人类剪辑师拼命剪掉的东西,它把它们找了回来。
使用NotebookLM的经历给我带来了很大的启发。第一,声音未来会变成“为我所用”的东西,可以根据自己的需求,生成任何我想听的东西,比如把一篇枯燥的行业报告变成通勤路上的对话。这会让更多人习惯“长时间聆听”,扩大整个音频市场的基数。我非常看好它的市场潜力,能让更多的人意识到:我喜欢听,听是我可以接受的一种消费形态。到那时,“真人的信任度”会成为一种核心价值。

我的判断是,视频播客的兴起并非对音频播客的简单替代,而是一种基于用户需求与平台生态的自然演化。
它的出现,是因为大量用户来自B站、小红书、YouTube等视频内容社区中。他们需要“长视频”、“深度对谈”。视频播客在场景设置、对话姿态和制播上彻底革新。与传统电视访谈节目相比,视频播客的场景设置追求平等与亲密感,采用近距离、面对面的座位安排,强调主持人面向嘉宾身体前倾、保持倾听与倾诉的状态。整个制作理念不再是通过后期剪辑营造对话感,而是追求在录制现场就达成真实、松弛的深度交流。从审视到平视、从表演到陪伴的姿态转变,定义了视频播客区别于过往访谈节目的根本特质。属于长视频与播客形态的汇流。
未来,视频播客与音频播客会是一种共存与互补的关系,服务于不同场景下的用户。音频播客将继续占据通勤、家务、睡前等伴随场景,视频播客则满足观看真人互动、获取沉浸式体验的需求。两者是在不同的媒介轨道上,共同回应着用户对“反碎片化”、“真人链接”内容的深度渴望。
最后,我想给新人一个建议:不要被平台绑架,要让平台为我所用。
与其长期困顿于“我究竟擅长什么”的抽象思考,不如直接投身创作,在抖音、B站、小红书、播客等不同平台上,尝试短视频、长视频、音频、图文等多种内容形态。每一次实践都不是为了追求单次的爆红,而在于积累对不同媒介特性、用户反馈和内容创作本质的第一手感。正是在这个不断试错与获得反馈的过程中,才会更清晰地识别出:哪些内容是你能持续提供且乐在其中的?哪些技能是你的长项?你的表达在与世界碰撞时,真正稀缺的价值是什么?
同时,应保持一种长期主义的、经验积累式的职业观。今天在各类平台上的所有创作实践,所积累下来的都是对媒介的感知、对受众的理解、对内容规律的把握,这些都会成为未来应对任何媒介形态变化的底层资产。
因此,我认为不必过度焦虑于立即找准一个“终极定位”,而是将当下视为一个宝贵的“探索期”,通过积极的创作、发布与复盘,在行动中不断勾勒和修正自我轮廓,让“自己”在真实的世界反馈中逐渐清晰、确立。

Q:叙事类播客在中国有市场吗?
A:叙事类播客在中文市场发展潜力相对有限,这是由市场环境、用户习惯与产业基础共同决定的。
当前中文播客以制作门槛低、社交属性强的“对谈闲聊”类节目为主流,相比之下,叙事类播客制作成本高、周期长,但商业回报路径尚不清晰,属于“高成本、高风险、慢回报”的领域。此外,国内还缺乏成熟的产业基础设施,如专业的叙事人才库和专项基金支持。
因此,对于热爱叙事类播客创作的个体而言,更可持续的办法是采取一种“职业”与“志业”分开的务实策略。创作者通过音频制作、内容策划等市场化的技能获得稳定收入,支撑自己在叙事领域的探索。
一是进行项目制创作,将每个叙事作品视为一个完整独立的项目,寻求特定的赞助、资助或合作,而非追求持续性的节目更新;二是通过工作坊、创作营或线上社群,与同好组成互助团体,在获取专业反馈和情感支持的同时分摊成本与压力;三是将能力商业化,将叙事能力应用于品牌故事、有声剧等商业项目,既能获得报酬、磨练技艺,也能验证叙事方法在不同场景下的效果。
叙事类播客作为兼具深度与审美的声音内容,创作者会从创作本身体验到无穷乐趣和启发他人的满足感,这种情绪价值有时比物质收益更为可贵。
Q:机构媒体做播客为何乏力?
A:个人做播客,源于真实的生存压力与内在的创作激情,内容产出直接与市场反馈和个体收入挂钩。压力迫使他们必须深入媒介、精准定位自身独特性,并从零开始探索可持续的商业模式。他们的内容是从新媒介土壤中生长出来的,更具原生魅力。
机构媒体的生存逻辑与新媒体市场的竞争环境之间,存在着天然的错位。机构媒体的优势和根基并不来源于市场化的内容能力,而是来源于作为特殊体系的一部分,所享有的政策与传播渠道优势。它缺乏像成熟市场化媒体那样,必须不断追问“剥离传统媒体的权威后,我的核心价值到底是什么”并进行自我重塑的紧迫感。
这种底层逻辑的错位,直接导致了机构媒体做播客时常陷入两种困境。一是对自身核心价值的认知容易产生偏移。在转型时,机构媒体往往较难从自身作为专业新闻机构独有的信源网络、采编能力或品牌公信力出发,去设计原生内容产品,而是容易在考核指标的驱动下,陷入被动模仿的惯性——市场上流行什么,便去尝试对标什么,结果丢掉了原有的独特性。二是对新媒体生态与用户心理的理解存在一定隔膜,较难真正契合播客所依赖的平等、亲密、真人陪伴的媒介特质,也容易低估听众在此寻求情感连接和深度交流的心理诉求。