
本文来自微信公众号: MacTalk ,作者:池建强
国内用户看着标题估计就很奇怪,为什么要禁止开源AI模型,大家用得好好的。
问题是,对岸的AI监管温度正在升高。到了2026年6月,从国会AI监管讨论稿,到前沿模型发布前政府审查,以至于到现在GPT 5.6都不能用,就别说A厂那些骚操作了。我的感觉是,开放权重的AI模型没准也要进入“事前准入”的流程了。
今天我们提到的很多开源AI模型,大都是开放了权重、模型架构、推理代码、分词器,有了这些用户都可自己部署模型,搭建API和微调。有的开源模型走得更远,比如DeepSeek,还开放了详细的技术报告和部分训练/推理基础设施代码,透明度更高,这些都算开源AI模型。比如厂商可以自己部署智谱、Kimi、DeepSeek等模型,但是,咱们想部署一份GPT或Claude是不可能的,因为他们是闭源模型。
过去三十年,软件行业已经证明了开源的价值。据Linux基金会与哈佛的研究,开源已经构成现代软件70-90%的基础。研究者估算,开源软件带来的需求侧价值达到8.8万亿美元。如果没有开源,企业软件支出可能要增加3.5倍。
这是现实世界里的一本账,可不完全是理想主义。
比如:Linux支撑云计算,Android遍布移动生态,Python、Kubernetes、TensorFlow、PyTorch让无数开发者站在同一个起点上。很多大公司今天看起来高楼林立,底子都有开源社区的钢筋水泥。没有这些公共基础设施,技术教育会变贵,垄断更容易,创业的门槛高到不知道哪里去了。
AI时代,只会放大这个问题。
当下的前沿AI的商业格局正在集中。两个阵营,一个是硅谷御三家,OpenAI、Anthropic、Google掌握最强模型、算力、渠道和企业客户,虽然Google最近没发啥模型,将来肯定不白给啊。另一边是追赶的一方,来自中国的开源模型,比如DeepSeek、GLM和Qwen等。
一旦模型能力只能通过少数闭源API获得,价格、访问权限、研究边界、审计方式,都会被平台单方面定义。这是开源AI模型的价值所在。
上一篇聊Anthropic的时候,Dario Amodei对安全和地缘的担忧自然是有合理性的。强模型确实可能带来网络攻击、生物风险和军事风险。问题在于,安全问题一旦变成少数公司控制AI研究的正当理由,事情就开始变味了。
你看,Dario都开始在Claude Code植入代码暴露用户隐私了(为了封国内用户),你还能干出啥事,谁知道?
我记得Wired还报道过另一件Anthropic Fable 5的争议:公司计划在用户使用Claude模型做前沿AI研发时,悄悄降低模型能力,后来在外界批评后改成可见提示和拒绝回答,这不是恶性竞争是啥?
这两件事说明了,闭源模型并不天然更可信。用户和研究者是看不到规则的,商业用户也不知道哪句话没聊对,直接就撞上了封禁墙。
开放模型至少提供了另一条路。高校可以做教学和研究,商业公司可以微调,敏感数据的企业本地部署不上云,安全研究者复现问题。更多眼睛看同一个系统,漏洞、偏见、审查、幻觉和后门才有机会被发现。
开源自然是有风险的,权重一旦发布很难召回,也可能被恶意利用,真正需要的是分级治理,按模型能力、用途、部署场景和风险等级设定责任。高风险能力可以要求评测、出具安全报告和责任追踪等等;普通开源模型、研究模型和教育模型,保留充分的可用空间。没必要一刀切啊。
DeepSeek、Qwen等模型的崛起已经证明,开源和开放权重正在改变全球AI竞争格局。对岸如果因为中国模型变强,就禁止本土使用开源生态,结果可能是:美国的学生、初创公司和中小企业失去低成本工具,全球开发者继续使用中国开源模型,嗷嚎~
其实开源模型部署在自家基础设施上,数据并不会交给模型原产国的公司。企业并不关心模型国籍,更多是成本、速度、隐私、可控性和可替换性。
开源保证了这些选择一直存在。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。