2026-06-10 13:30

为什么说“永远缺存储”:AI 时代的存储叙事与投资逻辑

author_path 许良©
头图

本文来自微信公众号: 业界良新 ,作者:许良


一、为什么AI讲到最后,总会回到存储


过去两年,市场讨论AI基建,先是盯GPU,后来盯电力,再后来盯光通信、液冷、变压器、数据中心REIT。


但只要继续往系统内部拆,最终都会回到同一个问题:


模型可以更大,推理可以更多,Agent可以更复杂,但这些能力都必须落在一个真实的物理系统里:数据要被存下来、搬过去、读出来、再写回去。


这就是为什么近期“存储”会成为AI投资里的核心叙事。


这里说的存储,不是狭义的硬盘,也不只是消费电子里的内存条,而是一整套AI存储层级:


层级对应产品AI里的作用
最热层HBM放在GPU旁边,承担模型执行、热KV cache、高带宽数据交换
热层DDR5/LPDDR/SOCAMM/CXL Memory承担CPU侧调度、长上下文扩展、多Agent编排
温层企业级SSD/高IOPS NAND承担持久化KV cache、向量数据库、RAG检索、训练数据读取
冷层HDD/对象存储存训练语料、日志、归档、多模态数据湖


AI的本质不是只做一次矩阵乘法。真正进入应用后,它会变成持续的token工厂:每一次用户请求、每一轮工具调用、每一次检索、每一个Agent的中间状态,都会制造新的读写需求。


所以,算力是发动机,电力是燃料,光通信是道路,存储则同时是油箱、输油管、仓库和工作台。少了它,GPU再贵也只能空转。


二、“倍数公式”:存储需求为什么会被放大很多倍


可以用一个简化公式理解AI存储需求:


AI存储需求≈模型权重+KV cache+并发用户数+上下文长度+Agent步数+RAG/向量库检索数据+训练与日志留存-算法压缩效率


如果写成乘数模型,大致是:


总存储压力=基础模型规模×上下文倍数×并发倍数×Agent步数×检索倍数÷压缩效率


这个“倍数理论”:单个变量看起来只是几倍增长,但多个变量相乘后,结果会非常夸张。


比如:


•模型从70B走向数百B/MoE/多模型协同,不只是权重变大,调度和缓存也变复杂;


•上下文从8K、32K走向128K、1M token,KV cache线性增长;


•用户从少数开发者变成企业员工、客服、代码Agent、搜索入口,推理并发增长;


•一次请求从“一问一答”变成Agent多步执行,可能调用搜索、代码、数据库、浏览器、工具链;


•RAG不只是读一段文本,而是访问向量库、文档库、历史日志、图像、视频、代码仓库。


KV cache可以更直观地算:


KV cache bytes=2×层数×KV heads×head_dim×bytes_per_element×context_tokens×batch/concurrency


以一个70B级、使用GQA的模型粗算,假设80层、8个KV heads、head_dim 128、BF16:


每个token的KV cache=2×80×8×128×2 bytes≈0.31 MB 128K上下文的一条会话≈40 GB KV cache 1000条并发长上下文会话≈40 TB热KV cache


这还只是热缓存,没有算模型权重、激活、检索库、日志、训练数据和冗余备份。


所以,AI对存储的需求不是“用户多一点,硬盘多一点”这种线性关系,而是多个维度同时放大。Micron在2026年COMPUTEX资料里也给过一个方向性判断:AI context length正在快速上升,服务器内存容量也在显著提高。换句话说,系统瓶颈正在从“能不能算”扩展到“能不能记住、读得够快、搬得够快”。


三、为什么压缩技术不一定是存储利空


市场经常会因为某个新技术路线创新,比如KV cache压缩、稀疏注意力、MLA、量化技术而恐慌:既然效率提高了,存储是不是就不需要那么多了?


短期看,压缩当然会降低单位token的存储成本。


但长期看,这件事更接近杰文斯悖论:


当一种资源的使用效率提高,最终结果不一定是总需求下降,反而可能是使用场景被打开,总消耗继续上升。


燃油车更省油后,人们不一定少开车,而是可能开得更远。AI也是一样:


•KV cache压缩4倍,产品经理可能立刻把上下文开到原来的4倍;


•推理成本下降,企业会把更多工作流交给Agent;


•模型响应更快,用户会增加调用频次;


•过去“不经济”的长文档、长视频、代码仓库、企业知识库分析,会变成可用场景。


所以,效率提升真正改变的是“单位成本”和“应用边界”,不是简单消灭需求。只有当算法效率提升速度长期大于使用量、上下文、并发、Agent步数的乘积增长时,存储需求才会被真正压制。


这也是存储投资里最关键的判断:


如果:使用量增长×上下文增长×Agent步数增长>算法压缩效率提升那么:存储需求继续扩张如果:算法效率突然大幅领先,同时AI应用变现放缓那么:存储重新回到周期股逻辑


四、这一轮存储周期,和过去PC/手机周期有什么不同


传统存储是典型周期股。


过去的需求主要来自PC、手机、服务器换机。行业逻辑很简单:


1.价格上涨;


2.厂商扩产;


3.供给过剩;


4.价格下跌;


5.厂商减产;


6.下一轮周期重来。


这套逻辑没有消失,但AI改变了三个变量。


1.需求从消费电子变成基础设施投资


PC和手机需求受换机周期影响,弹性有限。但AI数据中心更像能源、电网、云基础设施建设,云厂商会提前多年锁定产能。


2.HBM不是普通DRAM


HBM的难点不只是多堆几层DRAM die,而是TSV、先进封装、良率、客户认证、GPU平台协同。


普通DRAM可以更接近大宗商品,但HBM更像绑定AI加速器平台的关键组件。客户不是临时去现货市场买一批就能用,而是要提前认证、锁产能、签长协。


更重要的是,HBM会占用先进DRAM wafer和封装产能。高端HBM吃掉产能后,普通DDR5、服务器DRAM也会变紧。这就是“高端短缺外溢到低端”的传导。


3.NAND也被AI重新激活


过去NAND最大的问题是容易过剩,技术扩产快,价格弹性大。但AI推理和Agent系统带来了新的eSSD需求:


•向量数据库;


•RAG检索;


•持久化KV cache;


•多模态数据湖;


•高频随机访问;


•AI PC/车端本地缓存。


TrendForce在2026年1月的报告中提到,AI Agent、RAG和高随机访问模式正在提高企业级SSD需求,并预计2026年DRAM和NAND市场收入都将大幅增长,合约价上涨趋势可能延续到2027年。


所以,这一轮不是单一产品涨价,而是HBM、服务器DRAM、SOCAMM、eSSD、HDD数据湖一起进入AI存储层级。


五、当前存储叙事:从“卖芯片”变成“卖AI记忆能力”


存储行业的估值变化,核心不是因为价格涨了,而是市场开始相信:


存储不再只是周期品,而是AI基础设施里的战略资产。


这轮叙事的完整链条是:


AI应用增长→token产量增长→上下文和Agent步数增长→KV cache/RAG/数据湖需求增长→HBM、DRAM、eSSD、HDD同时吃紧→存储厂商签长协、涨价、提升产品mix→利润率和现金流非线性改善→市场开始讨论周期股向成长股重估


这也是为什么这轮存储股涨起来以后,市场争论的不是“今年赚多少钱”,而是“这些利润能维持几年”。


六、周期股还是成长股:正确答案可能是“周期成长股”


把存储简单归类为周期股,可能会错过这一轮AI基建带来的结构性重估。


但把存储直接当成软件成长股,也很危险。


更合理的定义是:


存储是被AI拉长景气周期、提高利润中枢、但仍然无法摆脱资本开支周期的周期成长股。


多头为什么愿意给更高估值


多头押的是三件事:


第一,HBM供给瓶颈不是一年能解决。


晶圆、先进封装、良率、客户认证、平台适配,都有物理周期。


第二,AI推理从训练走向Agent后,存储需求不是下降,而是扩散。


训练重HBM,推理重KV cache,Agent重长上下文和检索,企业应用重eSSD和数据湖。


第三,长协和预付款改变了周期波动。


如果大客户提前锁定产能,甚至通过战略协议、预付款、最低价格条款来保障供应,存储厂商的收入能见度会高于传统周期。


空头为什么仍然不能忽视


空头也不是没有道理。


第一,存储行业历史上每次都有人说“这次不一样”。


但只要供给起来、需求放缓、库存堆积,价格还是会下跌。


第二,算法效率是真变量。


MLA、稀疏化、KV cache压缩、MoE、端侧小模型,如果共同压低单位存储需求,会改变需求斜率。


第三,云厂商CAPEX不是无限的。


如果AI应用变现跟不上资本开支,2027-2028年云厂商可能放缓服务器采购。


第四,竞争会重新均衡。


SK hynix、Micron、Samsung都在扩HBM,Samsung良率追赶、Micron HBM4放量、中国厂商在中低端DRAM/NAND继续推进,都会改变价格预期。


所以,存储的投资难点不是判断“好不好”,而是判断:


这一轮超额利润能维持几年?市场现在按几年定价?供给释放和需求放缓谁先到?


七、投资地图:不同标的吃到的是不同的钱


存储链不能混在一起看。不同公司吃到的是不同利润池。


1.全球原厂:SK hynix/Micron/Samsung


这是最核心的HBM和高端DRAM供给方。


•SK hynix:HBM先发优势最强,利润率已经证明AI存储的极端弹性;


•Micron:美股里最直接的存储原厂表达,HBM4、数据中心SSD、SOCAMM2都在强化AI存储平台叙事;


•Samsung:一旦HBM良率和客户认证追上,可能带来供给再均衡,也可能分享更大市场。


投资上,这组标的是“原厂定价权”的表达。


2.NAND/SSD/HDD:AI数据湖和冷温层


如果HBM是热层,eSSD和HDD则是温层与冷层。


AI Agent、RAG、多模态训练、日志留存,会继续吃企业级SSD和大容量硬盘。这里的逻辑比HBM更周期,但如果AI存储层级真正成型,NAND和HDD会从“被遗忘的周期品”重新进入AI基建叙事。


3.A股链条:技术收租、模组弹性、分销库存


可以把A股存储标的分成一个光谱:


类型代表特征
技术收租型澜起科技DDR5接口、服务器内存生态,周期敞口相对低
模组与品牌型江波龙、佰维存储受益涨价和库存,但也承担库存反转风险
分销弹性型香农芯创上行期弹性大,退潮时风险也最大
国产替代底层长鑫存储、长江存储等高端HBM仍有差距,中低端可能吃到结构性外溢


这组标的不能只看“存储涨价”。要看它吃的是技术租金、库存收益、品牌渠道,还是国产替代。


八、未来空间:不是一个HBM,而是一整套AI存储系统


存储的未来空间不能只用HBM TAM来算。


更完整的AI存储TAM应该包括:


AI存储TAM=HBM+服务器DRAM+SOCAMM/CXL Memory+企业级SSD+高容量HDD/对象存储+存储控制器/接口芯片+数据中心存储系统软件与缓存层


HBM是最亮的那一层,因为它最稀缺、毛利率最高、和GPU绑定最紧。但从长期看,AI推理和Agent化会把需求扩散到整个存储金字塔。


可以把未来分成三个阶段:


2025-2026:HBM与DDR5供给紧张


主要交易HBM、服务器DRAM、DDR5、eSSD涨价。原厂利润率快速修复,市场开始从周期股估值切向成长股估值。


2027:长协兑现与供需最紧窗口


这一年要看两个变量:


•大客户长协价格能不能维持;


•Samsung/Micron/SK hynix的新增HBM产能和良率能不能快速释放。


如果需求继续强,2027可能是利润最厚的年份之一。若供给追上或CAPEX放缓,股价可能提前反映反转。


2028以后:真正分水岭


到2028年,市场会重新问:


•HBM是否仍然紧缺?


•AI Agent是否形成真实收入?


•eSSD/ICMS/长上下文是否成为新增增长曲线?


•中国和Samsung的供给是否压低价格?


•存储厂商资本开支是否导致新一轮过剩?


如果答案偏多头,存储会继续作为AI基建成长股定价。


如果答案偏空头,它会重新回到传统周期股。


九、最需要跟踪的10个指标


做存储投资,不能只看股价和现货价。真正重要的是这些指标:


1.云厂商CAPEX指引:Microsoft、Google、Amazon、Meta、Oracle是否继续上调AI基建预算。


2.AI收入兑现:云AI收入、模型API收入、企业Agent付费是否跟上资本开支。


3.HBM规格升级:HBM3E、HBM4、HBM4E的容量、带宽、功耗、客户认证。


4.HBM长协:是否有预付款、最低价格、锁量条款。


5.Samsung良率追赶:一旦追上,供给格局会变化。


6.Micron HBM4放量:决定美股MU能否继续拿成长股叙事。


7.SK hynix毛利率和现金流:判断当前超额利润是否可持续。


8.DDR5/eSSD合约价:比零散现货价更能反映企业客户真实采购。


9.库存变化:模组厂和分销商库存一旦失控,周期反转会很快。


10.算法效率突破:KV cache压缩、MLA、稀疏化如果大规模进入生产,会改变需求斜率。


十、结论:为什么“永远说存储”


因为AI的每一次能力升级,都会把更多压力推给存储系统。


模型更大,需要更多HBM。


上下文更长,需要更多KV cache。


Agent更多步,需要更多中间状态。


RAG更普及,需要更多企业级SSD。


多模态数据更多,需要更多数据湖。


用户更多,需要更高并发和更大内存池。


效率提高,又会打开更多使用场景。


这就是存储的核心叙事:


它不是AI产业链里的边角料,而是AI从演示走向真实生产力之后,最基础、最容易被低估、也最容易周期性爆发的瓶颈之一。


但投资上不能只讲故事。


存储最好的机会,往往出现在市场还把它当周期股、但基本面已经开始呈现成长股特征的时候。最危险的阶段,则是所有人都开始把它当成长股,而供给、库存、算法效率和CAPEX已经悄悄转向的时候。


最后的判断:存储不是永久成长股,但AI让它拥有了比过去更长、更高、更复杂的一轮周期。真正要赚的钱,不是“存储涨价”四个字,而是理解这一轮周期被AI拉长了多久,以及市场当前到底给了几年的定价。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。