2026-06-10 13:30

为什么说“永远缺存储”：AI 时代的存储叙事与投资逻辑

许良©

本文来自微信公众号：业界良新，作者：许良

一、为什么AI讲到最后，总会回到存储

过去两年，市场讨论AI基建，先是盯GPU，后来盯电力，再后来盯光通信、液冷、变压器、数据中心REIT。

但只要继续往系统内部拆，最终都会回到同一个问题：

模型可以更大，推理可以更多，Agent可以更复杂，但这些能力都必须落在一个真实的物理系统里：数据要被存下来、搬过去、读出来、再写回去。

这就是为什么近期“存储”会成为AI投资里的核心叙事。

这里说的存储，不是狭义的硬盘，也不只是消费电子里的内存条，而是一整套AI存储层级：

层级	对应产品	AI里的作用
最热层	HBM	放在GPU旁边，承担模型执行、热KV cache、高带宽数据交换
热层	DDR5/LPDDR/SOCAMM/CXL Memory	承担CPU侧调度、长上下文扩展、多Agent编排
温层	企业级SSD/高IOPS NAND	承担持久化KV cache、向量数据库、RAG检索、训练数据读取
冷层	HDD/对象存储	存训练语料、日志、归档、多模态数据湖

AI的本质不是只做一次矩阵乘法。真正进入应用后，它会变成持续的token工厂：每一次用户请求、每一轮工具调用、每一次检索、每一个Agent的中间状态，都会制造新的读写需求。

所以，算力是发动机，电力是燃料，光通信是道路，存储则同时是油箱、输油管、仓库和工作台。少了它，GPU再贵也只能空转。

二、“倍数公式”：存储需求为什么会被放大很多倍

可以用一个简化公式理解AI存储需求：

AI存储需求≈模型权重+KV cache+并发用户数+上下文长度+Agent步数+RAG/向量库检索数据+训练与日志留存-算法压缩效率

如果写成乘数模型，大致是：

总存储压力=基础模型规模×上下文倍数×并发倍数×Agent步数×检索倍数÷压缩效率

这个“倍数理论”：单个变量看起来只是几倍增长，但多个变量相乘后，结果会非常夸张。

比如：

•模型从70B走向数百B/MoE/多模型协同，不只是权重变大，调度和缓存也变复杂；

•上下文从8K、32K走向128K、1M token，KV cache线性增长；

•用户从少数开发者变成企业员工、客服、代码Agent、搜索入口，推理并发增长；

•一次请求从“一问一答”变成Agent多步执行，可能调用搜索、代码、数据库、浏览器、工具链；

•RAG不只是读一段文本，而是访问向量库、文档库、历史日志、图像、视频、代码仓库。

KV cache可以更直观地算：

KV cache bytes=2×层数×KV heads×head_dim×bytes_per_element×context_tokens×batch/concurrency

以一个70B级、使用GQA的模型粗算，假设80层、8个KV heads、head_dim 128、BF16：

每个token的KV cache=2×80×8×128×2 bytes≈0.31 MB 128K上下文的一条会话≈40 GB KV cache 1000条并发长上下文会话≈40 TB热KV cache

这还只是热缓存，没有算模型权重、激活、检索库、日志、训练数据和冗余备份。

所以，AI对存储的需求不是“用户多一点，硬盘多一点”这种线性关系，而是多个维度同时放大。Micron在2026年COMPUTEX资料里也给过一个方向性判断：AI context length正在快速上升，服务器内存容量也在显著提高。换句话说，系统瓶颈正在从“能不能算”扩展到“能不能记住、读得够快、搬得够快”。

三、为什么压缩技术不一定是存储利空

市场经常会因为某个新技术路线创新，比如KV cache压缩、稀疏注意力、MLA、量化技术而恐慌：既然效率提高了，存储是不是就不需要那么多了？

短期看，压缩当然会降低单位token的存储成本。

但长期看，这件事更接近杰文斯悖论：

当一种资源的使用效率提高，最终结果不一定是总需求下降，反而可能是使用场景被打开，总消耗继续上升。

燃油车更省油后，人们不一定少开车，而是可能开得更远。AI也是一样：

•KV cache压缩4倍，产品经理可能立刻把上下文开到原来的4倍；

•推理成本下降，企业会把更多工作流交给Agent；

•模型响应更快，用户会增加调用频次；

•过去“不经济”的长文档、长视频、代码仓库、企业知识库分析，会变成可用场景。

所以，效率提升真正改变的是“单位成本”和“应用边界”，不是简单消灭需求。只有当算法效率提升速度长期大于使用量、上下文、并发、Agent步数的乘积增长时，存储需求才会被真正压制。

这也是存储投资里最关键的判断：

如果：使用量增长×上下文增长×Agent步数增长>算法压缩效率提升那么：存储需求继续扩张如果：算法效率突然大幅领先，同时AI应用变现放缓那么：存储重新回到周期股逻辑

四、这一轮存储周期，和过去PC/手机周期有什么不同

传统存储是典型周期股。

过去的需求主要来自PC、手机、服务器换机。行业逻辑很简单：

1.价格上涨；

2.厂商扩产；

3.供给过剩；

4.价格下跌；

5.厂商减产；

6.下一轮周期重来。

这套逻辑没有消失，但AI改变了三个变量。

1.需求从消费电子变成基础设施投资

PC和手机需求受换机周期影响，弹性有限。但AI数据中心更像能源、电网、云基础设施建设，云厂商会提前多年锁定产能。

2.HBM不是普通DRAM

HBM的难点不只是多堆几层DRAM die，而是TSV、先进封装、良率、客户认证、GPU平台协同。

普通DRAM可以更接近大宗商品，但HBM更像绑定AI加速器平台的关键组件。客户不是临时去现货市场买一批就能用，而是要提前认证、锁产能、签长协。

更重要的是，HBM会占用先进DRAM wafer和封装产能。高端HBM吃掉产能后，普通DDR5、服务器DRAM也会变紧。这就是“高端短缺外溢到低端”的传导。

3.NAND也被AI重新激活

过去NAND最大的问题是容易过剩，技术扩产快，价格弹性大。但AI推理和Agent系统带来了新的eSSD需求：

•向量数据库；

•RAG检索；

•持久化KV cache；

•多模态数据湖；

•高频随机访问；

•AI PC/车端本地缓存。

TrendForce在2026年1月的报告中提到，AI Agent、RAG和高随机访问模式正在提高企业级SSD需求，并预计2026年DRAM和NAND市场收入都将大幅增长，合约价上涨趋势可能延续到2027年。

所以，这一轮不是单一产品涨价，而是HBM、服务器DRAM、SOCAMM、eSSD、HDD数据湖一起进入AI存储层级。

五、当前存储叙事：从“卖芯片”变成“卖AI记忆能力”

存储行业的估值变化，核心不是因为价格涨了，而是市场开始相信：

存储不再只是周期品，而是AI基础设施里的战略资产。

这轮叙事的完整链条是：

AI应用增长→token产量增长→上下文和Agent步数增长→KV cache/RAG/数据湖需求增长→HBM、DRAM、eSSD、HDD同时吃紧→存储厂商签长协、涨价、提升产品mix→利润率和现金流非线性改善→市场开始讨论周期股向成长股重估

这也是为什么这轮存储股涨起来以后，市场争论的不是“今年赚多少钱”，而是“这些利润能维持几年”。

六、周期股还是成长股：正确答案可能是“周期成长股”

把存储简单归类为周期股，可能会错过这一轮AI基建带来的结构性重估。

但把存储直接当成软件成长股，也很危险。

更合理的定义是：

存储是被AI拉长景气周期、提高利润中枢、但仍然无法摆脱资本开支周期的周期成长股。

多头为什么愿意给更高估值

多头押的是三件事：

第一，HBM供给瓶颈不是一年能解决。

晶圆、先进封装、良率、客户认证、平台适配，都有物理周期。

第二，AI推理从训练走向Agent后，存储需求不是下降，而是扩散。

训练重HBM，推理重KV cache，Agent重长上下文和检索，企业应用重eSSD和数据湖。

第三，长协和预付款改变了周期波动。

如果大客户提前锁定产能，甚至通过战略协议、预付款、最低价格条款来保障供应，存储厂商的收入能见度会高于传统周期。

空头为什么仍然不能忽视

空头也不是没有道理。

第一，存储行业历史上每次都有人说“这次不一样”。

但只要供给起来、需求放缓、库存堆积，价格还是会下跌。

第二，算法效率是真变量。

MLA、稀疏化、KV cache压缩、MoE、端侧小模型，如果共同压低单位存储需求，会改变需求斜率。

第三，云厂商CAPEX不是无限的。

如果AI应用变现跟不上资本开支，2027-2028年云厂商可能放缓服务器采购。

第四，竞争会重新均衡。

SK hynix、Micron、Samsung都在扩HBM，Samsung良率追赶、Micron HBM4放量、中国厂商在中低端DRAM/NAND继续推进，都会改变价格预期。

所以，存储的投资难点不是判断“好不好”，而是判断：

这一轮超额利润能维持几年？市场现在按几年定价？供给释放和需求放缓谁先到？

七、投资地图：不同标的吃到的是不同的钱

存储链不能混在一起看。不同公司吃到的是不同利润池。

1.全球原厂：SK hynix/Micron/Samsung

这是最核心的HBM和高端DRAM供给方。

•SK hynix：HBM先发优势最强，利润率已经证明AI存储的极端弹性；

•Micron：美股里最直接的存储原厂表达，HBM4、数据中心SSD、SOCAMM2都在强化AI存储平台叙事；

•Samsung：一旦HBM良率和客户认证追上，可能带来供给再均衡，也可能分享更大市场。

投资上，这组标的是“原厂定价权”的表达。

2.NAND/SSD/HDD：AI数据湖和冷温层

如果HBM是热层，eSSD和HDD则是温层与冷层。

AI Agent、RAG、多模态训练、日志留存，会继续吃企业级SSD和大容量硬盘。这里的逻辑比HBM更周期，但如果AI存储层级真正成型，NAND和HDD会从“被遗忘的周期品”重新进入AI基建叙事。

3.A股链条：技术收租、模组弹性、分销库存

可以把A股存储标的分成一个光谱：

类型	代表	特征
技术收租型	澜起科技	DDR5接口、服务器内存生态，周期敞口相对低
模组与品牌型	江波龙、佰维存储	受益涨价和库存，但也承担库存反转风险
分销弹性型	香农芯创	上行期弹性大，退潮时风险也最大
国产替代底层	长鑫存储、长江存储等	高端HBM仍有差距，中低端可能吃到结构性外溢

这组标的不能只看“存储涨价”。要看它吃的是技术租金、库存收益、品牌渠道，还是国产替代。

八、未来空间：不是一个HBM，而是一整套AI存储系统

存储的未来空间不能只用HBM TAM来算。

更完整的AI存储TAM应该包括：

AI存储TAM=HBM+服务器DRAM+SOCAMM/CXL Memory+企业级SSD+高容量HDD/对象存储+存储控制器/接口芯片+数据中心存储系统软件与缓存层

HBM是最亮的那一层，因为它最稀缺、毛利率最高、和GPU绑定最紧。但从长期看，AI推理和Agent化会把需求扩散到整个存储金字塔。

可以把未来分成三个阶段：

2025-2026：HBM与DDR5供给紧张

主要交易HBM、服务器DRAM、DDR5、eSSD涨价。原厂利润率快速修复，市场开始从周期股估值切向成长股估值。

2027：长协兑现与供需最紧窗口

这一年要看两个变量：

•大客户长协价格能不能维持；

•Samsung/Micron/SK hynix的新增HBM产能和良率能不能快速释放。

如果需求继续强，2027可能是利润最厚的年份之一。若供给追上或CAPEX放缓，股价可能提前反映反转。

2028以后：真正分水岭

到2028年，市场会重新问：

•HBM是否仍然紧缺？

•AI Agent是否形成真实收入？

•eSSD/ICMS/长上下文是否成为新增增长曲线？

•中国和Samsung的供给是否压低价格？

•存储厂商资本开支是否导致新一轮过剩？

如果答案偏多头，存储会继续作为AI基建成长股定价。

如果答案偏空头，它会重新回到传统周期股。

九、最需要跟踪的10个指标

做存储投资，不能只看股价和现货价。真正重要的是这些指标：

1.云厂商CAPEX指引：Microsoft、Google、Amazon、Meta、Oracle是否继续上调AI基建预算。

2.AI收入兑现：云AI收入、模型API收入、企业Agent付费是否跟上资本开支。

3.HBM规格升级：HBM3E、HBM4、HBM4E的容量、带宽、功耗、客户认证。

4.HBM长协：是否有预付款、最低价格、锁量条款。

5.Samsung良率追赶：一旦追上，供给格局会变化。

6.Micron HBM4放量：决定美股MU能否继续拿成长股叙事。

7.SK hynix毛利率和现金流：判断当前超额利润是否可持续。

8.DDR5/eSSD合约价：比零散现货价更能反映企业客户真实采购。

9.库存变化：模组厂和分销商库存一旦失控，周期反转会很快。

10.算法效率突破：KV cache压缩、MLA、稀疏化如果大规模进入生产，会改变需求斜率。

十、结论：为什么“永远说存储”

因为AI的每一次能力升级，都会把更多压力推给存储系统。

模型更大，需要更多HBM。

上下文更长，需要更多KV cache。

Agent更多步，需要更多中间状态。

RAG更普及，需要更多企业级SSD。

多模态数据更多，需要更多数据湖。

用户更多，需要更高并发和更大内存池。

效率提高，又会打开更多使用场景。

这就是存储的核心叙事：

它不是AI产业链里的边角料，而是AI从演示走向真实生产力之后，最基础、最容易被低估、也最容易周期性爆发的瓶颈之一。

但投资上不能只讲故事。

存储最好的机会，往往出现在市场还把它当周期股、但基本面已经开始呈现成长股特征的时候。最危险的阶段，则是所有人都开始把它当成长股，而供给、库存、算法效率和CAPEX已经悄悄转向的时候。

最后的判断：存储不是永久成长股，但AI让它拥有了比过去更长、更高、更复杂的一轮周期。真正要赚的钱，不是“存储涨价”四个字，而是理解这一轮周期被AI拉长了多久，以及市场当前到底给了几年的定价。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技