AMD与苹果盯上闪存，AI内存成本战打响

当前位置：首页-最新资讯-详情

AMD与苹果盯上闪存，AI内存成本战打响

2026-06-16

过去两年，AI产业链最赚钱的环节之一是内存。

从英伟达GPU到HBM高带宽内存，几乎所有大型模型训练和推理系统都在争夺有限的DRAM资源。SK海力士、美光和三星因此成为AI浪潮中的直接受益者，而云计算厂商和模型公司则承担着不断上涨的硬件成本。

但这种格局正在出现微妙变化。

据Citrini Research披露，AMD和苹果正在分别推进一项看似激进、实则颇具现实意义的技术路线：让闪存承担过去属于DRAM的一部分工作。

表面上看，这像是一场存储技术升级。实际上，它更像AI时代的一次成本革命。

长期以来，DRAM与NAND闪存分工明确。前者速度快但价格昂贵，后者容量大却存在明显延迟。AI训练阶段对性能极度敏感，因此行业普遍默认DRAM和HBM是不可替代的核心组件。

问题在于，生成式AI的发展方向正在发生变化。

当行业从训练大模型转向大规模部署AI Agent、边缘推理以及终端侧模型时，计算需求不再是唯一瓶颈。越来越多资源开始消耗在KV Cache（键值缓存）上，即模型在推理过程中保存上下文信息所需的存储空间。

对于拥有超长上下文窗口的模型而言，KV Cache甚至可能占据系统大量内存资源。

这意味着一个新的现实出现了：部分数据并不一定需要存放在最昂贵的DRAM中。

研究机构数据显示，目前HBM生产已经占据约25%的DRAM产能，而闪存成本仅相当于DRAM的约1/55。两者之间巨大的价格差距，让产业界开始重新思考内存架构。

AMD的动作颇具代表性。

该公司此前收购MEXT，核心目标之一就是优化闪存与计算系统之间的数据调度效率。对于AMD而言，挑战英伟达不仅是GPU性能竞争，更是整体系统成本竞争。如果能够利用更便宜的存储介质完成部分推理任务，那么单位Token成本将进一步下降。

苹果则走出了另一条路线。

其此前公开的“LLM in a Flash”研究项目，本质上是利用iPhone和Mac设备中的闪存资源来存储部分模型数据，通过智能调度减少对大容量DRAM的依赖。

这背后折射出苹果长期坚持的边缘AI逻辑。

相比云端推理，终端设备最大的限制往往不是算力，而是内存空间。苹果希望让更多模型运行在设备本地，而不是持续依赖云端服务。因此，如何充分利用现有闪存资源，直接关系到未来AI功能能否大规模落地。

更大的产业影响可能发生在数据中心之外。

如果控制器优化、NAND堆叠技术以及新型单元架构持续进步，闪存与DRAM之间的界限将变得模糊。未来AI系统可能形成分层内存体系：HBM负责极高速计算，DRAM承担核心缓存，闪存则负责大容量上下文存储。

类似的事情其实在云计算行业已经发生过一次。

过去企业级存储系统高度依赖昂贵的高性能硬盘，后来SSD逐渐取代传统机械硬盘成为主流。今天AI领域正在经历类似过程，只不过这次被重新定义的是内存市场。

当然，闪存短期内不可能彻底替代DRAM。

延迟、耐久性以及随机访问性能仍然存在天然差距。对于训练场景和实时计算任务，高性能内存依然不可或缺。

但产业竞争往往不是“完全替代”，而是“替代一部分”。

当AI推理规模持续扩张，每降低几个百分点的硬件成本，都可能对应数十亿美元级别的市场空间。AMD和苹果押注的，也许不是下一代存储介质，而是AI时代新的成本曲线。

在算力竞争逐渐白热化之后，谁能让AI变得更便宜，正在成为另一场更隐蔽的战争。

欧易

您数字货币与 Web3的直通车