AMD与苹果盯上闪存,AI内存成本战打响
过去两年,AI产业链最赚钱的环节之一是内存。
从英伟达GPU到HBM高带宽内存,几乎所有大型模型训练和推理系统都在争夺有限的DRAM资源。SK海力士、美光和三星因此成为AI浪潮中的直接受益者,而云计算厂商和模型公司则承担着不断上涨的硬件成本。
但这种格局正在出现微妙变化。
据Citrini Research披露,AMD和苹果正在分别推进一项看似激进、实则颇具现实意义的技术路线:让闪存承担过去属于DRAM的一部分工作。
表面上看,这像是一场存储技术升级。实际上,它更像AI时代的一次成本革命。
长期以来,DRAM与NAND闪存分工明确。前者速度快但价格昂贵,后者容量大却存在明显延迟。AI训练阶段对性能极度敏感,因此行业普遍默认DRAM和HBM是不可替代的核心组件。
问题在于,生成式AI的发展方向正在发生变化。
当行业从训练大模型转向大规模部署AI Agent、边缘推理以及终端侧模型时,计算需求不再是唯一瓶颈。越来越多资源开始消耗在KV Cache(键值缓存)上,即模型在推理过程中保存上下文信息所需的存储空间。
对于拥有超长上下文窗口的模型而言,KV Cache甚至可能占据系统大量内存资源。
这意味着一个新的现实出现了:部分数据并不一定需要存放在最昂贵的DRAM中。
研究机构数据显示,目前HBM生产已经占据约25%的DRAM产能,而闪存成本仅相当于DRAM的约1/55。两者之间巨大的价格差距,让产业界开始重新思考内存架构。
AMD的动作颇具代表性。
该公司此前收购MEXT,核心目标之一就是优化闪存与计算系统之间的数据调度效率。对于AMD而言,挑战英伟达不仅是GPU性能竞争,更是整体系统成本竞争。如果能够利用更便宜的存储介质完成部分推理任务,那么单位Token成本将进一步下降。
苹果则走出了另一条路线。
其此前公开的“LLM in a Flash”研究项目,本质上是利用iPhone和Mac设备中的闪存资源来存储部分模型数据,通过智能调度减少对大容量DRAM的依赖。
这背后折射出苹果长期坚持的边缘AI逻辑。
相比云端推理,终端设备最大的限制往往不是算力,而是内存空间。苹果希望让更多模型运行在设备本地,而不是持续依赖云端服务。因此,如何充分利用现有闪存资源,直接关系到未来AI功能能否大规模落地。
更大的产业影响可能发生在数据中心之外。
如果控制器优化、NAND堆叠技术以及新型单元架构持续进步,闪存与DRAM之间的界限将变得模糊。未来AI系统可能形成分层内存体系:HBM负责极高速计算,DRAM承担核心缓存,闪存则负责大容量上下文存储。
类似的事情其实在云计算行业已经发生过一次。
过去企业级存储系统高度依赖昂贵的高性能硬盘,后来SSD逐渐取代传统机械硬盘成为主流。今天AI领域正在经历类似过程,只不过这次被重新定义的是内存市场。
当然,闪存短期内不可能彻底替代DRAM。
延迟、耐久性以及随机访问性能仍然存在天然差距。对于训练场景和实时计算任务,高性能内存依然不可或缺。
但产业竞争往往不是“完全替代”,而是“替代一部分”。
当AI推理规模持续扩张,每降低几个百分点的硬件成本,都可能对应数十亿美元级别的市场空间。AMD和苹果押注的,也许不是下一代存储介质,而是AI时代新的成本曲线。
在算力竞争逐渐白热化之后,谁能让AI变得更便宜,正在成为另一场更隐蔽的战争。





