当前,算力基础设施加速向大模型训练与推理场景倾斜,存储与内存系统正成为影响整体性能、能耗与成本的关键环节。
随着GPU等加速器规模化部署,单纯依靠计算能力堆叠已难以持续拉动系统效率提升,带宽瓶颈、数据搬运开销以及机架级能耗压力日益突出。
在此背景下,存储器厂商围绕“更高带宽、更大容量、更低功耗”的竞赛持续升温,HBM与高密度NAND成为产业关注焦点。
问题在于,面向大规模并行计算的AI服务器,对高带宽内存的依赖显著增强。
模型参数规模扩大、上下文长度增长与多卡互联带来的数据吞吐需求,使得加速器端“喂数”效率直接决定训练速度与推理时延。
同时,数据中心侧对企业级固态硬盘容量的需求持续攀升,既要承载海量训练数据与特征库,也要应对推理阶段不断增长的向量检索与日志数据存储,容量扩张与成本控制形成双重约束。
造成上述矛盾的原因,一方面在于AI工作负载的结构性变化。
训练环节对带宽与并发访问极为敏感,推理环节则更强调时延与能效;二者叠加使得内存与存储系统必须兼顾性能与电力预算。
另一方面,数据中心建设节奏加快,运营方更加关注单位机架产出与全生命周期成本,促使产业链从芯片、封装到系统方案协同优化。
由此,高带宽内存向更高堆叠层数、更大容量演进,NAND闪存则以更高层数与更高密度提升单盘容量,成为必然方向。
在本届CES 2026上,SK海力士拟首次展示16层48GB HBM4,并同步呈现此前已实现较高传输速率的12层36GB HBM4的后续研发路径,释放出HBM4产品持续迭代的信号。
与此同时,公司还将展示12层36GB HBM3E及其在全球客户AI服务器GPU模组中的应用,意在强调HBM3E在现实部署中的可用性与规模化价值。
除HBM路线外,其面向AI服务器的低功耗内存模组SOCAMM2、以及针对端侧场景优化的LPDDR6亦被纳入重点展示范围,体现从数据中心到终端的多层次布局。
在存储侧,321层2Tb QLC NAND产品瞄准超高容量企业级固态硬盘需求增长,意在通过密度提升缓解“容量—成本”矛盾。
上述动作的影响将体现在三个层面:其一,HBM4向更高层数、更大容量的推进,有望为下一代加速器平台提供更充裕的显存容量与更可观的带宽空间,从而改善训练与推理的吞吐表现,并有助于降低同等性能目标下的系统复杂度。
其二,HBM3E与客户GPU模组的联合展示,体现产业从单一器件性能竞争转向“器件—封装—系统”联动验证,供应链稳定性与交付节奏将成为新一轮竞争要点。
其三,高层数QLC NAND面向企业级应用的导入,可能推动数据中心存储向更高容量密度演进,但也对可靠性管理、写入寿命优化与控制器算法提出更高要求,产业需在性能、耐久与成本之间寻找平衡点。
对策层面,产业链下一步的发力方向或将集中在协同优化与标准化推进:一是围绕HBM的封装与热设计加强工程化能力,以适配更高堆叠带来的散热与良率挑战;二是在服务器平台层面提升内存、互联与软件栈的协同效率,减少数据搬运、提升有效带宽利用率;三是在企业级NAND应用中强化固件算法、磨损均衡与纠错策略,完善质量与验证体系,以支撑QLC在高容量场景的规模化部署。
同时,能效指标将成为产品竞争的重要维度,低功耗模组与端侧优化内存的展示,也表明“性能提升不以能耗失控为代价”的行业共识正在形成。
前景来看,随着AI基础设施投资保持高位,HBM与高密度NAND的需求仍将维持增长态势。
短期内,HBM3E在既有平台的导入与供给保障将继续影响市场格局;中长期看,HBM4的成熟度、量产节奏以及与下一代加速器平台的适配情况,将成为决定竞争位势的关键变量。
与此同时,数据中心存储将更趋向“高容量、分层化、面向负载优化”的路线演进,QLC在企业级场景的应用范围可能进一步扩大,但是否能在更复杂的写入负载下实现稳定表现,仍需时间检验与生态配合。
SK海力士的此次技术突破不仅是存储器领域的重大进步,更是全球半导体产业发展的重要节点。
在人工智能与高性能计算深度融合的今天,技术创新已成为推动行业发展的核心动力。
未来,随着更多企业加入这一赛道,全球半导体产业将迎来更加激烈的竞争与更广阔的发展前景。