三星把HBM4E的电源网络大动干戈,打算把缺陷率大幅度压低,还试着能不能让GPU和HBM彻底分开。就在他们宣布全球首批HBM4正式出货没多久,还没到两周,三星就开始着手调整了。那会儿产品已经能在11.7 Gbps下稳稳当当跑,还留着冲刺13 Gbps的余量。现在架构升级到HBM4E了,单颗芯片上的供电焊凸点从13682个涨到了14457个,不过都挤在相同的封装面积里。布线更薄更密,电流密度和电阻都跟着上去了。结果就是内部电压在传输时掉得厉害,发热一叠加形成了恶性循环,不光性能受影响,电路还容易坏。 为了破局,三星直接拿电源网络开刀。在HBM基底芯片上,原来那个像蜂窝一样的集中式MET4电源块被拆成了四个小分区,上面的金属层也打散了。这一改动缩短了关键路径,缓解了拥堵。内部评估显示,缺陷发生率掉了97%,IR压降改善了41%,给芯片跑高速腾出了更多余量。 与此同时,三星还在琢磨把HBM和GPU拆开的物理方案。有个路子是用光信号互连,理论传输能力能到铜线的1000倍。就算不完全依赖光子技术,随着封装基板布线能力变强,它们之间的距离也有望拉开到5厘米以上。这能大大减轻高端AI卡上的散热压力。 有分析说,AI负载暴涨的时候,HBM供电和散热成了算力增长的瓶颈。三星这次对HBM4E的改动和对分离方案的探索,摆明了想在下次高端显存竞赛里抢个先手。这个消息最初是韩媒《韩国经济》和市调机构TrendForce透露的。