就在3月24日当地时间,谷歌研究院扔出了一个让不少行业人士感到意外的新算法。这一举措引起了全球存储芯片股的集体跳水,市场一片慌乱。很多人误以为AI内存需求要面临革命性变革,甚至认为AI硬件行业要完了。然而,我得告诉你,这其实是一次过度解读,根本不存在所谓的真危机。 谷歌发布的TurboQuant算法主要作用于AI对话时的缓存优化。就像给办公桌做智能收纳一样,它能把乱七八糟的内容码得整整齐齐。官方数据显示,在不影响回答准确性的前提下,这个算法能将AI缓存占用压缩到原来的六分之一,推理速度最快提升8倍。有些人担心压缩后AI会变傻,但事实证明这是多余的担忧。 通过极坐标变换和消除偏差,谷歌解决了老算法本身占用内存的问题。实测证明,在NVIDIA H100高端显卡上运行4比特版本,速度比传统32位版本快了8倍。而且这个算法通用性很强,不需要额外训练就可以直接使用。很多人把它当成了影响整个内存芯片市场的大事件,这是个大误区。 我们必须弄清楚这个算法到底管什么用。它优化的只是推理环节的临时缓存空间,跟AI训练所需的大算力没有任何关系。换句话说,它解决的是临时办公桌上的草稿纸问题,并没有动到家里冰箱里的食材数量。 这个行业里有个挺有意思的规律叫杰文斯悖论。简单来说,技术越高效、使用成本越低,需求反而会增加。燃油车就是一个很好的例子,省油技术让人们开车更随意了。同样的道理也适用于AI和半导体行业。 谷歌这个算法把内存使用成本降低了6倍。以前因为太贵而做不出来的应用现在都能落地了。比如跟AI聊几万字不断片、手机本地装大模型等应用会变得更加常见。这些新应用带来了更多需求,反而推动了半导体行业的发展。 DeepSeek发布的时候也有过类似情况,大家都在恐慌会不会影响需求结果应用爆发反推高硬件需求。这次也是如此短期恐慌反应过头罢了。 摩根士丹利这些权威机构早就出来解释了这件事过于夸张。谷歌对比的是老旧的32位模型而现在行业普遍使用4位量化压缩技术所以实际性能提升没有那么大关键是它根本不会影响高端内存需求也碰不到训练环节的算力碰不到核心需求所以瞎恐慌没有必要。 内存帕金森定律也能佐证这个判断节省下来的内存不会被闲置反而会被更长对话和更复杂推理消耗掉所以需求只会变多不会变少。 摩根士丹利重申对美光、闪迪等企业增持评级说这个算法会调整AI部署成本长期来看对半导体硬件是中性偏正面的不会出现大幅下降情况所以这次短期大跌纯属市场误读加上情绪宣泄造成的乌龙根本没有实打实的行业逻辑支撑慌慌张张抛售股票的投资者搞不好反而错过了一个长期布局的好机会真要说有风险也不是技术进步节省了需求而是技术没有突破打不开更多应用场景所以该操心的是应用落不了地的问题参考资料:第一财经《谷歌新算法引发存储芯片板块波动》。