大家都知道,以前动不动就烧好几亿美金的大模型算力需求已经成为常态,到了2026年,行业里开始掀起一股“降本”的热潮。就在2026年2月20日到21日这两天,OpenAI把千亿级别的算力目标给降了,谷歌还有智谱、MiniMax也在模型推理这块儿使劲儿“瘦身”,说明大家都在想办法让算力用得更划算。 具体来说,OpenAI向投资人透露了个新计划,把2030年的算力预算从“无上限”给砍到了大概6000亿美元。这就表明哪怕是领头羊,也意识到无限烧钱不可持续了,得去找更高效的用法。另外,Tata集团跟OpenAI联手在印度建了个AI数据中心,起步规模100MW,还打算扩建到1GW。这不仅是算力全球化,也是个信号:以后大家不想再自己单打独斗了,“共建”或者“租用”可能更省心。 再说算法这块儿,2月20日那天有个大新闻:谷歌的Gemini 3.1 Pro模型在ARC-AGI-2测试里拿到了77.1%的高分,性能直接飙到了上一代的两倍多。这就好比以前要跑半天的活儿现在几分钟就能搞定,成本自然就降下来了。港股那边的智谱和MiniMax因为这个消息股价大涨,市值都破了3000亿港元。这两家公司都开始招算力伙伴,说明大家不再只是买硬件了,“管算力”成了新本事。 对A股来说,这股风向意味着投资逻辑变了。过去咱们看谁卖GPU卖得好,现在得看谁能让这些硬件真正跑起来。像中科曙光、中科星图、中国软件这些做“修管道”的公司,价值正在超过单纯卖铲子的硬件商。还有就是“Agent”这种东西也越来越多出现,说明专门针对某个行业的大模型和优化方案才是未来的增长点。 至于技术上的难点,以后大家要面对的是异构算力怎么统一调度的问题。英伟达、AMD还有国产芯片堆在一起用的话,得有个中间件把它们变成统一的语言才行。另外“云-边-端”协同也很重要,推理不一定都在云端跑;边缘计算和Agent落地后,算力得像水一样在各个地方自由流动才行。最后就是绿色算力了,为了省电省电费,液冷、余热回收这些技术必须得搞起来。 总之2026年2月20日-21日的这些变化标志着云计算到了新阶段。当无限扩张的路走不通了,谁能管好算法和调度谁就能赢。那些在算力网络、异构计算还有绿色算力方面有技术底子的公司才是长期投资的好对象。这场“降本”的暗战才刚刚开始呢。