啊,昨天看了一篇文章,讲的是AI成本这块儿有个大新闻。NVIDIA搞了个Blackwell平台,结果AI的成本被砍到了原来的十分之一。Baseten、DeepInfra、Fireworks AI还有Together AI这些领先的推理服务商都在用它呢。它们通过在Blackwell平台上运行优化好的推理堆栈,帮各行业把每token的成本给降下来了。想想看,一次医疗诊断,游戏里的角色对话,或者客服系统自动解决问题,这些都是靠AI驱动的交互。说白了,这些智能交互其实就是在处理token。企业要想扩大这些服务范围,就得看看能不能承担更多的token成本。其实这个问题的关键就在tokenomics(Token经济学)上,就是得降低每个token的成本嘛。现在这个趋势在各行各业都挺明显的。麻省理工学院最近有个研究也发现了这个事儿,基础设施和算法效率的提升让前沿水平的推理成本正逐年下降呢。比如打印一篇文章吧,如果印刷机在油墨、能源还有设备上稍微加点投资,就能多产出10倍,那每页的成本自然就降下来了。同样的道理,在AI基础设施上投入资源就能带来远超预期的token产出,所以每个token的成本也就显著降低了。这就是为什么Baseten、DeepInfra、Fireworks AI还有Together AI这些服务商都选择用NVIDIA Blackwell平台。用了这个平台之后,它们把每个token的成本最多给压到了NVIDIA Hopper平台的十分之一。而且它们还托管了好多先进的开源模型呢。通过把开源前沿智能和NVIDIA Blackwell极致的软硬件协同设计融合在一起再加上自主优化的推理堆栈,这些服务商就帮着各行各业把token成本给大幅降低了。这个故事真挺有意思的吧?你可以去NVIDIA英伟达博客看看原文哦。