英伟达的老板黄仁勋这回跟大家聊了人工智能到底该怎么走。他把重点放在了软件生态和硬件创新得一起搞上去。现在全球都在搞人工智能,算力这玩意儿该咋搭、产业能活得久才是最要紧的事。黄仁勋这次在公开场合说的话,能帮咱们看清这里面的技术门道和商业逻辑。他说了个新名词,叫“Token经济学”,以后咱们主要看每瓦、每美元能生出多少Token。这就好比说,不光看芯片参数,还得看软件到底值不值得养一辈子。以前光拼硬件多厉害那是不行的,现在软件生态的长期价值才是大头。英伟达坚持统一内存架构还有软件栈的策略,虽然刚开始买芯片可能贵点,但是能防止软件用着用着就散架了。这种做法好就好在,一旦你优化了一个软件栈,全球所有用这套架构的机器都能变快,长期来看总拥有成本(TCO)就低了。这其实是从卖芯片变成了卖整个体系、卖生态的打法,强调了持续在软件上投钱才能让硬件的潜力全发挥出来。 产业能火不光靠大厂也得靠大家一起搞开源。黄仁勋透露说,现在开源模型生成的Token量已经占了全球的四分之一。这增长速度快得有点意外,这就让人工智能从以前只能用在大云中心这种大场面,很快就渗透进了普通企业的本地机房里。开源让门槛变低了、创新也变快了,跟那些商业化的方案一起推着人工智能往下走。 以后的算力需求会越来越大、越来越复杂,光搞硬件平台革新是不够的。黄仁勋细说了他们的新一代Vera Rubin平台是怎么突破的。这个平台用了个托盘式的架构,机器在干活的时候直接就能把关键的连接线换掉修坏的地方,不用像以前那样整个机器都得停掉才能修。这种设计特别厉害,能让单个节点的组装时间从几小时直接缩短到几分钟。这不仅把运维的难度和成本降下来了,还把供应链的反应速度给重新理顺了。而且它还能全液冷散热、不用一堆乱七八糟的线了,让机器更结实更稳当。 现在算力越上越大,电就不够用了。黄仁勋说电供不上成了最大的拦路虎。他讲现代的AI干活特别是算推理的时候会突然爆电,电流一下子能跳到25%那么多。为了防这一手数据中心得备一大堆电等着用不上也是浪费的。针对这个问题新一代平台在设计上做了改进能让电流波动变得平稳一些。就算单个显卡的功耗高达1800瓦整个系统对外显示出来的电力曲线也是平的。这样数据中心就能把电用得差不多是100%了不用为了防峰值而乱花钱买设备这对绿色高效建数据中心很有意义。 从说软件得养一辈子到夸开源功劳大再到介绍平台的新花样最后到破解供电难题黄仁勋把整个图景都画出来了这表明要想带好路光靠硬件指标突破没用还得有一套软硬配合稳定高效还环保的本事在大趋势下这种路子能给全球的数字经济加把劲。