北京时间3月6日,OpenAI终于放出了GPT-5.4。这玩意不光能推理、还能写代码,最大的卖点是直接接管电脑。官方直接把它定义成了“能力最强、效率最高的专业工作前沿模型”,意思就是这一步AI走向自主干活已经没跑了。 这家伙深度整合了GPT-5.3-Codex的编码能力,办公能力被彻底优化了。像做Excel表格、PPT演示文稿这些事儿它都能干,大大减少了咱们跟它打交道的成本。数据也很猛,事实准确性提升不少,比之前的GPT-5.2少出了33%的错误。多来源信息一整合,“大海捞针”都变得很容易。 这是OpenAI第一款能直接操作电脑的通用大模型,它能看懂屏幕上的画面,然后自己动手敲键盘、点鼠标。跨设备、跨应用干一些复杂的活儿它都能搞定,终于实现了从被动响应到主动执行的突破。它还能一口气记住100万token的上下文,让它能支撑那些长周期的任务,全程都能看着办。搜索工具也更快更准了。 在ChatGPT那一边,这次还多了个Thinking功能。用户在模型运行的时候就能看到它的思考过程,随时调整需求就行。网页检索能力也变强了,长文本也不卡了。目前网页版和安卓端都能用了,iOS版马上就来。 业内都说这东西太牛了,把操控电脑、超长上下文、强推理和编码能力全揉在一块儿了。这就相当于重构了AI干活的模式,肯定会大大影响办公、开发、内容生产这些场景。大家伙儿就等着看这个自主智能体时代怎么到来吧。