字节跳动发布豆包大模型2.0：多模态与长程推理能力升级推理成本显著下探

当前，大规模语言模型的迭代升级已成为全球科技竞争的焦点。字节跳动此次发布的豆包大模型2.0，正是此背景下的重要更新，说明了国内企业在基础模型研发上的持续推进。豆包2.0系列采用分层产品策略，面向不同应用场景进行针对性设计。其中，Pro版本主打深度推理与长链路任务执行，对标国际顶尖模型GPT-5.2和Gemini 3 Pro；Lite版本在性能与成本之间取得平衡，综合能力超过上一代主力产品豆包1.8；Mini版本聚焦低时延、高并发的成本敏感场景；Code版本则针对编程开发做了专项优化。这种分层设计更贴近企业与开发者的差异化需求，也提升了模型的适配性与落地效率。多模态理解能力上，豆包2.0实现整体升级。视觉推理、空间推理等关键任务上达到领先水平，豆包2.0 Pro在多项对应的基准测试中取得最高分。尤其在长视频分析领域，豆包2.0在多个评测中超过其他顶尖模型，支持实时视频流分析、环境感知与主动纠错，为健身指导、穿搭建议等陪伴类应用带来更多可能。在动态场景理解上，该模型在TVBench等评测中保持领先，并在EgoTempo基准上超过人类得分，显示其对时间序列与运动信息的理解能力已达到较高水平。推理与Agent能力上，豆包2.0 Pro在数学和编程任务中表现突出：在国际数学奥林匹克竞赛（IMO）、中国数学奥林匹克竞赛（CMO）和国际大学生程序设计竞赛（ICPC）中获得金牌成绩，在SuperGPQA基准上分数超过GPT-5.2，并在HealthBench上排名第一。这些结果表明其在复杂推理任务上具备较强能力。同时，豆包2.0 Pro在“人类的最后考试”（HLE-text）中取得54.2分的最高分，在工具调用、指令遵循等能力上也表现稳定，为复杂多步骤任务的执行提供支撑。成本优势也是豆包2.0的重要看点。在模型效果与业界顶尖产品接近的情况下，其token定价下降约一个数量级。对需要大规模推理和长链路生成的复杂任务来说，成本下降将直接降低企业和开发者的使用门槛，并有望加快商业化落地。豆包2.0 Code版本面向编程场景进行专项增强，提升了代码库理解与应用生成能力，与字节跳动AI编程产品TRAE结合使用效果更佳，有望更提高开发效率。目前，豆包2.0 Pro已在豆包App、电脑端和网页版上线，用户可通过“专家”模式体验；豆包2.0 Code已接入TRAE；火山引擎也面向企业与开发者提供豆包2.0系列模型的API服务，便于集成到各类应用中。

在全球人工智能产业格局加速重塑的阶段，豆包大模型2.0的发布不仅展示了中国企业在前沿技术上的研发能力，也体现出从单点能力提升到产品与生态联合推进的思路。当技术迭代与产业需求形成更紧密的反馈循环，“技术赋能实体经济”也将获得更清晰、更可复制的落地路径。（完）

字节跳动发布豆包大模型2.0：多模态与长程推理能力升级 推理成本显著下探

字节跳动发布豆包大模型2.0：多模态与长程推理能力升级推理成本显著下探