OPPO与联发科技联合发布端侧全模态模型 手机AI交互迈入新阶段

问题:从“能对话”走向“懂场景”,移动终端智能化面临新门槛。近年来,智能应用加速普及,但不少能力仍高度依赖网络与云端算力:无网、弱网环境下,响应变慢、服务中断、隐私担忧等问题更为明显。同时,传统的单一模态交互在复杂场景中的理解力有限,难以满足用户对“所见即所得、所处即理解”的自然交互期待。如何将更多感知、理解与交互放到端侧完成,成为产业升级的关键方向。 原因:算力平台迭代与算法工程化能力提升,为端侧多模态落地创造了条件。在MWC 2026上亮相的端侧全模态Omni模型,由OPPO与联发科技联合开展技术预研并进行展示。据介绍,该模型面向手机端侧实现多模态融合的理解与交互,支持语音、视频、文本等输入,可进行实时环境描述与实景问答,增强终端对周遭物理世界的感知与理解能力。OPPO研究院院长廖劲松在发布会上表示,端侧智能计算是其涉及的战略的重要支撑,目标是让智能能力转化为用户可直接感知的终端体验。业内人士认为,这背后既有手机SoC在NPU能力、能效与端侧推理优化上的持续进步,也离不开厂商在模型压缩、部署以及多任务协同等工程环节的积累。 影响:端侧能力增强,有望重新划定“体验、成本与安全”的边界。其一,在体验上,端侧推理减少对网络链路的依赖,降低交互时延,让实时场景理解更稳定。其二,在成本与效率上,更多任务在本地完成,可缓解云端资源与带宽压力,推动服务覆盖更多高频场景。其三,在安全与隐私上,端侧完成数据处理与推理可减少数据外传需求,更契合全球数据合规与个人信息保护的趋势。同时,端侧多模态也提高了对芯片算力、功耗控制与系统调度的要求,行业竞争将从单点功能转向“软硬协同、系统级体验”的综合比拼。 对策:以旗舰平台协同为抓手,推动端侧能力从展示走向规模化应用。发布会上披露,依托联发科技天玑9500芯片NPU的算力支持,OPPO自研端侧翻译与端侧补光等功能在体验上继续向云端能力靠拢,并计划随ColorOS 16系统更新推送至OPPO Find X9系列。端侧翻译上,功能基于端侧大模型实现升级,文本翻译准确率较传统模型平均提升15%,支持多语种互译;无网或弱网情况下仍可稳定输出,面向更完整的全场景翻译体验。端侧补光上,聚焦移动影像的光影呈现,通过分析并重塑画面光线,暗光、逆光等复杂条件下提升人像照片的自然立体效果,同时降低对网络环境的依赖。业内认为,这类能够在端侧持续高频使用的能力,更能体现端侧智能的商业价值:既提升用户体验,也推动系统、芯片与应用生态形成更紧密的协同优化。 前景:端侧全模态或成为下一阶段终端交互的重要入口,关键在于标准化与生态化落地。随着端侧多模态理解与交互能力增强,手机有望从“被动响应指令”走向“主动理解场景并给出建议”,带来更自然的人机交互。未来竞争焦点可能集中在三上:一是端侧模型在不同应用场景中的泛化能力与可控性;二是功耗、热管理与性能稳定性的平衡;三是围绕多模态数据的安全治理与合规设计。展会信息显示,OPPO Find X9 Pro入围本届MWC GLOMO Awards“最佳智能手机”奖项评选,反映出国际市场对终端创新方向的持续关注。业内预计,随着芯片平台持续演进和系统级优化深化,端侧多模态能力将加速从旗舰机型扩展到更多产品层级,并带动应用开发、影像创作、跨语言沟通等领域出现新的体验形态。

端侧全模态智能模型的亮相,不只是一次技术展示,也折射出移动智能产业的发展重心正在变化。当智能能力从云端更多转向终端,当感知、理解与交互在本地形成闭环,移动设备与用户的关系将被重新定义。变革已经开启,而技术落地的速度与质量,将决定谁能在新一轮竞争中掌握主动权。