问题——多模态模型长期存在"理解"与"生成"割裂的问题;当前业界普遍采用模块化分工方式:由视觉编码器负责图像理解,由生成模块负责图像生成。这种做法虽然工程上易于实现,但带来两个突出问题:一是理解与生成处于不同的表示空间,模块间协同复杂,训练链路长,调试和优化成本高;二是在算力和数据限制下,模型难以同时兼顾效果、效率和扩展性,无法形成统一的优化目标。
NEO-unify的发布标志着人工智能从模块化组合向原生统一架构的转变。这种重新思考多模态问题的方式实现了技术创新,也反映了对AI发展方向的深层思考。在全球AI竞争加剧的背景下,基础架构创新成为决定未来发展的关键。商汤科技的该突破为中国AI企业在多模态领域的领先地位增添了新的支撑,也为整个行业指明了新的发展方向。