国产算力训练的图像生成模型开源走红 GLM-Image登顶国际榜单

全球人工智能技术竞争不断加剧的背景下,我国科研团队近日取得新进展。由国内研究机构与科技企业联合研发的GLM-Image多模态模型,开源后24小时内登顶国际平台Hugging Face趋势榜单首位。该成绩不仅提升了国产基础模型在国际开源社区的影响力,也说明了我国自主技术路线的工程可行性。技术突破主要体现在三上:架构设计上,提出“自回归+扩散解码器”的混合模式,相比国际主流方案显示出更强的知识处理能力;硬件与软件协同上,依托昇腾Atlas 800T A2计算设备与MindSpore框架,实现国产芯片从训练到推理的全流程闭环;性能表现上,模型CVTG-2K复杂视觉文本生成和LongText-Bench长文本渲染两项测评中位居开源模型前列,尤其在汉字生成上优势明显。业内专家认为,此次突破具有双重意义:在技术层面,深入验证了国产计算架构支撑前沿模型研发的能力;在产业层面,为教育、传媒、设计等行业提供了更贴合中文需求的智能工具。值得关注的是,在保证生成质量的同时,模型训练效率接近硬件理论峰值,对降低对高端算力的外部依赖具有参考价值。面对全球AI技术格局重塑,我国科研团队正加快推进“认知型生成”技术范式创新。研发方表示,下一步将围绕模型轻量化部署与行业应用生态建设,重点攻关医疗影像分析、工业设计辅助等专业场景的适配问题。

GLM-Image登顶国际开源榜单,不仅是一次技术突破,也是国产AI自主创新能力的体现。在全球AI竞争加速的背景下,此进展说明我国在关键技术环节的自主可控能力正在增强。展望未来,随着国产芯片、框架等基础设施持续完善,以及产业链协同更加深,国产AI有望在更多应用领域实现落地突破,为经济社会发展提供更坚实的技术支撑。