在全球人工智能算力竞赛持续升级的背景下,国产芯片领域迎来标志性突破。
曦望科技9月12日发布的启望S3推理芯片,通过架构创新实现FP4至FP16多精度动态切换,搭载LPDDR6显存使容量提升400%,在DeepSeek等主流大模型测试中展现出显著成本优势。
这一技术突破源于企业持续的战略投入。
公开资料显示,曦望前身为商汤科技核心芯片部门,近一年累计获得30亿元战略融资。
资金重点投向存算一体架构研发,其创新的显存带宽优化方案有效解决了传统GPU在AI推理中的"内存墙"瓶颈。
该产品的问世将重塑行业竞争格局。
相较于国际厂商同类产品,启望S3在单位Token成本上的突破性表现,有望将大模型服务价格拉低至原价的十分之一。
企业联合商汤科技等发起的"百万Token一分钱"计划,直接对标国际云计算巨头的定价体系,或将加速AI服务的商业化落地进程。
在生态建设方面,曦望采取"技术+场景"双轮驱动策略。
除推出适配万亿参数模型的寰望SC3-256超节点方案外,与浙江大学共建的联合研发中心将重点攻关稀疏计算、动态量化等前沿技术。
这种产学研深度合作模式,为后续技术迭代储备了持续动能。
行业观察人士指出,随着2025年量产规模突破万片,该系列芯片有望在智慧城市、生物医药等垂直领域形成示范效应。
在全球半导体产业格局调整的窗口期,此类核心技术的突破对我国构建自主可控的AI基础设施具有重要意义。
启望S3的发布代表了国产芯片在大模型推理领域的实质性突破,但也应清醒认识到,与国际先进水平相比仍存在差距。
当前的关键是要在保持技术创新的同时,加强生态建设,通过产业链上下游的紧密协作,形成可持续的竞争优势。
随着更多国产芯片企业的涌现和技术的不断迭代,国内大模型推理成本的持续下降已成为必然趋势,这将为AI应用的广泛普及创造条件,也将进一步推动我国在人工智能领域的产业化进程。