曦望发布启望S3推理GPU并推出“百万Token一分钱”计划,瞄准大模型降本普惠

在全球人工智能算力竞赛持续升级的背景下,国产芯片领域迎来标志性突破。

曦望科技9月12日发布的启望S3推理芯片,通过架构创新实现FP4至FP16多精度动态切换,搭载LPDDR6显存使容量提升400%,在DeepSeek等主流大模型测试中展现出显著成本优势。

这一技术突破源于企业持续的战略投入。

公开资料显示,曦望前身为商汤科技核心芯片部门,近一年累计获得30亿元战略融资。

资金重点投向存算一体架构研发,其创新的显存带宽优化方案有效解决了传统GPU在AI推理中的"内存墙"瓶颈。

该产品的问世将重塑行业竞争格局。

相较于国际厂商同类产品,启望S3在单位Token成本上的突破性表现,有望将大模型服务价格拉低至原价的十分之一。

企业联合商汤科技等发起的"百万Token一分钱"计划,直接对标国际云计算巨头的定价体系,或将加速AI服务的商业化落地进程。

在生态建设方面,曦望采取"技术+场景"双轮驱动策略。

除推出适配万亿参数模型的寰望SC3-256超节点方案外,与浙江大学共建的联合研发中心将重点攻关稀疏计算、动态量化等前沿技术。

这种产学研深度合作模式,为后续技术迭代储备了持续动能。

行业观察人士指出,随着2025年量产规模突破万片,该系列芯片有望在智慧城市、生物医药等垂直领域形成示范效应。

在全球半导体产业格局调整的窗口期,此类核心技术的突破对我国构建自主可控的AI基础设施具有重要意义。

启望S3的发布代表了国产芯片在大模型推理领域的实质性突破,但也应清醒认识到,与国际先进水平相比仍存在差距。

当前的关键是要在保持技术创新的同时,加强生态建设,通过产业链上下游的紧密协作,形成可持续的竞争优势。

随着更多国产芯片企业的涌现和技术的不断迭代,国内大模型推理成本的持续下降已成为必然趋势,这将为AI应用的广泛普及创造条件,也将进一步推动我国在人工智能领域的产业化进程。