我国科研团队突破芯片能效瓶颈专用计算架构实现12倍速飞跃

个性化推荐、图像识别等智能应用已成为互联网服务的标配，这些功能的实现需要对海量数据进行快速处理与分析。然而传统数字芯片在处理特定计算任务时面临速度与能耗的双重瓶颈，制约了实时智能服务的发展。非负矩阵分解是机器学习的核心算法，广泛应用于图像分析、信息聚类和个性化推荐。这个技术能从用户行为数据、图像像素等海量信息中提取隐含的模式与特征。但其计算过程需要同步求解两个矩阵，涉及大量迭代运算，传统数字芯片的串行计算模式难以满足实时处理需求。北京大学孙仲研究员团队将研究方向转向模拟计算领域，创新性地研制出基于阻变存储器的非负矩阵分解模拟计算求解器。这一专用芯片采用高度定制化设计，通过精巧的电路设计与算法协同创新，在阻变存储器阵列上构建了紧凑的模拟电路。团队引入电导补偿技术，使核心计算步骤实现"一步求解"，大幅优化了芯片的面积与能耗表现。实验验证表明该系统表现出色。在彩色图像分解任务中，系统完成了高质量的图像处理，信噪比损失极小。在电影推荐数据集训练中，系统精度与先进数字芯片基本相当。在Netflix规模数据集的推荐系统训练任务中，模拟求解器的计算速度较先进数字芯片提升约12倍，能效比更是实现了超过228倍提升，意味着完成相同计算任务时，新芯片的能耗仅为传统芯片的百分之一左右。这项成果的意义在于为非负矩阵分解这类约束优化问题的实时求解开辟了新的技术路径，充分展现了模拟计算在处理复杂数据中的潜力。随着人工智能应用深化，算力需求呈指数级增长，能耗问题日益凸显。专用高能效芯片有望提升个性化推荐系统的实时响应能力，为生成式人工智能训练提供更加节能高效的算力支持。从产业发展角度看，这类高能效专用计算架构拓展了高效计算技术的应用边界。随着后续研究深入和产业化推进，此类芯片有望在图像处理、数据分析、推荐系统等关键领域实现广泛应用，为我国在下一代智能计算技术竞争中构建核心竞争优势。

算力竞争的焦点正在从"更快的通用计算"转向"更高效的任务计算"。面向典型算法瓶颈开展专用化、协同化创新——不仅关乎单项指标的提升——更关乎能否在真实场景中实现可持续的性能与能耗平衡。以关键问题为牵引、以系统工程为支撑的创新路径，或将成为下一代智能计算技术演进的重要方向。

我国科研团队突破芯片能效瓶颈 专用计算架构实现12倍速飞跃

我国科研团队突破芯片能效瓶颈专用计算架构实现12倍速飞跃