在数字经济时代,个性化推荐、图像识别、信息聚类等智能应用已成为日常生活的重要组成部分。
这些看似简单的智能服务背后,需要计算系统处理海量数据并进行复杂的数学运算。
然而,随着数据规模的指数级增长和应用场景的日益复杂化,传统计算架构正面临前所未有的挑战。
当前,支撑智能应用的传统数字芯片在处理某些特定计算任务时面临双重困境。
一方面,这类芯片采用串行计算模式,难以高效处理需要并行求解的复杂问题;另一方面,随着计算规模扩大,芯片的功耗消耗呈急剧上升趋势,成为制约实时智能应用推广的关键瓶颈。
特别是在非负矩阵分解这类约束优化问题上,传统芯片的计算效率明显不足,严重限制了推荐系统、数据分析等应用的响应速度。
北京大学孙仲研究员团队敏锐捕捉到这一技术痛点,将研究方向转向模拟计算这一新兴领域。
与传统数字计算依赖逻辑门电路不同,模拟计算通过连续的物理过程直接进行数学运算,具有天然的并行处理优势。
研究团队以阻变存储器为基础,创新性地构建了专用的模拟计算电路架构,用于求解非负矩阵分解问题。
这一创新的核心在于芯片设计的"定制化"思路。
孙仲团队没有继续追求通用计算能力的完善,而是针对特定的计算任务进行深度优化。
他们通过精妙的电路设计与算法创新相结合,在阻变存储器阵列上实现了高度紧凑的模拟电路,并开发了原创的电导补偿技术,使得核心计算步骤能够"一步求解",大幅降低了中间转换的开销。
实验验证充分证明了这一方案的有效性。
研究团队搭建的原型系统在多组测试中表现出色。
在图像处理方面,系统成功完成了彩色图像的高质量分解,信噪比损失几乎可以忽略不计;在数据处理方面,系统高效完成了电影推荐数据集的训练任务,精度与传统数字芯片基本相当。
最为关键的性能指标显示,在处理网飞规模的推荐系统训练任务时,该模拟求解器的计算速度较先进数字芯片提升约12倍,能效比更是实现了超过228倍的飞跃性提升。
这项突破意义重大。
首先,它为解决人工智能时代的算力瓶颈提供了新的技术路径。
随着生成式人工智能的快速发展,对高效算力的需求不断增加,专用芯片的出现有望显著降低计算成本。
其次,该技术有望大幅提升个性化推荐系统的实时响应能力,为用户提供更快速、更精准的服务体验。
再次,这种高能效的计算架构为数据中心和云计算平台的绿色升级奠定了基础,有助于缓解信息产业的能耗压力。
展望未来,孙仲团队表示,这项工作为约束优化问题的高效求解开辟了新的方向。
随着后续研究的深入推进和产业化应用的逐步展开,类似的高能效专用计算芯片有望在图像处理、自然语言处理、科学计算等多个关键领域实现广泛应用。
这对于我国在下一代智能计算技术竞争中构建核心竞争力具有重要意义。
算力不是越大越好,更关键的是在有限能源和成本约束下实现更高效的计算。
以任务为牵引、以架构创新为突破、以工程化为落点,推动专用计算与新型器件协同发展,有望让“更快、更省”的智能计算从实验室走向产业应用,为数字经济高质量发展提供更坚实的底座支撑。