正文内容 评论(0

首次!突破世纪难题 我国成功研制出新型芯片:算力达顶级GPU的1000倍以上
2025-10-14 17:15:15  出处:快科技 作者:朝晖 编辑:朝晖     评论(0)点击可以复制本篇文章的标题和链接复制对文章内容进行纠错纠错

快科技10月14日消息,据科技日报报道,我国成功研发新型芯片算力可超顶级GPU千倍,突破模拟计算世纪难题。

近日,北京大学人工智能研究院孙仲研究员团队联合集成电路学院研究团队,成功研制出基于阻变存储器的高精度、可扩展模拟矩阵计算芯片,首次实现了在精度上可与数字计算媲美的模拟计算系统。

该芯片在求解大规模MIMO信号检测等关键科学问题时,计算吞吐量与能效较当前顶级数字处理器(GPU)提升百倍至千倍。

相关论文于10月13日刊发于《自然·电子学》期刊。

我们熟悉的通信基站信号处理、AI大模型训练参数优化等,本质都是在解复杂的矩阵方程。采用数字方法实现高精度矩阵求逆的计算开销极大,耗时长、能耗高。

于是,曾被视为老旧技术的模拟计算重新进入研究视野,它直接利用物理定律实现并行运算,延时低、功耗低,在算力瓶颈背景下,具有先天优势。

但如何让模拟计算兼具高精度与可扩展性,从而在现代计算任务中发挥其先天优势,一直是困扰全球科学界的世纪难题。

孙仲团队选择了一条融合创新的道路,通过新型信息器件、原创电路和经典算法的协同设计,构建了一个基于阻变存储器阵列的高精度、可拓展的全模拟矩阵方程求解器,首次将模拟计算的精度提升至24位定点精度。

孙仲介绍,研究团队基于迭代算法,结合了模拟低精度矩阵求逆和模拟高精度矩阵-向量乘法运算,开发了一种基于全模拟矩阵运算的高精度矩阵方程求解方案,先快速算出矩阵方程的“近似解”,再用“位切片”方法,实现迭代细化。

在计算精度方面,团队在实验上成功实现16×16矩阵的24比特定点数精度求逆,矩阵方程求解经过10次迭代后,相对误差可低至10⁻⁷量级。

在计算性能方面,在求解32×32矩阵求逆问题时,其算力已超越高端GPU的单核性能;当问题规模扩大至128×128时,计算吞吐量更达到顶级数字处理器的1000倍以上。同时,该方案在相同精度下能效比传统数字处理器提升超100倍,为高能效计算中心提供了关键技术支撑。

团队将它应用到了“大规模MIMO(多输入多输出)信号检测”中——仅用3次迭代,恢复的图像就和原始图像高度一致,误码率和32位数字计算效果相当,凸显其在实时信号处理中的潜力。

“我们证明,模拟计算能以极高效率和精度解决现代科学和工程中的核心计算问题。”

孙仲强调,这项突破的应用前景广阔,可赋能多元计算场景,有望重塑算力格局。团队的研究为算力提升探索出一条极具潜力的路径,有望打破数字计算的长期垄断,开启一个算力无处不在且绿色高效的新时代。

首次!突破世纪难题 我国成功研制出新型芯片:算力达顶级GPU的1000倍以上

【本文结束】如需转载请务必注明出处:快科技

责任编辑:朝晖

文章内容举报

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#芯片#GPU#算力

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...