收藏文章 楼主

IBM推出运行AI最快的芯片

版块:科技头条   类型:普通   作者:科技资讯   查看:42   回复:0   获赞:0   时间:2023-10-25 10:16:14

IBM推出运行AI最快的芯片


NorthPole。


本报讯 美国IBM公司研究人员开发了一种以大脑为灵感的计算机芯片,可以更少的功耗提高人工智能(AI)的工作速度。这一名为NorthPole的大型处理器芯片不再需要频繁访问外部存储器,因此在执行诸如图像识别之类的任务时比同类商用芯片快了22倍,同时消耗的电力也大大减少。10月19日,相关成果发表于《科学》。


“它的能源效率令人震惊。”法国巴黎-萨克雷大学纳米电子学研究员Damien Querlioz说,这项研究表明,计算和内存可以大规模集成。“我觉得这篇论文将动摇计算机体系结构中的普遍思维基础。”


NorthPole运行神经网络是通过编程简单计算单元的多层阵列来识别数据模式,即底层接收数据,例如图像中的像素;随后每个连续层检测日益复杂的模式,并将信息传递至下一层;最终顶层产生输出,例如,可以表达一幅图像包含一只猫、一辆汽车或其他物体的可能性。


一些计算机芯片可以有效处理这些计算,但它们每计算一层时仍需要使用被称为RAM的外部存储器。以这种方式在芯片之间传输数据会减慢速度,这种现象被称为冯·诺依曼瓶颈——数学家约翰·冯·诺依曼第一个提出了基于处理单元和独立存储单元的计算机标准架构。


冯·诺依曼瓶颈是影响包括人工智能在内的计算机应用发展的最重要因素之一,它还导致能源效率低下。论文作者之一、IBM的计算机工程师Dharmendra Modha说,他曾经估计,在这种架构上模拟人类大脑,可能需要相当于12个核反应堆的输出。


而NorthPole由256个计算单元或核心组成,每个计算单元都有自己的内存。“我们正在核心内克服冯·诺依曼瓶颈。”Modha说。


Modha说,这些核心以网络连接在一起,而这种网络的灵感来自人类大脑皮层之间的白质连接。这一设计原则和其他设计原则中的大部分以前就存在,但从未结合在一个芯片中,这使NorthPole在图像识别的标准基准测试中以相当大的优势击败了现有的人工智能机器。尽管没有使用最新、最小型化的制造工艺,但它的能耗只有最先进的人工智能芯片的1/5。作者估计,如果NorthPole的设计采用最先进的制造工艺,其效率将是目前设计的25倍。


但是,即便NorthPole有224兆字节的内存,也不足以容纳大型语言模型,比如聊天机器人ChatGPT使用的语言模型——就算在最精简的版本中,它也有数千兆字节的数据。


此外,该芯片只能运行预先编程的神经网络,后者需要在单独的机器上提前“训练”。但该论文的作者表示,NorthPole架构可能在速度关键型应用中很有用,比如自动驾驶汽车。


NorthPole使存储单元在物理上尽可能接近核心中的计算单元。在其他地方,研究人员一直在使用新材料和制造工艺进行更激进的创新。这使得存储单元本身能够执行计算,从而在原则上可以进一步提高速度和效率。(文乐乐)


相关论文信息:


https://doi.org/10.1126/science.adh1174

 
回复列表
默认   热门   正序   倒序

回复:IBM推出运行AI最快的芯片

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.3.167.80,2025-06-21 09:02:59,Processed in 4.44532 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com