正文内容 评论(0)
除了i740昙花一现的独显之外,英特尔似乎并不是GPU市场的主角,但在GPU计算历史上,英特尔一直不曾缺席,现在英特尔终于站到舞台中央了。
在前几天的SC 19大会上,英特尔高级副总裁、首席架构师以及架构、图形与软件部门总经理Raja Koduri正式宣布了面向HPC高性能计算的英特尔的Xe架构GPU——Ponte Vecchio,这是英特尔首款7nm芯片,也会用上Foveros 3D、EMIB(嵌入式多芯片互连桥接)等先进封装技术,是英特尔HPC产品的集大成者。
在这个产品背后,英特尔及Raja Koduri到底有着怎样的野心?美国ZDNET网站日前刊发了对Raja Koduri的一篇介绍,谈到了英特尔在GPU计算上的宏伟愿景。
以下是ZDNET全文内容:
我们正处于高性能计算的转折点——Raja Koduri
十四年前,Raja Koduri帮助开启了GPU计算时代,这比NVIDIA创始人黄仁勋谈论(GPU计算)甚至还要早一年,这个想法就是——GPU不仅可以用于完成流畅的视频游戏渲染,还可以处理科学问题。
如今这个愿景已经成为现实,因为GPU成为了AI人工智能及越来越多的高性能计算的主力军。
Raja Koduri当时在AMD公司工作,如今他成为了英特尔的首席架构师,他坐下来跟ZDNET一起讨论了GPU计算是如何不断革命的。
Raja Koduri说,“我们正处于高性能计算的转折点上。” 二十年前,HPC高性能计算被垂直集成的架构所主导,但是之后,商业化的X86处理器在开源软件及各种库文件扩展接管了HPC计算,现在不只是HPC,所有集群都变成了X86及大量软件主导。
Raja Koduri表示这种软件运动正在主导新的计算时代,它可以被重新编程,像超级计算机一样强大。
“在AI及异构驱动非线性增长的情况下,我们将看到下一次周期。”
在Raja Koduri作出如上表态的同时,英特尔在周日宣布了新的GPU,它专门为HPC高性能计算而设计,代号为Ponte Vecchio。尽管还有一年多才能量产,但它可以说是一个时代的标志,是专为深度学习优化的机器。
或许比全新架构更重要的是,英特尔周日还宣布提供用于测试高性能计算的软件工具包oneAPI的beta版,该API简化了跨处理器及系统的类似超算那样的编程。
这两个公告都是在美国科罗拉多州博尔德举行的第31届高性能计算、网络、存储及分析国际大会上宣布的。
有人指出oneAPI某种意义上是Raja Koduri多年来完成的工作的一种延续,Raja Koduri对此表示赞同,他说AMD拥有首个用于通用计算的GPU硬件——它被称为GPGPU,这比NVIDIA还早了两年,但“我们那时候不是从软件开始的”,这让NVIDIA的CUDA编程工具包有了席卷整个行业的机会。
相比之下,在英特尔公司,“我说我们这次使用完全不同的方式,首先从软件开始。”
Raja Koduri指出,“在过去的18个月中,我们已经有1000多名工程师付出了巨大的努力。”
当然,对英特尔来说,(oneAPI的)挑战在于它不像NVIDIA那样只出售一种GPU芯片,英特尔有着各种不一样的处理器,包括至强、Ponte Vecchio及未来的GPU、Mobileye自驾芯片、Movidius视觉计算芯片、Agilex FPGA芯片及Nervana神经网络芯片。
Raja Koduri之前在AMD工作时,他讲过一个比喻,厂商提供的芯片好比餐厅,英特尔提供的实际上是自助餐,种类繁多,但所有人需要的就是汉堡、奶昔这样的简单产品,后者正是NVIDAI提供的。
Raja Koduri表示要为英特尔的客户提供便利依然面临着同样的挑战,Raja Koduri称“我们的客户不想跟(复杂的)异构运算打交道”,“这就是为什么oneAPI可以在运行在抽象层的原因”,CPU是英特尔历史上唯一一种大规模通用平台架构,oneAPI旨在成为桥梁,以同样的方式实现大规模的异构运算。
当被问到英特尔是否对客户可以充分利用oneAPI及所有芯片充满信心时,Raja Koduri表示“这是一个好问题。”
“我们提供分析事物的工具,甚至在客户移植代码之前就能告诉他们这些代码是否会在GPU上高效运行,这些工具可以使得人们更容易部署硬件,是否对他们的数据中心有益也能很快想到结果。”
Raja Koduri称Ponte Vecchio GPU芯片将采用英特尔的7nm工艺生产,距离量产还有一年多的时间。
Ponte Vecchio将成为美国Aurora极光超算的一部分,这是一套价值50亿美元的超算,预计会安装在美国伊利诺伊州的阿贡国家实验室,由美国超算厂商Cray及其他供应商一起建造。
Raja Koduri拒绝透露有关此GPU与其他厂商的GPU架构的不同细节,他强调说“该架构有多种运行模式,与当前其他架构的GPU相比更具灵活性,可以映射更多的工作负载,同时在这个新架构上英特尔还有全新的矢量处理方法。”
Raja Koduri称目前还没有公布一些细节,简单来说就是英特尔在这个GPU芯片的晶体管上针对HPC做了优化。当被问到是否在Ponte Vecchio GPU上取消了传统GPU的一些单元,比如着色器、内存一致,Raja Koduri表示英特尔的选择是优化支持现有软件,以便维护现已安装的GPU编程的价值,但是英特尔也作出了选择,删除那些HPC运算不需要的东西。