英特尔详解Ponte Vecchio Xe HPC GPU A0芯片设计

2021年8月20日 | By News | Filed in: News.

https://ift.tt/3z58Phh


在 2021 架构日活动期间,英特尔详细介绍了 Ponte Vecchio A0 的芯片设计。考虑到英特尔长期缺乏独立显卡方面的经验,Ponte Vecchio 可算是该公司一项雄心勃勃的登月计划。现在看来,由 Raja Koduri 和 Masooma Bhaiwala 带领的这支开发团队,着实给我们带来了不少惊喜。

1 172.jpg

(图 via WCCFTech

对于英特尔公司的投资者们来说,Ponte Vecchio 有助于其在 HPC GPU 市场抢占更多的份额。

2.jpg

Raja Koduri 手里拿着的,就是 Ponte Vecchio A0 芯片。

2021 架构日活动期间,英特尔还坦承已扫清 Xe HPC 架构上市前的最后一道障碍。

3 155.jpg

上图中的蓝色和绿色线条,分别指代了英特尔 Xe 和竞争对手(或许是英伟达)。随着 Ponte Vecchio 在 2021 年的横空出世,英特尔在 HPC GPU 领域也实现了重大的超越。

4 173.jpg

英特尔透露,在打造 Ponte Vecchio 的设计过程中,他们几乎对所有部分都进行了重新设计和重组。

5 175.jpg

据悉,Ponte Vecchio 封装中包含了 47 块“瓦片”,且各个瓦片可能基于不同的代工厂(比如 Intel 自家或台积电)。

6 179.jpg

显然,这需要极高的封装工艺作为支撑,才能最终让 Ponte Vecchio 成为一个有“凝聚力”的整体。

7.jpg

Folsom 团队已经测量了 45 TFLOPs 的 FP32 吞吐量、5 TBps 的显存带宽、以及 2 TBps 的连接带宽,以验证 A0 芯片的所有部分都如预期般正常工作,并且有望为图形领域的重大突破做出贡献。

8-1 163.jpg

以 Resnet 基准测试为例,英特尔已经证明了 A0 Ponte Vecchio 芯片可打破世界纪录。

8-2 164.jpg

此外英特尔 Xe HPC 将提供 1 个或 2 个堆栈设计,且 Xe Link 链路将用于在多个子系统中连结 Ponte Vecchio 。

8-3 180.jpg

与 Xe HPG 不同的是,Ponte Vecchio GPU 中的 Xe HPC 内核,拥有 8 个矢量引擎(512 位)和 8 个矩阵引擎(4096 位)。

9 157.jpg

很明显,英特尔似乎已经迈过了图形技术停滞不前的低谷,并在高性能图形计算领域迎来了突飞猛进般的重大进展。

10 189.jpg

值得一提的是,规划中的 Aurora 超算,也将使用该公司的 Ponte Vecchio GPU 加速卡。

11.jpg

该公司甚至搬出了一个 Aurora Blade 刀片组件,无数的 Aurora Blade 单元将可组合成为一个超算集群。

IT.数码

via cnBeta.COM https://www.cnbeta.com

August 20, 2021 at 11:41AM


发表评论

邮箱地址不会被公开。 必填项已用*标注