英伟达 120G HBM2 显存版 H100 加速卡曝光

在本月早些时候,英伟达举行了一次 GTC 会议主题演讲,并在会中宣布其 H100 Tensor Core GPU 已全面投产,戴尔、联想、思科、Atos、富士通、技嘉、惠普企业和超微等技术合作伙伴将在下个月开始交付围绕H100构建的产品。

而在今天,外媒s-ss.cc曝光了一款NVIDIA 可能正在开发全新的 PCIe 版本的 Hopper H100 GPU 的消息

图源s-ss.cc

根据上图显示的内容,我们可以看到,爆料者拿到了一款 ADLCE 的工程样品卡,而这张卡目前还没有更多信息可以提供,不过 120GB 显存的 H100 GPU 就已经能够让人期待了。

而图上显示的 ADLCE 显然代表 Ada Lovelace 架构,它是英伟达刚宣布的全新系列显卡的架构,TDP 限制为 350W(最终规格为 450W)。

根据 s-ss.cc披露的消息,这款 H100 120GB PCIE 版本的单精度性能与 SXM 版本是相同的,因此,据说单精度浮点计算性能仅限于60 TFLOP(零售版将有82 TFLOPs);在本例中,这意味着 16896 个 CUDA 单元和 528个 张量单元。

图源videocardz

该外媒曝光的一张截图显示了一个假定的 H100 处理器,具有120GB 的 HBM2 显存、接口为  PCIe 的新版加速卡,但与现有的 80GB 显存版 SKU 不同,此版本将显存带宽增加到了 3 TB/s。

而这样的带宽目前仅适用于 SXM 规格(NVIDIA专有夹层接口),该接口未锁定、以获得更高的供电功率,但该型号也使用 HBM3 的显存。值得注意的是,要支持 120GB 的显存容量,五个显存堆栈中的每个都必须为 24GB 的容量才行。

GH100 GPU 的完整规格如下:

  • 8 个 GPC,72 个 TPC(9 个 TPC / GPC),2 个 SM / TPC,每个完整 GPU 144 个 SM
  • 每个 SM 128 个 FP32 CUDA 核心,每个完整 GPU 18432 个 FP32 CUDA 核心
  • 每个 SM 4 个第四代 Tensor 核心,每个完整 GPU 576 个
  • 6 个 HBM3 或 HBM2e 堆栈,12 个 512 位内存控制器
  • 60 MB 二级缓存
修改于 2022-09-26 16:56
[原创] 转载请注明作者及出处

游民星空APP