英偉達表示在運行大型語言模型(LLM)時,常規顯卡的顯存無法駕馭龐大的數據流。因此本次推出的 H100 NVL 最高可以提供 188GB HBM3 顯存,單卡顯存容量 94GB。
H100 NVL 的功耗略高于 H100 PCIe,每個 GPU 為 350-400 瓦(可配置),增加了 50W。IT之家從報道中獲悉,總性能實際上是 H100 SXM 的兩倍:FP64 為 134 teraflops,TF32 為 1979 teraflops,FP8 為 7916 teraflops,INT8 為 7916 teraops。
內存帶寬也比 H100 PCIe 高很多,每個 GPU 為 3.9 TB / s,總和為 7.8 TB / s(H100 PCIe 為 2 TB / s,H100 SXM 為 3.35 TB / s)。