據外媒報道,既不久前英特爾正式發布了新一代AI加速芯片Gaudi 3 之后,其正準備面向中國市場推出“特供版”Gaudi 3,包括名為HL-328的OAM兼容夾層卡(Mezzanine Card)和名為HL-388的PCle加速卡兩種硬件形態。
英特爾在其Gaudi 3 白皮書中披露了上述信息,其中HL-328將于6月24日推出,HL-388將于9月24日推出。
據了解,中國特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內存, 128GB HBM2e高帶寬內存,帶寬為 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標準。但是,由于美國對于AI芯片的出口管制規則限制,使得這類高性能AI的綜合運算性能(TPP)需要低于4800才能出口到中國, 這意味中國特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。
根據英特爾公布的數據顯示,Gaudi 3 在 FP16/BF16 上可以達到 1835 TFLOPS,相比英偉達H100在大模型訓練方面快40%、推理能效高50%。顯然,中國特供版的Gaudi 3 需要大幅降低AI性能,才能合規出口到中國。
據行業分析,中國特供版Gaudi 3 需要大幅削減內核數量(原版擁有 8 個矩陣數學引擎和64 個張量內核)和工作頻率,最終可能需要其AI性能降低約92%才能符合美國的出口管制要求。