英特尔(Intel)日前在官网发布一份24页的“Gaudi 3 AI加速器白皮书”中披露,英特尔将推出Gaudi 3在中国发售的两款“特供版”AI 芯片产品。
具体包括两种硬件形态加速卡:一款型号为HL-328的OAM兼容夹层卡(Mezzanine Card),预计将于今年6月24日推出;另一款是型号为HL-388的PCle加速卡,预计将于今年9月24日推出。而基于内核数量、工作频率、TDP等参数估算,相比Gaudi 3国际版,“中国特供版”HL-328芯片性能或降低约92%左右。
早前4月9日举行的美国Intel Vision 2024会议上,英特尔发布新一代Gaudi 3 AI 加速芯片,采用台积电5nm工艺,带来4倍(400%)的BF16 AI计算能力提升。同时,相比英伟达H100 GPU,英特尔Gaudi 3 AI芯片的模型训练速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本却仅为H100的一小部分。
显然,中国特供版的Gaudi 3需要大幅降低AI性能,才能合规出口。因此,中国特供版Gaudi 3需要大幅削减内核数量(原版拥有8个矩阵数学引擎和64 个张量内核)和工作频率。