小程序
传感搜
传感圈

Habana Gaudi2性能稳超英伟达A100,助力实现高效AI训练

2022-07-05
关注

近日,英特尔宣布Habana® Gaudi®2深度学习处理器在MLPerf行业测试中表现优于英伟达A100提交的AI训练时间,结果突显了5月在英特尔On产业创新峰会上发布的Gaudi2处理器在视觉(ResNet-50)和语言(BERT)模型上训练时间的优势。

本文引用地址:http://www.eepw.com.cn/article/202207/435893.htm

英特尔公司执行副总裁兼数据中心与人工智能事业部总经理 Sandra Rivera表示:“非常高兴能与大家分享Gaudi 2在MLPerf基准测试中的出色表现,我也为英特尔团队在产品发布仅一个月取得的成就感到自豪。我们相信,在视觉和语言模型中提供领先的性能能够为客户带来价值,有助于加速其AI深度学习解决方案。”

借助Habana Labs的Gaudi平台,英特尔数据中心团队能够专注于深度学习处理器技术,让数据科学家和机器学习工程师得以高效地进行模型训练,并通过简单的代码实现新模型构建或现有模型迁移,提高工作效率的同时降低运营成本。

Habana Gaudi2处理器在缩短训练时间(TTT)方面相较第一代Gaudi有了显著提升。Habana Labs于2022年5月提交的Gaudi2处理器在视觉和语言模型训练时间上已超越英伟达A100-80G的MLPerf测试结果。其中,针对视觉模型ResNet-50,Gaudi2处理器的TTT结果相较英伟达A100-80GB缩短了36%,相较戴尔提交的同样针对ResNet-50和BERT模型、采用8个加速器的A100-40GB服务器,Gaudi2的TTT测试结果则缩短了45%。 

MLCommons发布的数据,20226月。https://mlcommons.org/en/training-normal-20/

 

相比于第一代Gaudi处理器,Gaudi2在ResNet-50模型的训练吞吐量提高了3倍,BERT模型的训练吞吐量提高了4.7倍。这些归因于制程工艺从16纳米提升至7纳米、Tensor处理器内核数量增加了三倍、增加GEMM引擎算力、封装的高带宽存储容量提升了三倍、SRAM带宽提升以及容量增加一倍。对于视觉处理模型的训练,Gaudi2处理器集成了媒体处理引擎,能够独立完成包括AI训练所需的数据增强和压缩图像的预处理。

两代Gaudi处理器的性能都是在没有特殊软件操作的情况下通过Habana客户开箱即用的商业软件栈实现的。

通过商用软件所提供的开箱即用性能,在Habana 8个GPU服务器与HLS-Gaudi2参考服务器上进行测试比对。其中,训练吞吐量来自于NGC和Habana公共库的TensorFlow docker,采用双方推荐的最佳性能参数在混合精度训练模式下进行测量。值得注意的是,吞吐量是影响最终训练时间收敛的关键因素。

 

图形测试配置详见说明部分。

图形测试配置见说明部分。

 

除了Gaudi2在MLPerf测试中的卓越表现,第一代Gaudi在128个加速器和256个加速器的ResNet基准测试中展现了强大的性能和令人印象深刻的近线性扩展,支持客户高效系统扩展。

Habana Labs首席运营官Eitan Medina表示:“我们最新的MLPerf测试结果证明Gaudi2在训练性能方面显著优势。我们将持续深度学习训练架构和软件创新,打造最具性价比的AI训练解决方案。”

 

关于MLPerf基准测试:MLPerf社区旨在设计公平且极具实际价值的基准测试,以公平地测量机器学习解决方案的准确度、速度和效率。该社区由来自学术界、研究实验室和业界的AI领导者创建,他们确立基准并制定了一套严格的规则,以确保所有参与者均能够公平公正地进行性能比对。基于一套明确的规则,以及能够对端到端任务进行公平比较,目前MLPerf是AI行业唯一可靠的基准测试。此外,MLPerf基准测试结果要经过为期一个月的同行评审,这将进一步验证报告结果。

 

说明:

ResNet-50性能对比中使用的测试配置

A100-80GB:Habana于2022年4月在Azure实例Standard_ND96amsr_A100_v4上进行测量,使用了一个A100-80GB,其中应用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)

A100-40GB:Habana于2022年4月在DGX-A100上进行测量,使用了一个A100-40GB,其中应用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)

V100-32GB¬:Habana于2022年4月在p3dn.24xlarge上进行测量,使用了一个V100-32GB,其中应用了NGC的TF docker 22.03-tf2-py3(optimizer=sgd, BS=256)

Gaudi2:Habana于2022年5月在Gaudi2-HLS系统上进行测量,使用了一个Gaudi2,其中应用了SynapseAI TF docker 1.5.0(BS=256)

结果可能有所不同。

BERT性能对比中使用的测试配置

A100-80GB:Habana于2022年4月在Azure实例Standard_ND96amsr_A100_v4上进行测试,使用了一个A100-80GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=312,accu steps=256;Phase-2:seq len=512,BS=40,accu steps=768) 

A100-40GB:Habana于2022年4月在DGX-A100上进行测试,使用了一个A100-40GB,包含NGC的TF docker 22.03-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)

V100-32GB:Habana于2022年4月在上p3dn.24xlarge进行测试,使用了一个V100-32GB,包含NGC的TF docker 21.12-tf2-py3(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=8,accu steps=4096)

Gaudi2:Habana于2022年5月在上Gaudi2-HLS进行测试,使用了一个Gaudi2,包含SynapseAI TF docker 1.5.0(Phase-1:Seq len=128,BS=64,accu steps=1024;Phase-2:seq len=512,BS=16,accu steps=2048)

结果可能有所不同。

 

Habana Labs、Habana、Habana标识、Gaudi和SynapseAI是Habana Labs的商标。


您觉得本篇内容如何
评分

相关产品

SD-35200-23&DA-160 振动测试台

SD-35200-23系列振动测试系统是一种通用的宽频带电动振动测试系统。它被设计用于测试从小型到大型的有效载荷,如电子组件和设计功能,满足汽车、航空、军事、医疗和电子制造业的测试要求。模型的系统包括sd - 35200 - 23瓶,是由模型da - 160功率放大器和铜- 160水冷单元模型。

Viatran 威创 Model 118 压力变送器

模型118压力变送器是Viatran工业测试和控制系列解决方案的基础之一。这种熟悉的钟形对全球的测试工程师来说都是众所周知的。

Plast-O-Matic CC100-PV 液体流量计

校准柱验证泵流量、化学加药或化学进料系统的精度高于竞争模型。由抗紫外线的聚氯乙烯制成,设计用于精确、高效的测试,有多种安装选项

Uson 优胜 ALD 检漏仪

由于绝热冷却的影响,泄漏率测试面临的挑战是,必须为测试分配额外的时间,以使这些影响消散。否则,绝热冷却效应将掩盖压力或质量流量变化的检测。因此,挑战在于找到在冷却过程中进行测试的方法。,补偿冷却效果的通常工作是增加测试时间。在可以容忍减速的情况下,这种策略是可以接受的。然而,许多制造商正在寻找一种更好的解决方案2014,一种在不牺牲精度的情况下提高生产线速度的方法。*,泄漏率建模加速了Uson先进的泄漏检测器生成和存储被测部件绝热冷却循环模型的过程。在部件测试过程中,使用ALD的泄漏率模型来精确地确定被测部件的泄漏率。结果是测试时间更短,结果更准确。

HT Instruments M73 接地电阻测试仪

HiPot,或高电位,是一类电子测试设备,用于验证电气绝缘。工程师在电缆、电线、电路板、电器、电动机和变压器上使用hipot测试仪器。当产品老化时,其绝缘可能会损坏,导致电流泄漏。HiPot测试器通过检测电子设备的缝隙和缺陷来保护工程师不受电流泄漏的影响。介电测试器、绝缘测试器和兆欧计类似于高频测试器。,附加功能:,标准配件:,可选:,标准:,M73是四个模型属于MULTITEST家庭设计的便携式多功能RCD测试人员执行全球对地电阻测量和旅行时间测试交流类型RCD根据民事VDE和IEC标准电气安装。,像所有MULTITEST家庭M73模型提供一个大型液晶显示器,便于阅读,一个现代和人体工程学的外部情况,一个创新的用户友好电子量程选择器以及保护橡胶夹,防止意外损坏。

enDAQ Vibration Solutions S5-D40 振动传感器

该模型的低成本和坚固的铝外壳使其成为在恶劣环境中进行通用振动测试的理想选择。S5提供了一个更大的电池,使我们的传感器记录时间最长。

Honeywell 2102-200 扭矩传感器

这些模型在两个方向上运行和校准。镀镍合金钢结构提高了在恶劣的工业环境中的耐用性。这些模型没有运动部件,并且在传感器的特殊加工部分上使用四个粘合应变计,以在宽动态范围内实现0.1%的最大非线性。典型应用包括轮胎制动、电机测功机、摩擦打滑测试和扭转测量。50 in-lb至1000 in-lb容量。

United Testing Systems, Inc. DTM-100kN 力和扭矩仪器

UnitedSmart-1DTM模型是一个包含计算机的机电测试系统,设计用于与各种联合测试仪器和软件一起工作,专门针对不同类型的样品材料(包括陶瓷、塑料、聚合物、金属和复合材料)编写。

Slaughter Company (SCI) Model 296 接地电阻测试仪

在斯洛特公司(SCI),我们设计了290系列Hipot测试仪,以消除测试中的猜测。凭借直观的用户界面、可移植的设计和简化的菜单系统,您会想知道没有它如何进行测试。,290系列有5种easy-to-choose-from模型:,294 \ u2013直流耐压测试仪,295 \ u2013交流耐压测试仪,296 \ u2013交流耐压测试仪、直流耐压测试仪,297\ u2013交流耐压测试仪、直流耐压测试仪与绝缘电阻测量、298 \ u2013 500 va交流耐压测试仪,如果你正在寻找一个崎岖,便携式和轻型电气安全测试仪,然后看看没有进一步的290系列Hipot和绝缘电阻测试仪。今天就来发现SCI测试的简单性吧!

PTB Sales, Inc. 938-41 检漏仪

该模型具有灵敏度(2 x 10-10 atm cc/sec He),以及在高测试端口压力下的高灵敏度(2 x 10-9 atm cc/sec He,350 mTorr)。

评论

您需要登录才可以回复|注册

提交评论

电子产品世界

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

自动编程NLP模型技术综述 译文

提取码
复制提取码
点击跳转至百度网盘