NVIDIA DGX A100中国“首秀”,联想本地化服务持续引领企业智能化发展
发布时间:2020-06-17 15:57来源: 网络整理(原标题:NVIDIA DGX A100中国“首秀”,联想本地化服务持续引领企业智能化发展)
2020年6月17日—企业智能化转型的引领者联想企业科技集团再次实现突破,成为NVIDIA 合作伙伴中首家完成NVIDIA DGX A100在中国落地的企业,而这距离NVIDIA在美国发布该AI系统仅两周时间。DGX A100是适用于所有AI工作负载的通用系统,能够将训练、推理、分析整合至易于部署的单一人工智能基础架构,为企业提供前所未有的运算密度、效能和弹性。联想企业科技集团通过对本地客户业务的深度洞悉,以及在实际使用中对系统性能要求的深度理解,为客户提供定制化的DGX A100端到端解决方案,再一次证明其助力企业智能化转型的上乘实力。
NVIDIA DGX A100
强大“内芯”,支持客户AI能力不断升级
随着AI连续三年被写进政府工作报告,这一前沿技术已上升为国家战略。而“新基建”浪潮则再次提升了AI的重要性。当前,教育、医疗、交通、制造等各行各业的发展都对AI赋能有着极大需求,如何推动AI在场景中的成功落地,已成为行业共同面对的重要发展课题。
AI平台架构是推进所有人工智能应用的重要基础,通过深度学习,平台架构的每次升级和扩容都能为企业的业务性能带来又一次的飞跃,然而,这个过程如果没有GPU的支持,等待深度学习的训练和推理结果可能需要几天甚至长达几个月的时间。高速GPU则是成功部署AI的关键之所在,它能够将训练时间大幅缩短,迅速获得反馈,从而快速迭代深度学习网络。同时,如果配有多GPU,还可以实现深度学习模型的并行训练,有效扩展神经网络训练规模,支持上千万或上亿级别的训练样本的使用。
为此,联想凌拓在中国首次引进了新一代NVIDIA DGX A100。该系统在6U的机箱里蕴含了5 petaFLOPS(五千万亿次浮点运算/秒)的AI性能,并整合了八个具有TF32的第三代NVIDIA A100 Tensor Core GPU,能在无需更改任何代码的情况下,使FP32精度下的AI性能达到1289Seq/s。A100 GPU相比V100 GPU可以提升6倍的BERT(NLP——自然语言处理模型)预训练性能,充分满足客户对扩容后的计算要求。与此同时,DGX A100配置了2个AMD Rome 7742 CPU,还率先采取PCIe4.0规范,提供出色的I/0和内存带宽。
NVIDIA DGX A100
此外,DGX A100采用了一项GPU至GPU的高速直接互联技术——第三代NVLink,相较于传统PCIe配置,其提供了更加优秀的性能表现。该技术将GPU对GPU的直接频宽加倍至每秒600GB,几乎是PCIe4.0的10倍,搭配NVSwitch,DGX A100可以提供更大的GPU频宽,更多的连接,及更佳的扩展性。
为提供进一步的扩展,DGX A100平台支持多达9个NVIDIA Mellanox ConnectX-6 HDR 200Gb/s InfiniBand适配器。这使得DGX A100平台能够实现横向扩展,并支持构建性能强大的集群系统。高速互联技术支持RDMA技术,能够实现GPUDirect通信。这提供了高效率、高吞吐量、低延迟的GPU到GPU和GPU到存储的通信,将数据写入需要的内存。因此,其能为最严苛的工作任务提供无与伦比的性能和可拓展性。
ConnectX-6 HDR 200Gb/s InfiniBand适配器
定制化解决方案,赋能客户业务
DGX A100的中国“首秀”诞生在互联网领域。该客户是一家在互联网金融风险管理领域运用AI技术的先驱,风险管理作为互联网金融机构的核心能力,涉及了大量数据。而深度学习可以基于真实事件的发生概率建立模型,通过模拟价格的深层信息的局部特征生成一个价格空间,从而对价格进行预测,形成风险预警体系,为企业提供智能辅助决策信息。
联想在与这一客户的长期合作中,知悉到尽管该客户的深度学习系统里已经使用了上千片GPU,但仍无法满足训练需求,并且现在需要对系统进行扩容和升级,因此,联想基于DGX A100的优秀性能,打造了一套定制化解决方案,未来,通过实地应用,客户的深度学习系统的GPU容量将在原基础上每年增加20%、GPU集群可并发处理两倍的AI训练任务、频宽也将达到16GT/s,互联能力更迅速并更具扩展性。
不忘初心,用服务为智能化转型保驾护航
我国正在紧锣密鼓地部署“新型基础设施建设”,以此带动中国经济新一轮的高质量发展。人工智能作为“新基建”的重要组成部分,将为产业智能化升级、实现数字经济快速发展提供强大支持。联想企业科技集团在数据、算力、算法方面具有多年的深厚积累,占据AI发展的先机。同时,联想企业科技集团时刻牢记初心,秉承“客户为中心”的理念,洞悉客户的业务发展需求,提供端到端解决方案,从咨询、设计到实施,把控项目周期各个环节,使客户即使首次使用新型智能基础架构也可以无惧风险,专注于自身业务。