展望新一代高效能运算应用崛起Nvidia彙整多种领域开源软体并提供新型云端GPU加速卡推动各产业应用

人工智能2021-02-26 16:04:55
最佳答案

【美国达拉斯现场报导】本週举行的美国超级电脑大会刚好满三十周年,Nvidia公司创办人暨执行长黄仁勋在这场活动期间,以新一代高效能运算(New HPC)为题发表演讲,探讨他们对于现今HPC应用的最新看法,并介绍该公司今年针对机器学习加速而发展的开放原始码软体套件RAPIDS,以及去年发表的云端加速容器登录服务NGC(Nvidia GPU Cloud)最新进展,同时,也揭露他们在云端GPU横向扩展应用的最新产品Nvidia T4 Cloud GPU。

加速推动资料科学应用,不能单靠深度学习技术,Nvidia重申机器学习的重要性,并且持续扩充云端容器登录服务版图

在加速运算的发展上,Nvidia最着名的是旗下的GPU加速技术,然而他们长期发展的统一运算架构CUDA,也随着该公司GPU架构的进展而持续推出新版,并且保持各个世代架构的相容,以及针对整个技术堆叠进行全面的最佳化,因此,在高效能运算的应用领域,伺服器也能因为搭配多张GPU加速卡,而获得大幅领先纯CPU伺服器的运算效能。

不过,承担大量高效能运算工作负载的资料中心,现今所需执行的相关应用程式类型越来越繁杂,根据统计,有数百种、甚至数千种之多,而且除了因应高效能运算的各种模拟、机器学习、深度学习,随着人工智慧的应用崛起,超大规模环境与企业环境的机器学习与深度学习,也将是未来高效能运算技术发展的重点。

对于这样的新局面,黄仁勋特别提到他们在GTC欧洲大会宣布推出的开源软体套餐RAPIDS,希望透过当中整合的程式库,提供一套支援CUDA加速的资料科学工作流程,目前已有多个开源软体社群、新创公司、企业级资料科学平台厂商、云端服务业者,开始採用。

Nvidia另一个能够协助资料科学应用开发的资源,则是他们去年发表的云端容器登录服务Nvidia GPU Cloud(NGC),在这次超级电脑大会期间,黄仁勋也谈到目前这套服务的最新进展,像是:提供新的加速容器映像,以及多节点架构的容器部署,并且支援在高效能运算领域备受关注的容器Singularity;同时,NGC原本诉求的执行环境,主要是公有云服务,如今也能用于获得「NGC-Ready」认证的工作站、丛集系统、云端服务等环境,应用情境更为宽广。

根据Nvidia的新闻稿内容,目前在伺服器的部份,总共有6款机型拿到NGC-Ready认证,分别是ATOS BullSequana X1125、Cisco UCS C480ML、Cray CS Storm NX、Dell EMC PowerEdge C4140、HPE Apollo 6500、Supermicro SYS-4029GP-TVRT;工作站的部份,则有HP Z8、联想ThinkStation P920;而在云端服务的部份,原本就有Amazon EC2,后来,Google Cloud Platform、Microsoft Azure、Oracle Cloud Infrastructure等业者,陆续提供支援。当然,还有Nvidia自家的DGX Systems系列整合应用设备,以及特定的Titan与Quadro GPU,也支援NGC。

针对资料中心GPU横向扩展需求,提供新的加速卡

在资料中心对于GPU的效能扩充作法上,以往大多只能採用纵向扩展(Scale Up)的方式,改用运算效能更强劲的GPU加速卡,或是在单台伺服器安装多张GPU加速卡的方式,而在Nvidia今年推出的DGX-2,他们开始展现了一机16张GPU的配置,到了9月举行的GTC日本大会,他们宣布推出新的GPU加速卡Tesla T4,以及TensorRT Hyperscale Platform,支援超大规模的人工智慧推论应用。

于本週举行的美国超级电脑大会期间,黄仁勋则是提到可以用这套新型GPU加速卡与横向扩展(Scale Out)架构,来因应更大量的GPU使用,而根据Nvidia的新闻稿所公布的消息来看,每台运算节点最多可搭配20张Tesla P4,延展性有重大突破。

免责声明:本文由用户上传,如有侵权请联系删除!