首页>动态 >内容

Nvidia释出开源GPU资料科学平台RAPIDS

动态2021-02-27 06:04:50
最佳答案

Nvidia推出名为RAPIDS的机器学习平台,其包含的软体函式库可以让资料科学家方便的使用GPU的运算能力,执行端到端的资料科学以及分析工作管线,RAPIDS使用CUDA进行低阶计算最佳化,并提供Python介面方便资料科学家使用GPU的高效能运算能力。

RAPIDS的目的是要提供企业高效能运算能力,以解决需要处理大量资料的高度複杂问题,像是信用卡盗刷、预测库存或是了解消费者的购买行为。Nvidia创办人兼执行长黄仁勋提到,现今企业越来越仰赖资料驱动,而资料分析以及机器学习现正是高效能运算的热门领域。

开源的RAPIDS是一套基于GPU分析的CUDA加速函式库,可用来执行机器学习以及资料视觉化,目前现阶段提供了五个热门机器学习函式库,并加上了GPU加速,如此便能更快的迭代并最佳化人工智慧训练,以获得更好的模型準确度。

RAPIDS是Nvidia和开源社群花费两年共同打造的平台,Nvidia表示,这是第一次为资料科学家提供在GPU上执行资料科学工作所需要的完整工具。该平台使用XGBoost机器学习演算法,在Nvidia DGX-2TM系统上进行训练,其实验结果显示,与仅使用CPU的系统相比,速度提升了50倍。这将能让模型训练时间从数天缩短到数小时,数小时下降至数分钟。

RAPIDS建立在热门的开源专案上,包括了Apache Arrow、Pandas和Scikit-learn,并在Python资料科学工具链中加入了GPU加速。而且为了增加RAPIDS的功能,黄仁勋提到,Nvidia有多个相关专案正在进行,正与Anaconda、BlazingDB、Databricks、Quansight和Scikit-learn等开源生态贡献者合作。

Apache Spark技术团队所创立的企业Databricks创办人Matei Zaharia表示,他们对RAPIDS能够加速Apache Spark工作负载感兴趣,现在正进行多个计画,以便整合Spark与原生加速器,其中包括对Apache Arrow的支援,以Hydrogen专案进行GPU排程,Databricks认为,RAPIDS将能扩展企业在资料科学以及人工智慧方面的工作负载。 

RAPIDS获得一系列大型科技公司的支援,其中包括甲骨文透过Nvidia Cloud在Oracle Cloud Infrastructure上支援RAPIDS,并且也将在Oracle Data Science Cloud中支援。而IBM也宣布将在企业机房、公有云、混合云和多云环境中,透过IBM Cloud、PowerAI和IBM Watson Studio支援RAPIDS。Nvidia还提到,Hp、思科、戴尔和联想也都将在自家系统支援RAPIDS。

免责声明:本文由用户上传,如有侵权请联系删除!