Uber贡献其分散式训练框架Horovod给LF深度学习基金会

每日动态2021-02-25 22:05:19
最佳答案

Uber宣布将其为TensorFlow、Keras和PyTorch开发的分散式训练框架Horovod开源专案,贡献给深度学习基金会。深度学习基金会则是在Linux基金会旗下,负责进行人工智慧、机器学习和深度学习领域创新。

Horovod在2017年10月,Uber以Apache 2.0授权许可开源发布,Horovod能让人工智慧开发者轻鬆的使用TensorFlow、Keras和PyTorch机器学习框架,训练分散式深度学习模型。不少云端服务都已经整合了Horovod,包括AWS深度学习服务AMI、Azure资料科学虚拟机器、Databricks Runtime、GCP深度学习虚拟机器、IBM FfDL、IBM Watson Studio和NVIDIA GPU Cloud等。

Horovod使用Open MPI在节点间传递讯息,得力于Nvidia的集体通讯函式库(Nvidia Collective Communications Library,NCCL)为其提供的最佳化高效能通讯演算法,让Horovod可以使用多达512个Nvidia Pascal GPU,在Inception V3和ResNet-101达到了90%的扩展效率,而VGG-16也有68%的扩展效率。

Horovod专案负责人Alex Sergeev表示,Uber开发了Horovod,让各行各业的人工智慧研究人员,能以更快且更直觉的方式进行深度学习模型训练,而在贡献给深度学习基金会之后,随着Horovod功能和应用方面的成熟,将进一步扩展其在开源生态系的影响力。

免责声明:本文由用户上传,如有侵权请联系删除!