品玩9月11日讯,据Nous Research 官方消息,该团队现已推出一款名为 DisTrO的新优化器,可帮助降低大模型的门槛。
DisTrO 的神奇之处在于,它能够显著减少在训练 AI 模型时,多个图形处理单元(GPU)之间需要传输的信息量。通过这一创新,强大的 AI 模型可以在普通的网络条件下进行训练,甚至让全球各地的个人或机构联手合作,共同开发 AI 技术。
根据 Nous Research 的技术论文,DisTrO 的效率提升惊人,使用它的训练效率比一种常见的算法 ——All-Reduce 提高了857倍,同时每一步训练所需传输的信息量也从74.4GB 降低到了86.8MB。这样的提升,不仅让训练变得更快、更便宜,还意味着更多的人有机会参与到这个领域中来。

0 条评论
请「登录」后评论