微软推ZeRO++新系统:减少大模型训练时间和成本
时间:2023-06-26 17:28:25


(资料图片仅供参考)

站长之家(ChinaZ.com)6月26日 消息:微软研究人员推出了名为ZeRO++的新系统,用于优化训练大型AI模型,以应对高数据传输开销和有限带宽的难题。

ZeRO++ 建立在现有的 ZeRO 优化的基础上,并提供增强的通信策略,以提高训练效率,减少训练时间和成本。

像Turing-NLG、ChatGPT和GPT-4这样的大型模型的训练需要跨多个GPU设备占用大量内存和计算资源。DeepSpeed开发的ZeRO++引入了通信优化策略,以克服在每个GPU上批量大小较小时或在低带宽集群上进行训练时ZeRO的限制。

ZeRO优化系列包括ZeRO-Inference,它使用GPU的集体内存和计算能力,将模型状态分割在多个GPU之间。然而,在训练过程中,ZeRO可能会产生较高的通信开销。ZeRO++通过整合三组通信优化来解决这个问题:量化权重通信(qwZ)、分层权重分割(hpZ)和量化梯度通信(qgZ)。

为了减少参数通信量,ZeRO++对权重进行量化,利用基于块的量化方法来保持训练精度。这种优化的量化过程比基本量化更快更准确。为了在反向传播过程中尽量减少通信开销,ZeRO++通过在每台机器上保持完整的模型副本,以 GPU 内存换取通信。梯度通信方面,ZeRO++引入了一种新的量化梯度通信范式 qgZ,可以减少跨节点的流量和延迟。

这些通信优化大大减少了通信量。与ZeRO相比,ZeRO++实现了减少高达4倍的通信量,提高了训练吞吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO++相比ZeRO-3的吞吐量提高了28%至36%。在低带宽集群中,与ZeRO-3相比,ZeRO++实现了平均2倍的加速,使得大模型训练在更多种类的集群上更为可行。

ZeRO++不仅限于训练场景,还可应用于对话模型中使用的人类反馈强化学习(RLHF)训练。通过将ZeRO++与DeepSpeed-Chat集成,RLHF训练可以获得更好的生成和训练吞吐量,生成吞吐量提高了高达2.25倍,训练吞吐量提高了1.26倍,超过了ZeRO。

DeepSpeed已经发布了ZeRO++,以使大型模型的训练在AI社区更加高效和可访问。该系统旨在加快训练速度,减少通信开销,并实现更大的批量大小,从而节省时间和资源。研究人员和实践者可以利用ZeRO++更有效地训练像ChatGPT这样的模型,并在AI领域探索新的可能性。

(举报)

标签:

最新
  • 微软推ZeRO++新系统:减少大模型训练时间和成本

    微软推ZeRO++新系统:减少大模型训练时间和成本

  • 环球新动态:如何判断一家公司的股票高低?主力高度控盘为何不涨?

    如何判断一家公司的股票高低?在股票市场上,投资者可以根据以下因素

  • 三笘薰谈如何1对1:我现在也担心被对方抢断,可通过练习获得自信

    直播吧6月25日讯据日本雅虎体育报道,日本国脚三笘薰25日在东京出席了

  • 哇哦,迪卡侬造车了!!! 世界热文

    迪卡侬,最近开始搞事情了。不要以为它只是一个运动用品品牌。它在造车

  • 每日简讯:泰安6个项目入选省级“技改专项贷”贴息项目

    齐鲁网·闪电新闻6月25日讯 近日,省工业和信息化厅对2023年省级“技

  • 《尼尔:机械纪元》动画确定7月23日复播 一次播放4集|世界动态

    根据SE人气游戏改编,《尼尔:机械纪元》动画版在经历数次延期后,官方

  • 信用市场周度跟踪:4张表看信用债涨跌

    信用市场周度跟踪:4张表看信用债涨跌

  • 港媒:国泰航空致歉回应,9名受伤乘客已出院

    【环球网报道】据香港电台网站6月24日报道,国泰航空一班客机紧急疏散

  • 比亚迪入选《时代周刊》“最具影响力100家企业”榜单:世界上最重要的车企 天天即时看

    比亚迪入选《时代周刊》“最具影响力100家企业”榜单:世界上最重要的

  • 鸣志电器(603728):自动化浪潮蕴藏机遇 空心杯电机国内稀缺

    鸣志电器(603728):自动化浪潮蕴藏机遇空心杯电机国内稀缺

  • 大学生医保怎么报销(大学生医保可以报销多少)

    1、住院医疗费用先由个人垫付,出院后再凭《市城镇居民大学生医疗保卡

  • 警惕!医院一天收治4位心梗患者,他们有个共同点……

    近期,江苏省中西医结合医院一天收治了4位急性心梗患者最年轻的患者才3

  • 6月16日基金净值:华夏MSCI中国A50互联互通ETF最新净值0.7902,涨1.04%

    6月16日,华夏MSCI中国A50互联互通ETF最新单位净值为0 7902元,累计净

  • 6月16日基金净值:广发国证半导体芯片ETF最新净值1.0954,涨1.04%

    该基金近6个月的累计收益率走势如下图:该基金的基金经理为罗国庆,罗

  • 湖南省气象局启动暴雨四级应急响应|热点聚焦

    央视网消息:据“湖南天气”微信公众号消息,根据最新气象资料分析,受

  • 见实游学第11场:去首尔丽格了解医美行业的私域运营|世界快播报

    关注「见实」,获取超全一手私域案例合集今日头条:私域五大错误共识今

  • 旅游
    • 违规接受管理和服务对象宴请!宿迁通报4起违规吃喝典型问题

    • 神仙道3宝莲仙童阵容搭配分享

    • 全球热点!融资融券账户可以打新股吗?融资融券可以申购新股吗?

    • 短讯!基金大跌还能补仓吗?基金大跌可以买入吗?