华为:昇腾AI计算平台训练出准万亿MoE模型|界面新闻 · 快讯

DANBgkqhk 17 0

5月30日消息,华为宣布推出参数规模高达7180亿的全新模型盘古Ultra MoE,这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。据悉,盘古团队提出Depth-Scaled Sandwich-Norm(DSSN)稳定架构和TinyInit小初始化的方法,在昇腾平台上实现了超过18TB数据的长期稳定训练。在训练方法上,华为团队首次披露在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习(RL)后训练框架的关键技术,使RL后训练进入超节点集群时代。

  • 马斯克大胆预测:5年内机器人将超越人类最顶尖的外科医生|界面新闻 · 科技
  • 中证协更新一批“问题保代”名单,全链条惩戒体系重塑行业生态|界面新闻 · 快讯
  • 黄仁勋:英伟达个人AI计算机DGX Spark已全面投产|界面新闻 · 科技
  • 央行:将更有针对性的拓宽民营企业多元化融资渠道|界面新闻 · 快讯
  • 创新积分制2.0版要来了,科技部、央行等多部门解读科技金融政策|界面新闻
  • 美国商家等待义乌“拯救”今年圣诞季|界面新闻
  • 盐津铺子放话在海外“再造一个盐津”,这可能吗?|界面新闻
  • 打新早报 | 新能源充电设备一梯队上市,优优绿能值得申购么?|界面新闻 · 证券
  • 网红“曲曲大女人”被曝偷税被罚758万元,其产品仍照常售卖|界面新闻 · 中国
  • 优衣库线上订单不再支持到线下门店退货|界面新闻
  • 法国首次回应“阵风”战机疑被击落:正与印度保持沟通|界面新闻 · 天下
  • 李强主持召开国务院常务会议|界面新闻 · 快讯
  • 领益智造:已通过全球产能布局对冲国际贸易不确定性影响|界面新闻 · 快讯
  • 生物威胁等科研急需“续费”,哈佛要求解冻25亿美元政府资金|界面新闻 · 天下
  • 预挂牌仅不到半个月,锦龙股份终止出售中山证券股权,发生了什么?|界面新闻
  • 抱歉,评论功能暂时关闭!