添加链接

注册登录

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

有腹肌的警车 · 斗罗：凤神马红俊，截娶朱竹清！_(典火)小说 ...· 1 月前 ·

潇洒的茶叶 · 【新闻发布会】广东省稳工业“1+3”系列增量 ...· 2 月前 ·

淡定的鸭蛋 · 在更高起点上推进改革开放——沿着总书记的足迹 ...· 3 月前 ·

任性的柿子 · 最终幻想XV - 萌娘百科万物皆可萌的百科全书· 1 年前 ·

行走的楼房 · 新概念英语第1~3册笔记~ - 知乎· 1 年前 ·

下载App
扫一扫，下载

 登录/注册

周期合伙人 ()

修改于2023-04-13 13:25 来自雪球 · 上海

 关注

来源：雪球App，作者：周期合伙人，（https://xueqiu.com/6347482150/247307557）

AI芯片的一些变化：

DeepSpeed Chat具有以下三大核心功能：

1. 简化ChatGPT类型模型的训练和强化推理体验

开发者只需一个脚本，就能实现多个训练步骤，并且在完成后还可以利用推理API进行对话式交互测试。

2. DeepSpeed-RLHF模块

DeepSpeed-RLHF复刻了InstructGPT论文中的训练模式，并提供了数据抽象和混合功能，支持开发者使用多个不同来源的数据源进行训练。

3. DeepSpeed-RLHF系统

团队将DeepSpeed的训练（training engine）和推理能力（inference engine) 整合成了一个统一的混合引擎（DeepSpeed Hybrid Engine or DeepSpeed-HE）中，用于RLHF训练。由于，DeepSpeed-HE能够无缝地在推理和训练模式之间切换，因此可以利用来自DeepSpeed-Inference的各种优化。

DeepSpeed-RLHF系统在大规模训练中具有无与伦比的效率，使复杂的RLHF训练变得快速、经济并且易于大规模推广：

高效且经济：

DeepSpeed-HE比现有系统快15倍以上，使RLHF训练快速且经济实惠。例如，DeepSpeed-HE在Azure云上只需9小时即可训练一个OPT-13B模型，只需18小时即可训练一个OPT-30B模型。

这两种训练分别花费不到300美元和600美元

对算力的影响有待观察，暂时还在PPT阶段。

$寒武纪-U(SH688256)$ $芯原股份(SH688521)$ $景嘉微(SZ300474)$



推荐文章

有腹肌的警车 · 斗罗：凤神马红俊，截娶朱竹清！_(典火)小说最新章节全文免费在线阅读下载-QQ阅读

1 月前

潇洒的茶叶 · 【新闻发布会】广东省稳工业“1+3”系列增量政策新闻发布会_政策解读_江门市供销合作联社

2 月前

淡定的鸭蛋 · 在更高起点上推进改革开放——沿着总书记的足迹之广东篇_中华人民共和国最高人民检察院

3 月前

任性的柿子 · 最终幻想XV - 萌娘百科万物皆可萌的百科全书

1 年前

行走的楼房 · 新概念英语第1~3册笔记~ - 知乎

1 年前

今天看啥 · Py中国 · codingpro · 藏经阁 · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

link之家 - 链接快照平台

© 2024 ~ 沪ICP备11025650号