您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:DeepSpeed Chat具有以下三大核心功能:1. 简化ChatGPT类型模 - 发现报告
当前位置:首页/会议纪要/报告详情/

DeepSpeed Chat具有以下三大核心功能:1. 简化ChatGPT类型模

2023-04-13未知机构持***
DeepSpeed Chat具有以下三大核心功能:1. 简化ChatGPT类型模

DeepSpeedChat具有以下三大核心功能:1.简化ChatGPT类型模型的训练和强化推理体验 开发者只需一个脚本,就能实现多个训练步骤,并且在完成后还可以利用推理API进行对话式交互测试。 2.DeepSpeed-RLHF模块 DeepSpeed-RLHF复刻了InstructGPT论文中的训练模式,并提供了数据抽象和混合功能,支持开发者使用多个不同来源的数据源进行训练。 3.DeepSpeed-RLHF系统 团队将DeepSpeed的训练(trainingengine)和推理能力(inferenceengine)整合成了一个统一的混合引擎(DeepSpeedHybridEngineorDeepSpeed-HE)中,用于RLHF训练。 由于,DeepSpeed-HE能够无缝地在推理和训练模式之间切换,因此可以利用来自DeepSpeed-Inference的各种优化。 DeepSpeed-RLHF系统在大规模训练中具有无与伦比的效率,使复杂的RLHF训练变得快速、经济并且易于大规模推广:高效且经济: DeepSpeed-HE比现有系统快15倍以上,使RLHF训练快速且经济实惠。 例如,DeepSpeed-HE在Azure云上只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个OPT-30B模型。