黄世宇-OpenRL支持大模型训练的强化学习框架与大模型时代的PluginStore

其他报告

科技传媒

2024-08-26

新用户首篇研报专享优惠价

VIP会员可免费获取全部研报，开通VIP

报告摘要

OpenRL:AUnifiedReinforcementLearningFramework黄世宇第四范式演讲嘉宾黄世宇第四范式强化学习科学家，开源强化学习OpenRLLab负责人本科与博士.

DJ

大吉研报

专业研究报告平台

·科技传媒

黄世宇-OpenRL支持大模型训练的强化学习框架与大模型时代的PluginStore

其他报告2024-08-26

www.djyanbao.cc

购买后查看完整研报

浏览 1