黄世宇-OpenRL支持大模型训练的强化学习框架与大模型时代的PluginStore
其他报告
科技传媒
2024-08-26新用户首篇研报专享优惠价
VIP会员可免费获取全部研报,开通VIP
报告摘要
OpenRL:AUnifiedReinforcementLearningFramework黄世宇第四范式演讲嘉宾黄世宇第四范式强化学习科学家,开源强化学习OpenRLLab负责人本科与博士.
DJ
大吉研报
专业研究报告平台
·科技传媒
黄世宇-OpenRL支持大模型训练的强化学习框架与大模型时代的PluginStore
其他报告2024-08-26
www.djyanbao.cc
购买后查看完整研报
浏览 1下载 0