verl-agent
活跃·★ 1.9k·Apache-2.0·更新于 2026-05-28
★ 时下流行
verl-agent是veRL的扩展,专为通过强化学习训练大型语言模型(LLM)代理而设计,其独特的步进独立多轮回滚机制使其能高度可扩展地处理长周期多轮RL训练。
`verl-agent` 扩展了 veRL,通过强化学习训练大型语言模型代理,并引入了新颖的步进独立多轮回滚机制。这种设计通过定制化的每步输入结构和内存管理,确保了长周期任务的高度可扩展性。
#LLM代理#强化学习#深度学习#多轮交互#可扩展性
01
功能特性
01多轮代理-环境交互
02完全可定制的内存模块和每步输入结构
03可扩展至超长周期优化
04并行化的Gym风格环境及分组环境支持
05多样化的强化学习算法
02
兼容性
veRL
原生集成
已通过文档验证
ROLL
支持
已通过文档验证
OpenManus-RL
支持
已通过文档验证
03
快速开始
1
$ pip install -e .
04
使用场景
↳为复杂的、多轮次长周期任务训练大型语言模型代理。
↳开发适用于视觉和文本环境的推理代理。
↳解决数字界面控制、具身AI和搜索相关的挑战。
05
同类工具
相关搜索
评论
登录后发表评论
暂无评论,来发表第一条吧