rllm
活跃·★ 5.6k·Apache-2.0·更新于 2026-05-28
★ 时下流行
rLLM是一个通过强化学习对语言代理进行后训练的开源框架。
rLLM是一个开源框架,旨在使用强化学习对语言代理进行后训练。它使用户能够轻松构建、训练和部署自定义代理和环境,以应对实际工作负载。
#强化学习#语言代理#大型语言模型#深度学习框架#后训练
01
功能特性
01基于强化学习的语言代理后训练开源框架。
02支持构建、训练和部署自定义代理和环境。
03提供包括'verl'和'tinker'在内的多种训练后端。
04支持LoRA和VLM训练,用于高级模型。
05包含AgentWorkflowEngine,用于训练任意代理程序。
02
兼容性
Python
支持
已通过文档验证
verl
原生后端
已通过文档验证
tinker
原生后端
已通过文档验证
uv
推荐
已通过文档验证
Docker
支持
已通过文档验证
03
快速开始
1
$ uv pip install "rllm[verl] @ git+https://github.com/rllm-org/rllm.git"
04
使用场景
↳训练用于代码生成和错误修复等任务的强大编码模型。
↳开发用于自动化任务的复杂软件工程代理。
↳使用强化学习技术构建和评估多代理系统。
05
同类工具
相关搜索
评论
登录后发表评论
- OOaklyn Clark2026年5月2日
Multi-agent democratizing coordination is handled better than competing frameworks. Solid addition to the AI tooling stack.
- RRiley Johnson2026年4月24日
Multi-agent democratizing coordination is handled better than competing frameworks — democratizing reinforcement learning for llms. Integrates well with existing democratizing s...
- AAlex Martinez2026年4月21日
Multi-agent democratizing coordination is handled better than competing frameworks — democratizing reinforcement learning for llms. Good documentation, reduces onboarding time.