rllm 是开源的吗？

是的，采用 Apache-2.0 许可证。

rllm

活跃·★ 5.6k·Apache-2.0·更新于 2026-05-28

★ 时下流行

rLLM是一个通过强化学习对语言代理进行后训练的开源框架。

rLLM是一个开源框架，旨在使用强化学习对语言代理进行后训练。它使用户能够轻松构建、训练和部署自定义代理和环境，以应对实际工作负载。

#强化学习#语言代理#大型语言模型#深度学习框架#后训练

功能特性

01基于强化学习的语言代理后训练开源框架。

02支持构建、训练和部署自定义代理和环境。

03提供包括'verl'和'tinker'在内的多种训练后端。

04支持LoRA和VLM训练，用于高级模型。

05包含AgentWorkflowEngine，用于训练任意代理程序。

兼容性

Python

支持

已通过文档验证

verl

原生后端

已通过文档验证

tinker

原生后端

已通过文档验证

快速开始

$ uv pip install "rllm[verl] @ git+https://github.com/rllm-org/rllm.git"

使用场景

↳训练用于代码生成和错误修复等任务的强大编码模型。

↳开发用于自动化任务的复杂软件工程代理。

↳使用强化学习技术构建和评估多代理系统。

rllm

活跃·★ 5.6k·Apache-2.0·更新于 2026-05-28

★ 时下流行

rLLM是一个通过强化学习对语言代理进行后训练的开源框架。

rLLM是一个开源框架，旨在使用强化学习对语言代理进行后训练。它使用户能够轻松构建、训练和部署自定义代理和环境，以应对实际工作负载。

#强化学习#语言代理#大型语言模型#深度学习框架#后训练

功能特性

01基于强化学习的语言代理后训练开源框架。

02支持构建、训练和部署自定义代理和环境。

03提供包括'verl'和'tinker'在内的多种训练后端。

04支持LoRA和VLM训练，用于高级模型。

05包含AgentWorkflowEngine，用于训练任意代理程序。

兼容性

Python

支持

已通过文档验证

verl

原生后端

已通过文档验证

tinker

原生后端

已通过文档验证

快速开始

$ uv pip install "rllm[verl] @ git+https://github.com/rllm-org/rllm.git"

使用场景

↳训练用于代码生成和错误修复等任务的强大编码模型。

↳开发用于自动化任务的复杂软件工程代理。

↳使用强化学习技术构建和评估多代理系统。

rllm

功能特性

兼容性

快速开始

使用场景

同类工具

相关搜索

评论

rllm

功能特性

兼容性

快速开始

使用场景

同类工具

相关搜索

评论