AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
Vision / Multimodal/
rllm
rllm logo

rllm

活跃·★ 5.6k·Apache-2.0·更新于 2026-05-28
★ 时下流行

rLLM是一个通过强化学习对语言代理进行后训练的开源框架。

rLLM是一个开源框架,旨在使用强化学习对语言代理进行后训练。它使用户能够轻松构建、训练和部署自定义代理和环境,以应对实际工作负载。

#强化学习#语言代理#大型语言模型#深度学习框架#后训练
$ 安装
$ uv pip install "rllm[verl] @ git+https://github.com/rllm-org/rllm.git"
↗ 访问官网★ GitHub
01

功能特性

01基于强化学习的语言代理后训练开源框架。
02支持构建、训练和部署自定义代理和环境。
03提供包括'verl'和'tinker'在内的多种训练后端。
04支持LoRA和VLM训练,用于高级模型。
05包含AgentWorkflowEngine,用于训练任意代理程序。
02

兼容性

Python
支持
已通过文档验证
verl
原生后端
已通过文档验证
tinker
原生后端
已通过文档验证
uv
推荐
已通过文档验证
Docker
支持
已通过文档验证
03

快速开始

1
$ uv pip install "rllm[verl] @ git+https://github.com/rllm-org/rllm.git"
04

使用场景

↳训练用于代码生成和错误修复等任务的强大编码模型。
↳开发用于自动化任务的复杂软件工程代理。
↳使用强化学习技术构建和评估多代理系统。
05

同类工具

ragflow logo
ragflow★ 81.5k
RAGFlow 是一个领先的开源检索增强生成 (RAG) 引擎,它融合了前沿的RAG与Agent能力,为大型语言模型提供卓越的上下文层,并简化企业级RAG工作流。
vs →
n8n logo
n8n★ 190.2k
n8n是一个工作流自动化平台,为技术团队提供了代码的灵活性和无代码的速度,拥有400多个集成和原生的AI能力。
vs →
Context7 logo
Context7★ 56.4k
Context7 MCP 为大型语言模型提供最新、版本特定的代码文档和示例,以避免过时或虚假的信息。
vs →
Brave Search MCP logo
Brave Search MCP★ 86.5k
此仓库是模型上下文协议(MCP)参考实现的集合,展示了如何为大型语言模型提供安全、受控的工具和数据源访问。
vs →
MaxKB logo
MaxKB★ 21.1k
MaxKB 是一个强大易用的开源企业级智能体构建平台。
vs →
Pydantic AI logo
Pydantic AI★ 17.4k
Pydantic AI 是一个 Python 代理框架,旨在帮助您快速、自信、轻松地构建生产级生成式AI应用和工作流。
vs →
PocketFlow-Tutorial-Codebase-Knowledge logo
PocketFlow-Tutorial-Codebase-Knowledge★ 12.3k
该项目利用AI将GitHub代码库转化为易于理解的初学者教程。
vs →
deer-flow logo
deer-flow★ 70.0k
DeerFlow是一个社区驱动的深度研究框架,旨在结合语言模型与专业工具(如网络搜索、爬虫和Python代码执行)进行高效研究。
vs →
查看全部替代品 →

相关搜索

rllm 替代工具最佳 Vision / Multimodal 工具 2026开源 Vision / Multimodalrllm 教程rllm 对比Reinforcement LearningLanguage AgentsLLM

评论

登录后发表评论
  • O
    Oaklyn Clark2026年5月2日

    Multi-agent democratizing coordination is handled better than competing frameworks. Solid addition to the AI tooling stack.

  • R
    Riley Johnson2026年4月24日

    Multi-agent democratizing coordination is handled better than competing frameworks — democratizing reinforcement learning for llms. Integrates well with existing democratizing s...

  • A
    Alex Martinez2026年4月21日

    Multi-agent democratizing coordination is handled better than competing frameworks — democratizing reinforcement learning for llms. Good documentation, reduces onboarding time.

本页内容
01功能特性02兼容性03快速开始04使用场景05同类工具
统计
GitHub Stars★ 5.6k
最后更新2天前
状态活跃
许可证Apache-2.0
分类视觉/多模态
热度趋势 (30d)
+0.2k↑ 4.6%
链接
文档↗讨论↗问题↗版本↗

Deploy on DigitalOcean — Get $200 Free Credit

Ad
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。