AReaL 是开源的吗？

请查看官方仓库了解许可证详情。

AReaL

Q: AReaL 是开源的吗？

请查看官方仓库了解许可证详情。

活跃·★ 5.2k·更新于 2026-05-29

★ 时下流行

AReaL是一个开源、完全异步的强化学习训练系统，专注于大型推理和智能体模型，支持从单节点到千卡GPU的扩展。

AReaL是一个为大型推理和智能体模型设计的开源、完全异步的强化学习训练系统。它具有出色的灵活性、业界领先的速度以及从单节点到千卡GPU的扩展能力，实现了最先进的性能。

#强化学习#大型语言模型#异步系统#智能体AI#可扩展训练

功能特性

01完全异步强化学习训练：提供稳定、业界领先速度的强化学习训练。

02高可扩展性：可从单节点无缝扩展到1000+ GPU。

03灵活的智能体推演：易于定制多轮智能体推演工作流，并与外部框架集成。

04前沿性能：在数学、编码和搜索智能体方面达到最先进水平。

05开源与可复现：提供完整的训练细节、数据和基础设施以复现结果。

兼容性

Ascend NPU

稳定支持

已通过文档验证

Megatron

部分集成

已通过文档验证

PyTorch FSDP

部分集成

已通过文档验证

vLLM

部分集成

已通过文档验证

SGLang

部分集成

已通过文档验证

快速开始

$ pip install -e ".[dev,docs]"

使用场景

↳训练推理智能体：开发能够处理复杂数学、编码和通用推理任务的AI智能体。

↳大型语言模型对齐（RLHF）：利用人类反馈强化学习对大型语言模型进行微调。

↳多轮智能体工作流：实现和定制具有自校正和工具集成的迭代智能体行为。

同类工具

MetaGPT★ 68.4k

MetaGPT是一个多智能体框架，为大型语言模型（LLMs）分配不同的角色，使其能够协作完成复杂任务。

vs →

cua★ 17.3k

Cua是一个开源平台，用于构建、基准测试和部署能够操作任何计算机的智能体，并提供隔离的、可自托管的沙盒环境（Docker、QEMU、Apple Vz）。

vs →

agentscope★ 25.8k

AgentScope是一个生产就绪、易于使用的智能体框架，具备核心抽象层，支持不断提升的模型能力和内置微调功能。

vs →

ChatGPT on WeChat★ 44.9k

ChatGPT-on-Wechat是一个基于大模型的智能对话机器人框架，支持多平台接入、多模态消息处理、丰富插件和知识库定制企业AI应用。

vs →

devin.cursorrules★ 6.0k

一个将Cursor/Windsurf IDE或GitHub Copilot转变为类Devin高级AI助手的工具包。

vs →

rllm★ 5.6k

rLLM是一个通过强化学习对语言代理进行后训练的开源框架。

vs →

ir-sim★ 1.1k

IR-SIM是一个基于Python的轻量级开源机器人模拟器，专为导航、控制和强化学习设计，提供用户友好的框架以快速原型开发。

vs →

langchain4j-aideepin★ 1.3k

LangChain4j-AIDeepin（得应AI）是基于AI的工作效率提升工具。

vs →

查看全部替代品 →

AReaL

活跃·★ 5.2k·更新于 2026-05-29

★ 时下流行

AReaL是一个开源、完全异步的强化学习训练系统，专注于大型推理和智能体模型，支持从单节点到千卡GPU的扩展。

#强化学习#大型语言模型#异步系统#智能体AI#可扩展训练

功能特性

01完全异步强化学习训练：提供稳定、业界领先速度的强化学习训练。

02高可扩展性：可从单节点无缝扩展到1000+ GPU。

03灵活的智能体推演：易于定制多轮智能体推演工作流，并与外部框架集成。

04前沿性能：在数学、编码和搜索智能体方面达到最先进水平。

05开源与可复现：提供完整的训练细节、数据和基础设施以复现结果。

兼容性

Ascend NPU

稳定支持

已通过文档验证

Megatron

部分集成

已通过文档验证

PyTorch FSDP

部分集成

已通过文档验证

vLLM

部分集成

已通过文档验证

SGLang

部分集成

已通过文档验证

快速开始

$ pip install -e ".[dev,docs]"

使用场景

↳训练推理智能体：开发能够处理复杂数学、编码和通用推理任务的AI智能体。

↳大型语言模型对齐（RLHF）：利用人类反馈强化学习对大型语言模型进行微调。

↳多轮智能体工作流：实现和定制具有自校正和工具集成的迭代智能体行为。

同类工具

MetaGPT★ 68.4k

MetaGPT是一个多智能体框架，为大型语言模型（LLMs）分配不同的角色，使其能够协作完成复杂任务。

vs →

cua★ 17.3k

Cua是一个开源平台，用于构建、基准测试和部署能够操作任何计算机的智能体，并提供隔离的、可自托管的沙盒环境（Docker、QEMU、Apple Vz）。

vs →

agentscope★ 25.8k

AgentScope是一个生产就绪、易于使用的智能体框架，具备核心抽象层，支持不断提升的模型能力和内置微调功能。

vs →

ChatGPT on WeChat★ 44.9k

ChatGPT-on-Wechat是一个基于大模型的智能对话机器人框架，支持多平台接入、多模态消息处理、丰富插件和知识库定制企业AI应用。

vs →

devin.cursorrules★ 6.0k

一个将Cursor/Windsurf IDE或GitHub Copilot转变为类Devin高级AI助手的工具包。

vs →

rllm★ 5.6k

rLLM是一个通过强化学习对语言代理进行后训练的开源框架。

vs →

ir-sim★ 1.1k

IR-SIM是一个基于Python的轻量级开源机器人模拟器，专为导航、控制和强化学习设计，提供用户友好的框架以快速原型开发。

vs →

langchain4j-aideepin★ 1.3k

LangChain4j-AIDeepin（得应AI）是基于AI的工作效率提升工具。

vs →

查看全部替代品 →

AReaL

功能特性

兼容性

快速开始

使用场景

同类工具

相关搜索

评论

AReaL

功能特性

兼容性

快速开始

使用场景

同类工具

相关搜索

评论