AReaL
活跃·★ 5.2k·更新于 2026-05-29
★ 时下流行
AReaL是一个开源、完全异步的强化学习训练系统,专注于大型推理和智能体模型,支持从单节点到千卡GPU的扩展。
AReaL是一个为大型推理和智能体模型设计的开源、完全异步的强化学习训练系统。它具有出色的灵活性、业界领先的速度以及从单节点到千卡GPU的扩展能力,实现了最先进的性能。
#强化学习#大型语言模型#异步系统#智能体AI#可扩展训练
01
功能特性
01完全异步强化学习训练:提供稳定、业界领先速度的强化学习训练。
02高可扩展性:可从单节点无缝扩展到1000+ GPU。
03灵活的智能体推演:易于定制多轮智能体推演工作流,并与外部框架集成。
04前沿性能:在数学、编码和搜索智能体方面达到最先进水平。
05开源与可复现:提供完整的训练细节、数据和基础设施以复现结果。
02
兼容性
Ascend NPU
稳定支持
已通过文档验证
Megatron
部分集成
已通过文档验证
PyTorch FSDP
部分集成
已通过文档验证
vLLM
部分集成
已通过文档验证
SGLang
部分集成
已通过文档验证
03
快速开始
1
$ pip install -e ".[dev,docs]"
04
使用场景
↳训练推理智能体:开发能够处理复杂数学、编码和通用推理任务的AI智能体。
↳大型语言模型对齐(RLHF):利用人类反馈强化学习对大型语言模型进行微调。
↳多轮智能体工作流:实现和定制具有自校正和工具集成的迭代智能体行为。
05
同类工具
相关搜索
评论
登录后发表评论
暂无评论,来发表第一条吧