AReaL:AReaL是一个为大型推理和智能体模型设计的开源、完全异步的强化学习训练系统。它具有出色的灵活性、业界领先的速度以及从单节点到千卡GPU的扩展能力,实现了最先进的性能。;mini-swe-agent:Mini-SWE-agent 是一个轻量级的AI智能体,仅用100行代码实现,旨在解决GitHub问题及更多任务,提供比大型编码智能体更简化但性能优异的替代方案。它专注于极简主义、在SWE-bench等基准测试上的高性能表现,以及在各种环境中的轻松部署。
训练推理智能体:开发能够处理复杂数学、编码和通用推理任务的AI智能体。
研究人员用于无冗余的基准测试、微调或强化学习实验