AgileRL:AgileRL 是一个深度强化学习库,通过引入 RLOps(强化学习的 MLOps)来简化开发。它利用开创性的进化技术显著缩短训练时间和超参数优化过程,比现有最先进的方法快10倍。;mini-swe-agent:Mini-SWE-agent 是一个轻量级的AI智能体,仅用100行代码实现,旨在解决GitHub问题及更多任务,提供比大型编码智能体更简化但性能优异的替代方案。它专注于极简主义、在SWE-bench等基准测试上的高性能表现,以及在各种环境中的轻松部署。
在标准 Gymnasium 环境中训练单智能体任务。
研究人员用于无冗余的基准测试、微调或强化学习实验