AgileRL
活跃·★ 921·更新于 2026-05-29
★ 时下流行★ 宝藏工具
AgileRL 是一个深度强化学习库,通过引入 RLOps 来简化和加速强化学习开发。
AgileRL 是一个深度强化学习库,通过引入 RLOps(强化学习的 MLOps)来简化开发。它利用开创性的进化技术显著缩短训练时间和超参数优化过程,比现有最先进的方法快10倍。
#强化学习#深度学习#超参数优化#强化学习运维#进化算法
01
功能特性
01集成 RLOps,简化强化学习开发。
02开创性的进化超参数优化 (HPO) 技术。
03全面支持可进化的在策略、离策略、离线、多智能体和上下文多臂老虎机算法。
04支持分布式训练。
05提供大语言模型 (LLM) 微调算法。
02
兼容性
Gymnasium
支持
已通过文档验证
PettingZoo
支持
已通过文档验证
PyTorch
原生支持
已通过文档验证
LLM Ecosystem
支持
已通过文档验证
03
快速开始
1
$ pip install agilerl
04
使用场景
↳在标准 Gymnasium 环境中训练单智能体任务。
↳在 PettingZoo 环境中开发多智能体强化学习解决方案。
↳使用强化学习算法微调大语言模型 (LLM)。
05
同类工具
相关搜索
评论
登录后发表评论
暂无评论,来发表第一条吧