pytorch-DRL:Pytorch-madrl 提供了针对单智能体和多智能体系统的多种深度强化学习(DRL)算法的模块化 PyTorch 实现。它具有一个统一的智能体接口,包含环境交互、训练和动作选择等组件,以促进不同 DRL 方法之间的代码复用。;rllm:rLLM是一个开源框架,旨在使用强化学习对语言代理进行后训练。它使用户能够轻松构建、训练和部署自定义代理和环境,以应对实际工作负载。
开发和实验各种深度强化学习算法
训练用于代码生成和错误修复等任务的强大编码模型。