on-policy:该存储库实现了MAPPO,一种PPO的多智能体变体,广泛应用于合作多智能体游戏和研究。它为星际争霸II、花火和谷歌足球等多种多智能体环境提供了健壮的实现,并附有详细的训练脚本和超参数指南。;gym-pybullet-drones:gym-pybullet-drones 是其原始仓库的精简重构版本,提供了一个 Gym 环境,用于模拟多智能体四旋翼无人机控制。它旨在兼容 Gymnasium、Stable Baselines3 2.0 和各种飞行固件,以支持硬件在环仿真。
合作多智能体强化学习的研究与实验
开发和评估四旋翼飞行器的 PID 控制器