FedML:FedML是由TensorOpera AI支持的统一且可扩展的开源机器学习库,能够在任何地点和任何规模运行AI训练与部署任务。它为机器学习运维、调度和高性能ML库提供了全面的支持,包括联邦学习、分布式训练和生成式AI功能。;on-policy:该存储库实现了MAPPO,一种PPO的多智能体变体,广泛应用于合作多智能体游戏和研究。它为星际争霸II、花火和谷歌足球等多种多智能体环境提供了健壮的实现,并附有详细的训练脚本和超参数指南。
大型模型(包括大语言模型)的分布式训练与微调
合作多智能体强化学习的研究与实验