on-policy

★ 2.0k

AgentRunKit

★ 24

on-policy vs AgentRunKit

Q: on-policy 和 AgentRunKit 哪个更好？

根据 GitHub Stars，on-policy 更受社区欢迎，但最佳选择取决于你的具体需求。

Q: on-policy 是免费的吗？

是的，on-policy 在 GitHub 上开源（MIT）。

Q: AgentRunKit 是免费的吗？

是的，AgentRunKit 在 GitHub 上开源（MIT）。

on-policy：该存储库实现了MAPPO，一种PPO的多智能体变体，广泛应用于合作多智能体游戏和研究。它为星际争霸II、花火和谷歌足球等多种多智能体环境提供了健壮的实现，并附有详细的训练脚本和超参数指南。；AgentRunKit：AgentRunKit 是一个轻量级的 Swift 6 框架，用于构建具有类型安全工具调用的 LLM 驱动代理。它拥有零依赖、完全 Sendable 支持、async/await 并发，并通过 MCP 兼容云端和本地模型。

简评

选 on-policy 如果…

合作多智能体强化学习的研究与实验

选 AgentRunKit 如果…

构建集成工具的人工智能聊天机器人

并排对比

字段

on-policy

AgentRunKit

分类

大模型基础设施

Stars

★ 2.0k

★ 24

许可证

MIT

更新时间

1年前

1周前

开源

是

Website

↗ 访问

GitHub

↗ GitHub

标签

多智能体强化学习, PPO, MAPPO

agent-framework, AI 智能体, Anthropic

功能特性

on-policy

01MAPPO（多智能体PPO）的实现

02支持多样化的多智能体环境（如星际争霸II、花火）

03提供各种场景的即用型训练脚本

04详细的超参数指导和最新结果

05默认支持智能体间的共享策略

AgentRunKit

01具有可配置迭代限制和令牌预算的代理循环

02使用 AsyncThrowingStream 和 @Observable SwiftUI 包装器的流式传输

03带有编译时 JSON 模式验证的类型安全工具

04具有深度控制和流传播的子代理组合

05多模态输入：图像、音频、视频、PDF

使用场景

on-policy

↳合作多智能体强化学习的研究与实验

↳评估PPO在多智能体强化学习场景中的有效性

↳为星际争霸II和花火等流行多智能体游戏训练AI智能体

AgentRunKit

↳构建集成工具的人工智能聊天机器人

↳使用 LLM 代理自动化复杂工作流

↳创建用于本地或云端推理的智能助手

适合场景

on-policy

时下流行强化学习多智能体AI

AgentRunKit

时下流行大模型基础设施

FAQ

常见问题

on-policy 和 AgentRunKit 有什么区别？

on-policy 和 AgentRunKit 都属于 LLM Infra 类别。on-policy 有 2.0k Stars，AgentRunKit 有 24 Stars。

on-policy 和 AgentRunKit 哪个更好？

最佳选择取决于你的具体需求。合作多智能体强化学习的研究与实验时选 on-policy，构建集成工具的人工智能聊天机器人时选 AgentRunKit。

on-policy 是免费的吗？

是的，on-policy 在 GitHub 开源（MIT）。

AgentRunKit 是免费的吗？

是的，AgentRunKit 在 GitHub 开源（MIT）。

→

on-policy vs AgentRunKit

简评

并排对比

功能特性

使用场景

适合场景

常见问题

相关链接

on-policy vs AgentRunKit

简评

并排对比

功能特性

使用场景

适合场景

常见问题

相关链接