verl-agent:`verl-agent` 扩展了 veRL,通过强化学习训练大型语言模型代理,并引入了新颖的步进独立多轮回滚机制。这种设计通过定制化的每步输入结构和内存管理,确保了长周期任务的高度可扩展性。;mcp-fusion:`mcp-fusion` 是一个先进的 TypeScript 框架,旨在将大量模型上下文协议 (MCP) 操作整合到一个单一的智能 LLM 工具中。它通过利用构建时多路复用和上下文门控来解决上下文耗尽和路由混乱问题,实现可扩展、精确的 API 交互。
为复杂的、多轮次长周期任务训练大型语言模型代理。
将大量独立的模型上下文协议 (MCP) 工具整合到一个统一的 LLM 接口中。