conductor:Conductor是Netflix最初构建的一个开源、可扩展的微服务编排引擎。它使开发人员能够跨各种服务和系统定义和管理弹性、分布式和异步工作流。;AgentBench:AgentBench是一个综合性基准测试平台,旨在评估大型语言模型(LLM)在各种不同环境中的智能体表现,现已推出与AgentRL集成的函数调用版本。它为操作系统交互、数据库操作和网络购物等任务提供了容器化设置,实现了稳健且可复现的智能体评估。
编排复杂的微服务交互
系统地基准测试各种基于LLM的智能体的性能。