conductor:Conductor是由Netflix开发的平台,旨在协调跨微服务的复杂工作流,支持通过JSON和代码创建。然而,Netflix已于2023年12月13日停止其官方开源维护,但鼓励社区继续分叉和开发。;AgentBench:AgentBench是一个综合性基准测试平台,旨在评估大型语言模型(LLM)在各种不同环境中的智能体表现,现已推出与AgentRL集成的函数调用版本。它为操作系统交互、数据库操作和网络购物等任务提供了容器化设置,实现了稳健且可复现的智能体评估。
协调涉及多个微服务的复杂业务流程。
系统地基准测试各种基于LLM的智能体的性能。