mcp-security-hub:该存储库提供了一系列生产就绪、Docker化的模型上下文协议(MCP)服务器,用于各种攻击性安全工具。它使Claude等AI助手能够与175+种安全工具进行交互,执行漏洞扫描、二进制分析和Web安全评估等任务。;AgentBench:AgentBench是一个综合性基准测试平台,旨在评估大型语言模型(LLM)在各种不同环境中的智能体表现,现已推出与AgentRL集成的函数调用版本。它为操作系统交互、数据库操作和网络购物等任务提供了容器化设置,实现了稳健且可复现的智能体评估。
执行网络侦察以识别活动主机、服务和Web技术。
系统地基准测试各种基于LLM的智能体的性能。