playwright-mcp:Playwright MCP 是一个利用 Playwright 浏览器自动化能力的服务器,旨在让大型语言模型 (LLM) 能够与网页进行交互。它通过结构化可访问性快照工作,使 LLM 无需依赖视觉输入或传统截图即可处理网页内容。;UI-TARS-desktop:UI-TARS Desktop 是 TARS 多模态 AI 智能体技术栈的桌面应用组件,通过截图理解屏幕内容并与计算机 GUI 交互,支持执行 Shell 命令和浏览器工具,集成 MCP 扩展 Agent 能力。
赋能 LLM 驱动的网页浏览和任务完成
通过视觉点击无 API 的桌面 GUI 工作流自动化