UI-TARS-desktop
活跃·★ 35.7k·Apache-2.0·更新于 2026-05-18
★ 最受欢迎★ 时下流行★ 必备神器
UI-TARS Desktop 是一款基于 UI-TARS 模型,提供原生 GUI Agent 能力的桌面应用程序。
UI-TARS Desktop 是 TARS 多模态 AI 智能体技术栈的桌面应用组件,通过截图理解屏幕内容并与计算机 GUI 交互,支持执行 Shell 命令和浏览器工具,集成 MCP 扩展 Agent 能力。
#GUI 代理#桌面应用#多模态 AI#自动化#跨平台
01
功能特性
01原生 GUI 智能体,通过截图理解屏幕并与桌面应用交互
02多模态 LLM 驱动的任意 UI 视觉理解
03内置浏览器自动化和 Shell 命令执行
04MCP 集成,通过自定义工具扩展 Agent 能力
05跨平台桌面应用,提供 Web UI 选项
02
兼容性
macOS
支持
已通过文档验证
Windows
支持
已通过文档验证
Linux
支持
已通过文档验证
03
快速开始
1
$ npx @agent-tars/cli@latest
04
使用场景
↳通过视觉点击无 API 的桌面 GUI 工作流自动化
↳构建结合屏幕理解、网页和文件操作的多模态 Agent
↳通过自然语言指令在桌面执行 AI 辅助计算机任务
05
同类工具
相关搜索
评论
登录后发表评论
- RRemy Rivera2026年5月25日
Good for building desktop AI assistants that can see and interact with any application.
- JJordan Martinez2026年4月23日
Handles the model integration complexity so you focus on task definition.
- PParker Thompson2026年3月28日
Open-source foundation means you're not locked into proprietary automation platforms.
- LLogan Anderson2026年3月21日
Multimodal AI agent stack that connects cutting-edge models to desktop automation.