AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
Vision / Multimodal/
Cradle
Cradle logo

Cradle

活跃·★ 2.5k·更新于 2024-11-07
★ 时下流行

Cradle框架使新兴基础模型能够通过人类使用的统一界面(即屏幕截图作为输入,键盘和鼠标操作作为输出)执行复杂的计算机任务。

Cradle是一个框架,它使基础模型能够使用类似人类的界面控制计算机,以屏幕截图作为输入并生成键盘/鼠标操作作为输出。它支持控制各种游戏和软件,使AI智能体能够在不同应用程序中执行复杂的任务。

#AI 智能体#通用计算机控制#大型语言模型#计算机视觉#人机交互
$ 安装
$ pip install -r requirements.txt
↗ 访问官网★ GitHub
01

功能特性

01使基础模型能够实现通用计算机控制。
02采用统一的类人交互界面:以屏幕截图为输入,生成键盘和鼠标操作作为输出。
03支持包括流行游戏(如RDR2、星露谷物语)和生产力软件(如Chrome、Outlook)在内的多种应用。
04提供模块化框架,旨在方便地适应和迁移到新的游戏和软件环境。
05集成了多种大型语言模型(LLM)API,包括OpenAI、Azure OpenAI和Claude。
02

兼容性

OpenAI
API支持
已通过文档验证
Azure OpenAI
API支持
已通过文档验证
Anthropic Claude
API支持
已通过文档验证
AWS Restful API for Claude
API支持
已通过文档验证
VS Code
支持的IDE
已通过文档验证
PyCharm
支持的IDE
已通过文档验证
03

快速开始

1
$ pip install -r requirements.txt
04

使用场景

↳在复杂视频游戏中实现游戏自动化。
↳执行游戏内管理和任务进程。
↳控制和交互各种桌面应用程序以完成生产力或创意任务。
05

同类工具

ragflow logo
ragflow★ 81.5k
RAGFlow 是一个领先的开源检索增强生成 (RAG) 引擎,它融合了前沿的RAG与Agent能力,为大型语言模型提供卓越的上下文层,并简化企业级RAG工作流。
vs →
n8n logo
n8n★ 190.2k
n8n是一个工作流自动化平台,为技术团队提供了代码的灵活性和无代码的速度,拥有400多个集成和原生的AI能力。
vs →
Context7 logo
Context7★ 56.4k
Context7 MCP 为大型语言模型提供最新、版本特定的代码文档和示例,以避免过时或虚假的信息。
vs →
mindsdb logo
mindsdb★ 39.2k
MindsDB 使得人类、AI、代理和应用程序能够从大规模数据源中获取高度准确的答案。
vs →
GitHub MCP Server logo
GitHub MCP Server★ 30.3k
GitHub MCP 服务器将AI工具直接连接到GitHub平台,使AI代理、助手和聊天机器人能够通过自然语言交互管理GitHub资源和自动化工作流。
vs →
Brave Search MCP logo
Brave Search MCP★ 86.5k
此仓库是模型上下文协议(MCP)参考实现的集合,展示了如何为大型语言模型提供安全、受控的工具和数据源访问。
vs →
MaxKB logo
MaxKB★ 21.1k
MaxKB 是一个强大易用的开源企业级智能体构建平台。
vs →
CopilotKit logo
CopilotKit★ 31.8k
CopilotKit 是一个开源开发工具包,旨在帮助您在Web应用程序中构建和部署深度集成的AI助手和智能体,提供快速集成、框架无关性和生产就绪的UI。
vs →
查看全部替代品 →

相关搜索

Cradle 替代工具最佳 Vision / Multimodal 工具 2026开源 Vision / MultimodalCradle 教程Cradle 对比AI AgentsGeneral Computer ControlLLM

评论

登录后发表评论

暂无评论,来发表第一条吧

本页内容
01功能特性02兼容性03快速开始04使用场景05同类工具
统计
GitHub Stars★ 2.5k
最后更新1年前
状态活跃
许可证—
分类视觉/多模态
热度趋势 (30d)
+0.1k↑ 4.0%
链接
文档↗讨论↗问题↗版本↗

Deploy on DigitalOcean — Get $200 Free Credit

Ad
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。