AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
按分类浏览 AI 工具/
视觉/多模态

Vision / Multimodal (2026)

视觉和多模态 AI 工具,用于图像理解、生成和多模态输入处理。

178 个工具

名称简介分类Stars许可证更新
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。

ragflow logo
ragflow最受欢迎时下流行···RAGFlow 是一个领先的开源检索增强生成 (RAG) 引擎,它融合了前沿的RAG与Agent能力,为大型语言模型提供卓越的上下文层,并简化企业级RAG工作流。视觉/多模态★ 81.5kAPACHE-2.02026-05-29
n8n logo
n8n最受欢迎时下流行···n8n是一个工作流自动化平台,为技术团队提供了代码的灵活性和无代码的速度,拥有400多个集成和原生的AI能力。视觉/多模态★ 190.2kNOASSERTION2026-05-29
Claude Flow logo
Claude Flow最受欢迎时下流行···Claude Flow是一个企业级AI编排平台,专为Claude Code提供生产就绪的多智能体AI编排,支持部署54+专业智能体,具备自学习能力、容错共识和企业级安全。视觉/多模态★ 56.4kMIT2026-05-29
ToolJet logo
ToolJet最受欢迎时下流行···ToolJet 是 ToolJet AI 的开源基础,一个用于构建和部署内部工具、工作流和 AI 代理的 AI 原生平台。视觉/多模态★ 37.9kAGPL-3.02026-05-29
Open Interpreter logo
Open Interpreter最受欢迎时下流行···Open Interpreter 允许大型语言模型在本地运行代码(如Python、Javascript、Shell等),通过终端提供类似ChatGPT的自然语言界面。视觉/多模态★ 63.7kAGPL-3.02026-05-17
ruflo logo
ruflo最受欢迎多智能体···Ruflo v3 是一个企业级AI编排平台,它将Claude Code转化为一个强大的多智能体开发平台,支持部署、协调和优化用于复杂软件工程任务的专业AI智能体。视觉/多模态★ 56.4kMIT2026-05-29
UI-TARS-desktop logo
UI-TARS-desktop最受欢迎时下流行···UI-TARS Desktop 是一款基于 UI-TARS 模型,提供原生 GUI Agent 能力的桌面应用程序。视觉/多模态★ 35.7kApache-2.02026-05-18
GPT Researcher logo
GPT Researcher最受欢迎时下流行···GPT研究员是一个开放的深度研究智能体,旨在对任何给定任务进行网络和本地研究,并生成详细、事实准确且公正的报告。视觉/多模态★ 27.4kApache-2.02026-05-28
Flowise logo
Flowise最受欢迎时下流行···Flowise是一个开源的低代码工具,提供可视化界面,用于轻松构建自定义AI代理和大语言模型应用程序。视觉/多模态★ 53.2kNOASSERTION2026-05-29
chrome-devtools-mcp logo
chrome-devtools-mcp最受欢迎时下流行···chrome-devtools-mcp允许AI编码助手控制和检查实时的Chrome浏览器,提供全面的DevTools功能进行自动化、调试和性能分析。视觉/多模态★ 42.3kApache-2.02026-05-28
playwright-mcp logo
playwright-mcp最受欢迎时下流行···一个基于 Playwright 的模型上下文协议 (MCP) 服务器,使 LLM 能够通过结构化数据进行浏览器自动化,无需视觉模型。视觉/多模态★ 33.2kApache-2.02026-05-28
Meshroom logo
Meshroom最受欢迎时下流行···Meshroom是一个开源的、基于节点的视觉编程框架,一个用于创建、管理和执行复杂数据处理管道的灵活工具箱。视觉/多模态★ 12.8kNOASSERTION2026-05-29
mcp-sequentialthinking-tools logo
mcp-sequentialthinking-tools时下流行必备神器一个MCP序贯思维服务器的改编版,旨在引导工具在解决问题中的使用,通过分解复杂问题并推荐每个阶段最有效的MCP工具。视觉/多模态★ 584MIT2026-05-29
Cherry Studio logo
Cherry Studio最受欢迎时下流行···Cherry Studio 是一款支持多种大型语言模型提供商的桌面客户端,可在 Windows、Mac 和 Linux 上使用。视觉/多模态★ 46.6kAGPLV32026-05-29
BettaFish logo
BettaFish最受欢迎时下流行“微舆”是一个从零实现的创新型多智能体舆情分析系统,帮助用户打破信息茧房,还原舆情原貌,预测未来走向,辅助决策。视觉/多模态★ 41.1kGPL-2.02026-05-24
XHS-Downloader logo
XHS-Downloader最受欢迎时下流行小红书链接提取/作品采集工具:提取账号发布、收藏、点赞、专辑作品链接;提取搜索结果作品链接、用户链接;采集小红书作品信息;提取小红书作品下载地址;下载小红书无水印作品文件。视觉/多模态★ 11.3kGPL-3.02026-05-29
rllm logo
rllm时下流行rLLM是一个通过强化学习对语言代理进行后训练的开源框架。视觉/多模态★ 5.6kApache-2.02026-05-28
ir-sim logo
ir-sim时下流行IR-SIM是一个基于Python的轻量级开源机器人模拟器,专为导航、控制和强化学习设计,提供用户友好的框架以快速原型开发。视觉/多模态★ 1.1kMIT2026-05-26
mcp-server-chart logo
mcp-server-chart时下流行一个用于使用 AntV 生成图表的模型上下文协议(MCP)服务器。视觉/多模态★ 4.1kMIT2026-05-06
inspector logo
inspector时下流行MCP Inspector 是一个用于测试和调试 MCP 服务器的开发工具。视觉/多模态★ 9.9kTHE MIT LICENSE2026-05-29
1–20 / 178
…