AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
Voice / Speech/
claude-video-vision
claude-video-vision logo

claude-video-vision

活跃·★ 700·MIT·更新于 2026-05-18
★ 视觉/多模态★ 开发者工具

赋予Claude观看和理解视频的能力。

这是一个Claude Code插件,赋予Claude观看和理解视频的能力。它通过ffmpeg提取视频帧,并通过多种后端(Gemini、本地Whisper或OpenAI)处理音频。Claude接收图像形式的帧以及带时间戳的音频转录,充当感知层。

#Claude Code#Claude Code 插件#ffmpeg#Gemini#MCP 协议#MCP 服务器#MCP 服务器#multimodal
$ 安装
$ /plugin marketplace add https://github.com/jordanrendric/claude-video-vision && /plugin install claude-video-vision
↗ 访问官网★ GitHub
01

功能特性

01多模态感知 — Claude直接查看视频帧并阅读带时间戳的音频转录
02灵活的后端 — 在云API或完全本地处理之间选择
03自适应提取 — Claude根据你的问题调整帧率、时间范围和分辨率
04自动安装 — Whisper模型在首次使用时自动下载
05交互式设置向导 — /setup-video-vision 引导你完成配置
02

兼容性

macOS
原生
已通过文档验证
Linux
支持
已通过文档验证
Windows
需要额外设置
已通过文档验证
03

快速开始

1
$ /plugin marketplace add https://github.com/jordanrendric/claude-video-vision
2
$ /plugin install claude-video-vision
04

使用场景

↳通过提供视频路径并可选提出具体问题来分析视频文件
↳从特定时间范围提取帧和音频以进行详细检查
↳通过自适应帧提取总结长讲座或演示
05

同类工具

OpenClaw logo
OpenClaw★ 375.5k
OpenClaw 是一个可在用户自有设备上运行的个人AI助手,支持多渠道消息平台和高级功能。
vs →
MaxKB logo
MaxKB★ 21.1k
MaxKB 是一个强大易用的开源企业级智能体构建平台。
vs →
fastmcp logo
fastmcp★ 25.4k
FastMCP 是一个用于连接大型语言模型 (LLM) 到工具和数据的 Python 框架,旨在简化从原型到生产的 MCP (Model Context Protocol) 应用开发。
vs →
nuclear logo
nuclear★ 17.7k
Nuclear是一款免费、开源、无广告和无追踪的音乐播放器,支持搜索歌曲、创建播放列表并在Windows、macOS和Linux上运行。
vs →
context-mode logo
context-mode★ 16.0k
Context Mode是一个MCP服务器,通过上下文节省、会话连续性和以代码思维的方式解决LLM的上下文窗口限制问题。
vs →
Auto-claude-code-research-in-sleep logo
Auto-claude-code-research-in-sleep★ 11.0k
一个利用Claude Code和其他LLM在用户睡眠时自动进行机器学习研究的工具。
vs →
agents-best-practices logo
agents-best-practices★ 1.1k
面向 Codex 与 Claude Code 的中立 Agent 技巧库,涵盖 Agentic 运行时框架设计最佳实践
vs →
semble logo
semble★ 4.5k
Semble 是一个为智能体(agents)构建的快速准确的代码搜索库。
vs →
查看全部替代品 →

相关搜索

claude-video-vision 替代工具最佳 Voice / Speech 工具 2026开源 Voice / Speechclaude-video-vision 教程claude-video-vision 对比claude-codeclaude-code-pluginffmpeg

评论

登录后发表评论
  • R
    River White2026年5月24日

    The multimodal audio integration works, but processing longer videos can take some time.

  • E
    Emerson Patel2026年5月6日

    This completely changes how I debug UI tests. Claude can actually see where the selector failed.

  • J
    Justice Thompson2026年4月20日

    Perfect for feeding Claude visual context from UI recordings to debug frontend glitch behaviors.

  • P
    Parker Davis2026年4月19日

    Make sure you have ffmpeg installed globally, otherwise the frame extraction will fail silently.

本页内容
01功能特性02兼容性03快速开始04使用场景05同类工具
统计
GitHub Stars★ 700
最后更新1周前
状态活跃
许可证MIT
分类语音处理
热度趋势 (30d)
+28↑ 0.7%
链接
文档↗讨论↗问题↗版本↗

Deploy on DigitalOcean — Get $200 Free Credit

Ad
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。