AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
工具分类热门最新对比
首页/
对比/
FunASR vs ocr-mcp
FunASR logo
FunASR
★ 16.6k
vs
ocr-mcp logo
ocr-mcp
★ 14

FunASR vs ocr-mcp

FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;ocr-mcp:OCR-MCP是一个完整的AI OCR网页应用和MCP服务器。它提供用于拖放OCR、扫描和批处理的Web界面,以及一个用于Claude、Cursor、Windsurf等智能IDE的FastMCP服务器。支持13种OCR引擎、WIA扫描仪、预处理和工作流管道。

01

简评

FunASR logo选 FunASR 如果…

带说话人标签、时间戳和标点符号的会议转录

ocr-mcp logo选 ocr-mcp 如果…

将OCR功能集成到AI代理(Claude、Cursor)中

02

并排对比

字段
FunASR logoFunASR
ocr-mcp logoocr-mcp
分类
语音处理
视觉/多模态
Stars
★ 16.6k
★ 14
许可证
MIT
MIT
更新时间
1天前
3天前
开源
是
是
Website
↗ 访问
↗ 访问
GitHub
↗ GitHub
↗ GitHub
标签
asr, audio, 中文
agentic-workflow, FastMCP, MCP 协议
03

功能特性

FunASR logoFunASR
01极速识别 (比 Whisper 快 170 倍)
02支持 50 多种语言
03内置说话人分离
04情感检测
05流式语音识别及 vLLM 加速
ocr-mcp logoocr-mcp
0113种OCR后端(PaddleOCR、Mistral OCR等)
02自动选择后端
03预处理(去歪斜、增强、裁剪)
04布局和表格提取
05批处理和管道处理
04

使用场景

FunASR logoFunASR
↳带说话人标签、时间戳和标点符号的会议转录
↳部署为兼容 OpenAI 的 API 服务器
↳与 AI 智能体集成(如 Claude, LangChain, Dify, AutoGen)
ocr-mcp logoocr-mcp
↳将OCR功能集成到AI代理(Claude、Cursor)中
↳使用WIA扫描仪对扫描文档运行OCR
↳批量处理文档并转换为文本/PDF/JSON
05

适合场景

FunASR logoFunASR
最受欢迎语音处理大模型基础设施
ocr-mcp logoocr-mcp
时下流行工作流自动化RAG / 知识库
FAQ

常见问题

FunASR 和 ocr-mcp 有什么区别?
FunASR 和 ocr-mcp 都属于 Voice / Speech 类别。FunASR 有 16.6k Stars,ocr-mcp 有 14 Stars。
FunASR 和 ocr-mcp 哪个更好?
最佳选择取决于你的具体需求。带说话人标签、时间戳和标点符号的会议转录 时选 FunASR,将OCR功能集成到AI代理(Claude、Cursor)中 时选 ocr-mcp。
FunASR 是免费的吗?
是的,FunASR 在 GitHub 开源(MIT)。
ocr-mcp 是免费的吗?
是的,ocr-mcp 在 GitHub 开源(MIT)。
→

相关链接

替代品 FunASR →替代品 ocr-mcp →FunASR 详情 →ocr-mcp 详情 →OpenClaw vs FunASR →
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。