ocr-mcp
活跃·★ 14·MIT·更新于 2026-05-28
★ 时下流行★ 工作流自动化★ RAG / 知识库
一个集成Web界面和MCP服务器的AI OCR工具。
OCR-MCP是一个完整的AI OCR网页应用和MCP服务器。它提供用于拖放OCR、扫描和批处理的Web界面,以及一个用于Claude、Cursor、Windsurf等智能IDE的FastMCP服务器。支持13种OCR引擎、WIA扫描仪、预处理和工作流管道。
#agentic-workflow#FastMCP#MCP 协议#MCP 服务器#MCP 服务器#OCR 识别
01
功能特性
0113种OCR后端(PaddleOCR、Mistral OCR等)
02自动选择后端
03预处理(去歪斜、增强、裁剪)
04布局和表格提取
05批处理和管道处理
02
兼容性
Windows
Windows
已通过文档验证
Linux
Linux 和 macOS
已通过文档验证
macOS
Linux 和 macOS
已通过文档验证
03
快速开始
1
$ git clone https://github.com/sandraschi/ocr-mcp.git
2
$ cd ocr-mcp
3
$ uv sync
04
使用场景
↳将OCR功能集成到AI代理(Claude、Cursor)中
↳使用WIA扫描仪对扫描文档运行OCR
↳批量处理文档并转换为文本/PDF/JSON
05
同类工具
相关搜索
评论
登录后发表评论
- SSpencer Brown2026年5月12日
Current OCR models handle handwriting and complex layouts better than older tools.
- Quinn Kim2026年5月8日
State-of-the-art OCR capabilities via FastMCP server — quality that matches commercial tools.
- SSpencer Nguyen2026年4月25日
Works with diverse document formats through a consistent MCP interface.
- OOaklyn Johnson2026年3月5日
Good for AI workflows that need to extract text from images or scanned documents.