AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
Vision / Multimodal/
pdf-mcp
pdf-mcp logo

pdf-mcp

活跃·★ 45·MIT·更新于 2026-05-29
★ 时下流行★ 代码助手★ RAG / 知识库

一个AI代理可以读取、搜索和提取PDF文件内容的模型上下文协议(MCP)服务器。

pdf-mcp是一个模型上下文协议(MCP)服务器,使AI代理能够读取、搜索和提取PDF文件内容。它使用PyMuPDF解析PDF,SQLite持久缓存,支持结合BM25关键词和语义嵌入的混合搜索、扫描文档的OCR以及表格和图片的结构化提取。

#代理式 AI#人工智能#Claude#codex-cli#Copilot#document-processing#大语言模型#MCP 协议
$ 安装
$ pip install pdf-mcp
↗ 访问官网★ GitHub
01

功能特性

01混合搜索(BM25关键词+语义嵌入),采用倒数排名融合
02分页读取,避免上下文溢出
03通过Tesseract支持扫描和基于图像的PDF的OCR
04表格、图片和目录的结构化提取
05持久化SQLite缓存,自动失效
02

兼容性

Claude Code
Claude Code
已通过文档验证
Claude Desktop
Claude Desktop
已通过文档验证
Visual Studio Code
VS Code
已通过文档验证
Codex CLI
Codex CLI
已通过文档验证
Kiro
Kiro
已通过文档验证
03

快速开始

1
$ pip install pdf-mcp
04

使用场景

↳高效读取和分析大型PDF文档,而不超出上下文限制
↳使用自然语言在PDF中搜索特定内容或概念
↳从PDF中提取结构化数据,如表格和图片
05

同类工具

ragflow logo
ragflow★ 81.5k
RAGFlow 是一个领先的开源检索增强生成 (RAG) 引擎,它融合了前沿的RAG与Agent能力,为大型语言模型提供卓越的上下文层,并简化企业级RAG工作流。
vs →
n8n logo
n8n★ 190.2k
n8n是一个工作流自动化平台,为技术团队提供了代码的灵活性和无代码的速度,拥有400多个集成和原生的AI能力。
vs →
fastmcp logo
fastmcp★ 25.4k
FastMCP 是一个用于连接大型语言模型 (LLM) 到工具和数据的 Python 框架,旨在简化从原型到生产的 MCP (Model Context Protocol) 应用开发。
vs →
nuclear logo
nuclear★ 17.7k
Nuclear是一款免费、开源、无广告和无追踪的音乐播放器,支持搜索歌曲、创建播放列表并在Windows、macOS和Linux上运行。
vs →
context-mode logo
context-mode★ 16.0k
Context Mode是一个MCP服务器,通过上下文节省、会话连续性和以代码思维的方式解决LLM的上下文窗口限制问题。
vs →
Auto-claude-code-research-in-sleep logo
Auto-claude-code-research-in-sleep★ 11.0k
一个利用Claude Code和其他LLM在用户睡眠时自动进行机器学习研究的工具。
vs →
agents-best-practices logo
agents-best-practices★ 1.1k
面向 Codex 与 Claude Code 的中立 Agent 技巧库,涵盖 Agentic 运行时框架设计最佳实践
vs →
holaOS logo
holaOS★ 5.4k
holaOS 是一个专为智能体设计的环境,旨在实现长期工作、持续性和自我演化。
vs →
查看全部替代品 →

相关搜索

pdf-mcp 替代工具最佳 Vision / Multimodal 工具 2026开源 Vision / Multimodalpdf-mcp 教程pdf-mcp 对比agentic-aiaiclaude

评论

登录后发表评论
  • J
    Jamie Harris2026年5月5日

    Good for research workflows where Claude needs to process many large documents efficiently

  • Quinn Kim
    Quinn Kim2026年4月29日

    Reading large PDFs without hitting context limits is a practical problem well solved here

  • S
    Sage Garcia2026年4月23日

    The chunking approach handles technical papers and long documents reliably

  • S
    Spencer Zhang2026年4月14日

    Used for automated literature review workflows, PDF parsing accuracy is high

本页内容
01功能特性02兼容性03快速开始04使用场景05同类工具
统计
GitHub Stars★ 45
最后更新1天前
状态活跃
许可证MIT
分类视觉/多模态
热度趋势 (30d)
+1.8↑ 0.7%
链接
文档↗讨论↗问题↗版本↗

Deploy on DigitalOcean — Get $200 Free Credit

Ad
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。