ragflow:RAGFlow 是一个领先的开源检索增强生成 (RAG) 引擎,它融合了RAG与Agent能力。RAGFlow 为大型语言模型提供卓越的上下文层,并为各种规模的企业提供简化的RAG工作流。;pdf-mcp:pdf-mcp是一个模型上下文协议(MCP)服务器,使AI代理能够读取、搜索和提取PDF文件内容。它使用PyMuPDF解析PDF,SQLite持久缓存,支持结合BM25关键词和语义嵌入的混合搜索、扫描文档的OCR以及表格和图片的结构化提取。
利用复杂数据构建高保真、可用于生产的AI系统。
高效读取和分析大型PDF文档,而不超出上下文限制