kreuzberg:Kreuzberg 是一个高性能、多语言库,旨在从57种以上文件格式中提取文本和元数据,并提供全面的OCR功能。它基于Rust核心构建,以原生速度处理数据,内存高效,并能生成嵌入向量而无需GPU,使其在各种数据提取和处理任务中具有极高的通用性。;mindsdb:MindsDB 是一个开源服务器,使 AI、代理和应用程序能够从多样化的大规模数据源中获取准确的答案。它采用强大的架构来连接、统一来自数据库、数据仓库和 SaaS 应用程序的数据,然后通过内置 AI 代理和其模型上下文协议 (MCP) 响应查询。
从各种文档类型中自动提取文本、元数据和结构化数据。
实现对多样化、大规模企业数据的 AI 驱动问答。