kreuzberg:Kreuzberg 是一个高性能、多语言库,旨在从57种以上文件格式中提取文本和元数据,并提供全面的OCR功能。它基于Rust核心构建,以原生速度处理数据,内存高效,并能生成嵌入向量而无需GPU,使其在各种数据提取和处理任务中具有极高的通用性。;paiml-mcp-agent-toolkit:PMAT(实用多语言代理工具包)是一款综合工具,旨在分析代码质量、评估技术债务,并为各种大型语言模型生成AI就绪上下文。它支持超过17种编程语言,并提供变异测试、仓库评分和Git历史语义搜索等功能。
从各种文档类型中自动提取文本、元数据和结构化数据。
为大型语言模型生成AI就绪上下文