AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
Vision / Multimodal/
kreuzberg
kreuzberg logo

kreuzberg

活跃·★ 8.4k·MIT·更新于 2026-05-29
★ 时下流行★ 必备神器

一个能从57+种文件格式中提取文本和元数据,生成嵌入向量,并以原生速度进行后处理,无需GPU的高性能工具。

Kreuzberg 是一个高性能、多语言库,旨在从57种以上文件格式中提取文本和元数据,并提供全面的OCR功能。它基于Rust核心构建,以原生速度处理数据,内存高效,并能生成嵌入向量而无需GPU,使其在各种数据提取和处理任务中具有极高的通用性。

#文档处理#数据提取#光学字符识别#多语言#嵌入向量
↗ 访问官网★ GitHub
01

功能特性

01可扩展架构,带有用于自定义后端和处理器的插件系统。
02多语言支持,为10多种编程语言提供原生绑定。
03全面支持8大类、57种以上文件格式,包括Office文档、PDF和图像。
04先进的OCR功能,支持多种后端和智能表格检测。
05基于Rust核心、SIMD优化和完全并行化带来的高性能。
02

兼容性

Rust
核心库
已通过文档验证
Python
语言绑定
已通过文档验证
Elixir
语言绑定
已通过文档验证
Node.js
语言绑定
已通过文档验证
WASM
WebAssembly 支持
已通过文档验证
Java
语言绑定
已通过文档验证
03

使用场景

↳从各种文档类型中自动提取文本、元数据和结构化数据。
↳构建智能文档处理管道,用于数据摄取和分析。
↳为非结构化和半结构化内容实现高效的搜索和检索系统。
04

同类工具

ragflow logo
ragflow★ 81.5k
RAGFlow 是一个领先的开源检索增强生成 (RAG) 引擎,它融合了前沿的RAG与Agent能力,为大型语言模型提供卓越的上下文层,并简化企业级RAG工作流。
vs →
n8n logo
n8n★ 190.2k
n8n是一个工作流自动化平台,为技术团队提供了代码的灵活性和无代码的速度,拥有400多个集成和原生的AI能力。
vs →
Context7 logo
Context7★ 56.4k
Context7 MCP 为大型语言模型提供最新、版本特定的代码文档和示例,以避免过时或虚假的信息。
vs →
mindsdb logo
mindsdb★ 39.2k
MindsDB 使得人类、AI、代理和应用程序能够从大规模数据源中获取高度准确的答案。
vs →
GitHub MCP Server logo
GitHub MCP Server★ 30.3k
GitHub MCP 服务器将AI工具直接连接到GitHub平台,使AI代理、助手和聊天机器人能够通过自然语言交互管理GitHub资源和自动化工作流。
vs →
Microsoft AutoGen logo
Microsoft AutoGen★ 58.5k
AutoGen是一个用于创建多智能体AI应用的框架,这些应用可以自主运行或与人类协作。
vs →
CrewAI logo
CrewAI★ 52.4k
CrewAI 是一个从零开始构建的精益、快速的 Python 框架,用于创建自主的 AI 代理并进行多代理自动化。
vs →
MetaGPT logo
MetaGPT★ 68.4k
MetaGPT是一个多智能体框架,为大型语言模型(LLMs)分配不同的角色,使其能够协作完成复杂任务。
vs →
查看全部替代品 →

相关搜索

kreuzberg 替代工具最佳 Vision / Multimodal 工具 2026开源 Vision / Multimodalkreuzberg 教程kreuzberg 对比Document ProcessingData ExtractionOCR

评论

登录后发表评论

暂无评论,来发表第一条吧

本页内容
01功能特性02兼容性03使用场景04同类工具
统计
GitHub Stars★ 8.4k
最后更新1天前
状态活跃
许可证MIT
分类视觉/多模态
热度趋势 (30d)
+0.3k↑ 4.3%
链接
文档↗讨论↗问题↗版本↗

Deploy on DigitalOcean — Get $200 Free Credit

Ad
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。