goldenmatch
活跃·★ 54·MIT·更新于 2026-05-29
★ 时下流行★ 多智能体
一个实体解析工具包,用于记录去重、跨源匹配和维护黄金记录,支持文件或实时数据库。
GoldenMatch是一个基于Python的实体解析工具包,集成了零配置操作、模糊匹配、概率匹配、LLM评分、隐私保护链接和黄金记录合成。它支持文件或实时数据库,并包含交互式TUI、REST API和MCP服务器。
#a2a#智能体#data-engineering#data-quality#dbt#deduplication#entity-resolution#fellegi-sunter
01
功能特性
01零配置去重
02交互式TUI,支持实时阈值调整
0310多种评分方法,包括精确、模糊和嵌入
04隐私保护记录链接(PPRL)
05数据库同步,支持增量匹配
02
兼容性
Python
Python 3.11+
已通过文档验证
Polars
Polars原生
已通过文档验证
PostgreSQL
数据库同步
已通过文档验证
DuckDB
DuckDB后端
已通过文档验证
Ray
Ray分布式后端
已通过文档验证
03
快速开始
1
$ pip install goldenmatch
04
使用场景
↳对CSV文件中的记录进行去重
↳跨不同源匹配记录(例如,新客户与主数据库)
↳跨组织的隐私保护链接
05
同类工具
相关搜索
评论
登录后发表评论
- OOaklyn Zhang2026年5月22日
Used for data quality automation in CRM cleanup projects, very reliable
- Ellis Rivera2026年5月1日
27 MCP tools for entity resolution and golden record creation is comprehensive coverage
- QQuinn Thompson2026年4月23日
The golden record approach produces consistent merged entities without manual rules
- RReese Nguyen2026年4月19日
The deduplication quality on real-world messy data is impressive