headroom
活跃·★ 2.1k·Apache-2.0·更新于 2026-05-30
一个为 AI 代理和大型语言模型设计的上下文压缩层,能够显著减少 Token 使用。
Headroom 是一个为 AI 代理和大型语言模型设计的上下文压缩层,通过压缩工具输出、日志、RAG 块、文件和对话历史,显著减少 Token 使用(减少 60-95% 的 Token)。它在本地运行并支持可逆压缩,确保数据隐私并能在需要时检索原始内容。
#AI 代理#LLM 优化#上下文压缩#Token 效率#可逆压缩#跨代理内存#开发工具#代理服务器
01
功能特性
01高 Token 节省:将代码搜索、SRE 调试和 GitHub 问题分类等各种代理工作负载的 Token 使用量减少 60-95%。
02多模态压缩:采用 SmartCrusher (JSON)、CodeCompressor (AST) 和 Kompress-base (文本) 等专用算法,高效压缩不同类型的内容。
03本地优先和可逆 (CCR):本地处理数据以维护隐私,并提供可逆压缩 (CCR),原始内容永不删除,可由 LLM 按需检索。
04灵活集成:可作为内联库(Python/TypeScript)、零代码代理或用于 Claude Code、Codex 和 Cursor 等流行工具的代理封装器。
05跨代理内存与学习:通过自动去重在不同代理(Claude、Codex、Gemini)之间提供共享内存,并包含 `headroom learn` 以挖掘失败会话并建议更正。
02
兼容性
Python
运行时
已通过文档验证
Node.js
运行时
已通过文档验证
Docker
部署
已通过文档验证
Anthropic
LLM 提供商
已通过文档验证
OpenAI
LLM 提供商
已通过文档验证
LangChain
框架
已通过文档验证
03
快速开始
1
$ pip install "headroom-ai[all]"
04
使用场景
↳优化 AI 编程代理工作流:在使用 Claude Code、Cursor 或 Aider 等代理进行日常编程任务时,显著降低 Token 成本并提高效率。
↳增强多代理协作:实现不同 AI 代理之间的共享上下文和内存,促进更具凝聚力和高效的多代理系统。
↳高效调试和事件响应:压缩大量日志和事件数据以适应 LLM 上下文窗口,从而促进 AI 更快速地分析。
↳经济高效的代码库探索:通过压缩代码、文档和 RAG 块,在不产生高昂 Token 成本的情况下,使用 LLM 探索大型代码库。
↳在 AI 应用中维护数据隐私:利用本地优先的上下文压缩,确保敏感数据保留在本地,而不是发送到外部 API 进行处理。
05
同类工具
相关搜索
评论
登录后发表评论
暂无评论,来发表第一条吧