houtini-lm
活跃·★ 91·MIT·更新于 2026-04-21
★ 时下流行★ 大模型基础设施★ API 集成
将Claude Code的任务卸载到本地LLM服务器或云端API,以节省令牌成本并提高效率。
Houtini LM将Claude Code连接到本地LLM服务器或任何兼容OpenAI的API,将边界明确的任务卸载出去以减少令牌成本。它提供了工具、性能跟踪和模型路由以实现高效委托。Claude仍然负责复杂推理的编排,而廉价的本地模型处理琐碎工作。
#AI 智能体#claude-mcp#代码生成#开发者工具#开发者工具#lm-studio#lm-studio-mcp#local-llm
01
功能特性
01将边界明确的任务卸载到本地或云端LLM
02通过HuggingFace元数据丰富进行模型发现
03实时性能跟踪(TTFT、tok/s)
04通过基于语法的采样实现结构化JSON输出
05自动剥离GLM、Nemotron等模型的思考块
02
兼容性
LM Studio
本地服务器
已通过文档验证
Ollama
本地服务器
已通过文档验证
vLLM
本地服务器
已通过文档验证
llama.cpp
本地服务器
已通过文档验证
DeepSeek
云端API
已通过文档验证
Groq
云端API
已通过文档验证
03
快速开始
1
$ npx -y @houtini/lm
04
使用场景
↳生成测试桩
↳代码审查和错误查找
↳起草提交信息
05
同类工具
相关搜索
评论
登录后发表评论
- MMarlowe Wilson2026年5月3日
Switching between local and cloud LLMs via MCP without changing agent code is very useful
- DDrew Garcia2026年4月21日
Local inference fallback when cloud APIs are slow or expensive works transparently
- RRiley White2026年3月28日
Good for keeping costs down on routine tasks while using cloud for complex ones
- DDrew Patel2026年3月5日
The OpenAPI integration means any local model with a REST endpoint just works