locallama-mcp
活跃·★ 41·更新于 2026-05-26
★ 时下流行★ API 集成★ 开发者工具
LocalLama MCP 是一个本地优先、提供商中立的模型上下文协议服务器,用于现代编码代理工作流。
LocalLama MCP 服务器是一个本地优先、提供商中立的模型上下文协议服务器,旨在在不牺牲质量的前提下减少令牌使用和成本。它根据成本、延迟、上下文容量和基准历史,动态地将编码任务路由到本地、免费/低成本远程或付费前沿模型。它支持 Codex、Claude Code、Cursor 和 GitHub Copilot Agent 模式等现代 MCP 工具。
#clinebot#MCP 服务器#MCP 服务器#roocode#VS Code
01
功能特性
01本地优先且提供商中立的设计
02基于成本、延迟和质量的动态任务路由
03基于模式的缓存实现约30%的令牌减少
04带依赖映射的智能代码任务分解
05基于 Retriv 的语义代码搜索以实现代码重用
02
兼容性
Linux
原生
已通过文档验证
macOS
原生
已通过文档验证
Windows
构建警告
已通过文档验证
MCP Clients
支持
已通过文档验证
03
快速开始
1
$ git clone https://github.com/yourusername/locallama-mcp.git
2
$ cd locallama-mcp
3
$ npm install
4
$ npm run build
04
使用场景
↳与 Claude Code 或 Cursor 等支持 MCP 的编码代理集成,优化令牌使用和成本
↳使用 Retriv 语义代码搜索重用代码库中的现有代码
↳运行基准测试比较本地 LLM 与付费 API,以做出明智的模型选择
05
同类工具
相关搜索
评论
登录后发表评论
- HHarley Garcia2026年5月25日
Cost optimization by routing tasks to local LLMs via Roo Code and Cline is practical
- Parker Rivera2026年4月15日
The automatic routing logic identifies tasks suitable for local inference without manual configuration
- SSam Patel2026年3月22日
Used to reduce API costs by 40% by routing simple tasks to local Ollama models
- PPeyton Garcia2026年3月5日
Good for developers with capable local hardware who want to optimize AI spending