FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;openrouter-mcp-multimodal:这是唯一支持原生视觉、图像生成和智能图像优化的OpenRouter MCP服务器。它通过模型上下文协议提供对300多个大语言模型的访问,支持图像分析、图像生成和聊天等多模态工作流程。服务器具有零外部HTTP依赖、延迟加载sharp库和单例模型缓存等特性,以实现高效性能。
带说话人标签、时间戳和标点符号的会议转录
通过自然语言与300多个模型中的任何一个聊天