FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;apitap:ApiTap 是一个 MCP 服务器,允许 AI 代理通过 API 而非浏览器浏览网页,自动检测网站框架并发现其内部 API 端点。它生成可复用的技能文件,用于直接调用 API,与浏览器自动化相比降低 20-100 倍的令牌成本。
带说话人标签、时间戳和标点符号的会议转录
AI 代理无需浏览器即可从网站获取数据