FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;pdf-reader-mcp:PDF Reader MCP 是一个面向 AI 代理的生产级模型上下文协议服务器,通过并行处理实现 5-10 倍速度提升,并采用 Y 坐标内容排序。拥有 94%+ 的测试覆盖率和完整的 TypeScript 支持,确保可靠性和高性能。
带说话人标签、时间戳和标点符号的会议转录
文档分析与全文提取