FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;ocr-mcp:OCR-MCP是一个完整的AI OCR网页应用和MCP服务器。它提供用于拖放OCR、扫描和批处理的Web界面,以及一个用于Claude、Cursor、Windsurf等智能IDE的FastMCP服务器。支持13种OCR引擎、WIA扫描仪、预处理和工作流管道。
带说话人标签、时间戳和标点符号的会议转录
将OCR功能集成到AI代理(Claude、Cursor)中