FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;mcp-raganything:一个多模态RAG服务,提供REST API和MCP服务器,用于文档索引和知识库查询。它使用RAGAnything/LightRAG进行索引和检索,MinIO用于对象存储,PostgreSQL用于知识图谱。每个项目通过独立的工作目录隔离。
带说话人标签、时间戳和标点符号的会议转录
索引和查询文档以进行知识库问答