FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;Kompl:Kompl 是一个知识编译器,它能摄取分散的来源(如链接、文件和书签),并自动将其编译成相互关联的维基。它使用 Gemini LLM 和 NLP 生成实体页面、概念页面和交叉引用。通过 Docker 在本地运行,确保隐私和数据控制。
带说话人标签、时间戳和标点符号的会议转录
从书签、PDF 和链接进行个人知识管理