FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;gemini-skill:Gemini Skill 通过 CDP 自动化操作 Gemini 网页版,支持 AI 生图、多轮对话、图片上传与提取、会话管理,并提供 MCP 服务器以便 AI 客户端集成。系统采用守护进程架构高效管理浏览器进程。
带说话人标签、时间戳和标点符号的会议转录
通过 AI 对话自动生成游戏风格表情包