fast-agent:fast-agent 是一个以命令行优先的框架,用于构建和交互复杂的复合多模态 AI 智能体和工作流。它为各种大型语言模型提供商提供全面支持,包括结构化输出和视觉功能,并具有独特的功能,如 MCP 特性支持和实时流式响应到终端。;FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。
快速开发和测试复杂的复合多模态 AI 智能体和工作流。
带说话人标签、时间戳和标点符号的会议转录