FunASR
活跃·★ 16.6k·MIT·更新于 2026-05-29
★ 最受欢迎★ 语音处理★ 大模型基础设施
FunASR 是一个基础的端到端语音识别工具包,提供工业级的语音识别能力,比 Whisper 快 170 倍,并支持 50 多种语言。
FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。
#asr#audio#中文#emotion-recognition#MCP 服务器#MCP 服务器#multilingual-asr#openai-compatible-api
01
功能特性
01极速识别 (比 Whisper 快 170 倍)
02支持 50 多种语言
03内置说话人分离
04情感检测
05流式语音识别及 vLLM 加速
02
兼容性
PyTorch
PyTorch
已通过文档验证
GPU
GPU (CUDA)
已通过文档验证
CPU
CPU
已通过文档验证
Docker
Docker
已通过文档验证
03
快速开始
1
$ pip install funasr
04
使用场景
↳带说话人标签、时间戳和标点符号的会议转录
↳部署为兼容 OpenAI 的 API 服务器
↳与 AI 智能体集成(如 Claude, LangChain, Dify, AutoGen)
05
同类工具
相关搜索
评论
登录后发表评论
- PPeyton Davis2026年5月3日
Language coverage beyond English is a meaningful differentiator.
- AAlex Rivera2026年4月3日
Active development from Alibaba's speech research team, keeps improving.
- SSterling Lewis2026年3月26日
170x realtime speech recognition across 50+ languages is genuinely industrial-grade.
- BBlake Martinez2026年3月24日
Good for teams building speech-enabled AI applications that need production ASR.