AgentIndex icon
AgentIndex
工具分类热门最新对比
提交工具
首页/
对比/
FunASR vs gemini-skill
FunASR logo
FunASR
★ 16.6k
vs
gemini-skill logo
gemini-skill
★ 822

FunASR vs gemini-skill

FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;gemini-skill:Gemini Skill 通过 CDP 自动化操作 Gemini 网页版,支持 AI 生图、多轮对话、图片上传与提取、会话管理,并提供 MCP 服务器以便 AI 客户端集成。系统采用守护进程架构高效管理浏览器进程。

01

简评

FunASR logo选 FunASR 如果…

带说话人标签、时间戳和标点符号的会议转录

gemini-skill logo选 gemini-skill 如果…

通过 AI 对话自动生成游戏风格表情包

02

并排对比

字段
FunASR logoFunASR
gemini-skill logogemini-skill
分类
语音处理
浏览器自动化
Stars
★ 16.6k
★ 822
许可证
MIT
—
更新时间
2天前
2天前
开源
是
是
Website
↗ 访问
↗ 访问
GitHub
↗ GitHub
↗ GitHub
标签
asr, audio, 中文
自动化, drawing, Gemini
03

功能特性

FunASR logoFunASR
01极速识别 (比 Whisper 快 170 倍)
02支持 50 多种语言
03内置说话人分离
04情感检测
05流式语音识别及 vLLM 加速
gemini-skill logogemini-skill
01根据 prompt 自动生成图片并支持高清原图下载
02与 Gemini 进行多轮文本对话
03上传参考图片以生成新图
04从会话中提取图片(base64 和 CDP 完整尺寸)
05会话管理(新建、临时、切换模型、导航历史)
04

使用场景

FunASR logoFunASR
↳带说话人标签、时间戳和标点符号的会议转录
↳部署为兼容 OpenAI 的 API 服务器
↳与 AI 智能体集成(如 Claude, LangChain, Dify, AutoGen)
gemini-skill logogemini-skill
↳通过 AI 对话自动生成游戏风格表情包
↳与 Gemini 进行多轮对话以获取信息
↳上传参考图片让 Gemini 生成新的变体
05

适合场景

FunASR logoFunASR
最受欢迎语音处理大模型基础设施
gemini-skill logogemini-skill
视觉/多模态浏览器自动化
FAQ

常见问题

FunASR 和 gemini-skill 有什么区别?
FunASR 和 gemini-skill 都属于 Voice / Speech 类别。FunASR 有 16.6k Stars,gemini-skill 有 822 Stars。
FunASR 和 gemini-skill 哪个更好?
最佳选择取决于你的具体需求。带说话人标签、时间戳和标点符号的会议转录 时选 FunASR,通过 AI 对话自动生成游戏风格表情包 时选 gemini-skill。
FunASR 是免费的吗?
是的,FunASR 在 GitHub 开源(MIT)。
gemini-skill 是免费的吗?
是的,gemini-skill 在 GitHub 开源。
→

相关链接

替代品 FunASR →替代品 gemini-skill →FunASR 详情 →gemini-skill 详情 →OpenClaw vs FunASR →
© 2026 AgentIndex.app|由十年 iOS 开发者构建。
QYSGitHub请作者喝咖啡 ☕

按分类浏览

代码助手工作流自动化RAG / 知识库多智能体浏览器自动化大模型基础设施开发者工具可观测性

与 Anthropic, OpenAI 或 Microsoft 无关。