FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;Pepper:Pepper 是一个 MCP 服务器,通过 DYLD_INSERT_LIBRARIES 将 dylib 注入 iOS 模拟器应用,在应用进程内启动 WebSocket 服务器,暴露 50 多种工具,用于视图层次、触摸输入、网络拦截、堆检查等。它简化了向 AI 代理提供 iOS 应用完整运行时访问以实现测试和自动化的过程。
带说话人标签、时间戳和标点符号的会议转录
使用 AI 代理自动化测试和与 iOS 模拟器应用的交互