FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。;plasmate:Plasmate 将 HTML 编译为语义对象模型(SOM),一种 LLM 可以直接推理的结构化表示。它通过 V8 运行 JavaScript,通过 CDP 支持 Puppeteer,输出比原始 HTML 小 10-800 倍。它专为 AI 代理管道构建,具有 MCP、Vercel AI SDK 集成以及超过 60 个生态系统集成。
带说话人标签、时间戳和标点符号的会议转录
AI 代理的网页浏览和结构化数据提取