anansi:Anansi是一个弹性的网络爬虫,能够处理敌对网站、抵御改版并随时间改进。它具有自愈合CSS选择器、自动浏览器升级、TLS指纹模仿和自适应速率限制。它附带一个MCP服务器,用于LLM集成。;FunASR:FunASR 是一个基础的端到端语音识别工具包。它提供工业级的语音识别能力,比 Whisper 快 170 倍,支持 50 多种语言,并集成了说话人分离、情感检测和流式识别等功能。
使用自适应选择器从产品页面提取结构化数据
带说话人标签、时间戳和标点符号的会议转录