chinese-llm-benchmark:ReLE评测(原名CLiB)是一个持续更新的中文AI大模型能力评测项目,已覆盖337个商用及开源大模型。它提供多维度能力评测和综合排行榜,并包含超200万的大模型缺陷库,以帮助社区研究和改进模型。;CopilotKit:CopilotKit 是将 AI Copilot、聊天机器人和应用内 Agent 直接嵌入 Web 应用的 React 框架,提供 UI 组件和后端基础设施,支持 AI 读写应用状态、执行操作和渲染生成式 UI,兼容 LangChain、LangGraph 和 CrewAI。
对比和选择特定应用场景下表现最佳的大模型。
为 SaaS 产品添加理解应用状态的上下文感知 AI Copilot