chinese-llm-benchmark:ReLE评测(原名CLiB)是一个持续更新的中文AI大模型能力评测项目,已覆盖337个商用及开源大模型。它提供多维度能力评测和综合排行榜,并包含超200万的大模型缺陷库,以帮助社区研究和改进模型。;Pydantic AI:Pydantic AI 是一个 Python 代理框架,旨在以类似于 FastAPI 的人体工程学和类型安全性构建生产级生成式AI应用。它提供了一种模型无关的方法,与 Pydantic 生态系统深度集成,专注于可靠性和开发者体验。
对比和选择特定应用场景下表现最佳的大模型。
构建生产级的生成式AI应用和工作流。