Question 1

What is chinese-llm-benchmark?

Accepted Answer

ReLE评测：中文AI大模型能力评测（持续更新）：目前已囊括335个大模型，覆盖chatgpt、gpt-5.2、o4-mini、谷歌gemini-3-pro、Claude-4.5、文心ERNIE-X1.1、ERNIE-5.0-Thinking、qwen3-max、百川、讯飞星火、商汤senseChat等商用模型， 以及kimi-k2、ernie4.5、minimax-M2、deepseek-v3.2、qwen3-2507、llama4、智谱GLM-4.6、gemma3、mistral等开源大模型。不仅提供排行榜，也提供规模超200万的大模型缺陷库！方便广大社区研究分析、改进大模型。

Question 2

Is chinese-llm-benchmark open source?

Accepted Answer

Please check the official repository for license details.

Question 3

What frameworks does chinese-llm-benchmark support?

Accepted Answer

chinese-llm-benchmark is compatible with OpenAI (GPT series), Google (Gemini series), Anthropic (Claude series), Baidu (ERNIE series), Alibaba (Qwen series), DeepSeek.

chinese-llm-benchmark

Compatibility Index

OpenAI (GPT series)

Google (Gemini series)

Anthropic (Claude series)

Baidu (ERNIE series)

Alibaba (Qwen series)

DeepSeek

Community Discussion

💡Top Alternatives to chinese-llm-benchmark

ragflow

Microsoft AutoGen

CrewAI

Claude Flow

Why use AgentIndex?

What are MCP Servers?