SuperCLUE:中文大语言模型基准评测 | AI生成和翻译

Home 2025.10

SuperCLUE 是一个综合性基准测试套件,旨在评估中文大语言模型(LLMs)。它基于原有的CLUE(中文语言理解评估)基准,将其扩展至评估大语言模型的高级能力,而不仅限于较小模型。由CLUEbenchmark团队开发——该团队汇聚了来自清华大学等研究机构及中国人工智能生态企业的研究人员——SuperCLUE 于2023年首次推出,旨在弥补中文大语言模型与国际标准对比评估的空白。

核心特性

该基准测试为开源项目并持续维护,评估结果常通过arXiv论文和GitHub平台共享。

SuperCLUE:综合性中文大语言模型基准
SuperCLUE GitHub仓库
ChinAI:SuperCLUE基准——2025年中阶段性评估


Back

x-ai/grok-4-fast

Donate