C-Eval

C-Eval

C-Eval是一个多层次、多学科的中文评估工具,专为基础模型设计。

前往访问

C-Eval是一个多层次、多学科的中文评估工具,专为基础模型设计。

C-Eval产品介绍

C-Eval的封面图

C-Eval是一款全面的中文评估套件,专为基础模型设计,涵盖了多达13948道多项选择题,涉及52个不同学科和四个难度等级。以下是C-Eval的主要特点:

  • 多学科覆盖:C-Eval的题库包含多个学科,适用于不同领域的评估需求,确保用户能够在多样化的知识背景下进行测试。
  • 多难度级别:题目分为四个难度等级,用户可以根据自身需求选择适合的难度进行评估,帮助更好地了解模型的能力。
  • 数据下载:用户可以直接在Huggingface datasets上下载数据,方便进行本地使用和研究。
  • AI导航(aidh.net)整理,仅供参考。

  • 使用指导:在GitHub上提供详细的使用说明,帮助用户快速上手,了解如何读取和使用数据。
  • 研究论文:C-Eval的相关研究论文已在《神经信息处理系统进展》上发表,用户可以通过阅读论文获取更深入的理解。

C-Eval不仅适合研究人员和开发者使用,也为教育工作者提供了一个评估工具,帮助他们在教学中应用基础模型的评估。若有任何疑问或需要进一步的信息,用户可以通过电子邮件或在GitHub上创建问题进行联系。

©️版权声明:若无特殊声明,本站所有文章版权均归AI工具库原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

类似C-Eval的平替工具

魔搭社区
魔搭社区

魔搭社区致力于构建开放的AI模型与数据共享平台,推动创新与合作。

FlagEval
FlagEval

FlagEval致力于提供科学、公正、开放的大模型评测平台,提升模型性能评估的效率与客观性。

暂无评论

none
暂无评论...