C-Eval

C-Eval是一个多层次、多学科的中文评估工具，专为基础模型设计。

C-Eval是一个多层次、多学科的中文评估工具，专为基础模型设计。

标签：AI数据集 AI基础模型 AI评估工具

0 0 0 手机看

C-Eval产品介绍

C-Eval的封面图

C-Eval是一款全面的中文评估套件，专为基础模型设计，涵盖了多达13948道多项选择题，涉及52个不同学科和四个难度等级。以下是C-Eval的主要特点：

多学科覆盖：C-Eval的题库包含多个学科，适用于不同领域的评估需求，确保用户能够在多样化的知识背景下进行测试。
多难度级别：题目分为四个难度等级，用户可以根据自身需求选择适合的难度进行评估，帮助更好地了解模型的能力。
数据下载：用户可以直接在Huggingface datasets上下载数据，方便进行本地使用和研究。

由AI导航（aidh.net）整理，仅供参考。

使用指导：在GitHub上提供详细的使用说明，帮助用户快速上手，了解如何读取和使用数据。
研究论文：C-Eval的相关研究论文已在《神经信息处理系统进展》上发表，用户可以通过阅读论文获取更深入的理解。

C-Eval不仅适合研究人员和开发者使用，也为教育工作者提供了一个评估工具，帮助他们在教学中应用基础模型的评估。若有任何疑问或需要进一步的信息，用户可以通过电子邮件或在GitHub上创建问题进行联系。

©️版权声明：若无特殊声明，本站所有文章版权均归AI工具库原创和所有，未经许可，任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容，或在非我站所属的服务器上建立镜像。否则，我站将依法保留追究相关法律责任的权利。

AI工具库是优质且实用的AI工具集合站点！本文地址 https://aidh.net/tool/cevalbenchmark_com 转载请注明

类似C-Eval的平替工具

魔搭社区致力于构建开放的AI模型与数据共享平台，推动创新与合作。

FlagEval致力于提供科学、公正、开放的大模型评测平台，提升模型性能评估的效率与客观性。

暂无评论

none

暂无评论...