智源研究院发布FlagEval大模型角斗场，新增文生视频模型对战评测服务

1年前发布AI俱乐部

摘要：

在2024年9月4日，北京智源人工智能研究院（BAAI）正式发布了面向通用人工智能大模型评测的开源工具套件—— […]

在2024年9月4日，北京智源人工智能研究院（BAAI）正式发布了面向通用人工智能大模型评测的开源工具套件——FlagEval大模型评测体系。

这是一项重要的进展，它涵盖了中国及全球范围内的超过40个通用大模型，提供预训练知识、模型对齐能力、以及模型生成能力等多方面的综合评测。FlagEval大模型评测体系的推出，旨在促进通用大模型的技术发展和应用。

该工具支持灵活的评测方案，能够满足不同用户的多样化评估需求。用户可以利用该平台评估其自有或开源的大模型，从而推动人工智能领域的进步。FlagEval大模型评测体系的目标是为大模型的研发和应用提供全面的支持。

智源人工智能研究院表示，发布大模型评测体系是为了推动该领域评估标准的建立，提升大模型的能力水平。FlagEval大模型评测体系的发布，标志着在通用大模型评测领域迈出了坚实的一步，为研究人员提供了更高效的工具，助力大模型技术的蓬勃发展。

项目地址：https://flageval.baai.ac.cn/#/home

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/eqhocn3a

暂无评论