ChatGPT超越人类考试，超强AI评估新秀「逻辑谜题」

AIGC动态欢迎阅读

最新动态：图灵测试已经过时！ChatGPT即使通过人类考试，也无法完全胜任，一项新研究揭示其在“逻辑谜题”方面的难题。

关键词：报告、测试、人类、能力、研究人员

文章来源：新智元

文章长度：6791字

文章摘要：新智元的报道编辑桃子指出：如何为大型AI模型建立真正公正的评估标准？即使全球最强AI ChatGPT能够通过各种考试，甚至输出令人难以分辨真假的答案。然而，它在处理简单的视觉逻辑难题方面显得力有不逮。在一项测试中，屏幕上排列着一系列色彩鲜艳的块，大多数人能够找出相关的图案。但根据今年5月的研究报告，GPT-4在某类图案测试中的正确率仅为1/3，在另一类图案中仅为3…

原文链接：请点击阅读原文：图灵测试已死！ChatGPT通过人类考试也不算，超强AI评估新秀「逻辑谜题」