

AIGC动态欢迎阅读
最新动态:图灵测试已经过时!ChatGPT即使通过人类考试,也无法完全胜任,一项新研究揭示其在“逻辑谜题”方面的难题。
文章来源:新智元
文章长度:6791字
文章摘要:新智元的报道编辑桃子指出:如何为大型AI模型建立真正公正的评估标准?即使全球最强AI ChatGPT能够通过各种考试,甚至输出令人难以分辨真假的答案。然而,它在处理简单的视觉逻辑难题方面显得力有不逮。在一项测试中,屏幕上排列着一系列色彩鲜艳的块,大多数人能够找出相关的图案。但根据今年5月的研究报告,GPT-4在某类图案测试中的正确率仅为1/3,在另一类图案中仅为3…
原文链接:请点击阅读原文:图灵测试已死!ChatGPT通过人类考试也不算,超强AI评估新秀「逻辑谜题」
联系作者
文章来源:新智元
作者微信:AI_era
作者简介:新智元是智能+中国主要平台,旨在推动中国从互联网+迈向智能+新时代。其主要关注人工智能、机器人等前沿领域的发展,重点研究人机融合、人工智能和机器人对人类社会与文明进化的影响,引领中国迈向新智能时代。
文章中提到的AI工具
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...