研究显示：AI搜索引擎在查询新闻时频繁出现错误，超过六成的答案不可靠

摘要：

一项新近发布的研究揭示了人工智能搜索引擎在处理新闻信息时所面临的重大挑战。哥伦比亚新闻评论（CJR）的数字新闻 […]

一项新近发布的研究揭示了人工智能搜索引擎在处理新闻信息时所面临的重大挑战。哥伦比亚新闻评论（CJR）的数字新闻中心对八款具备实时搜索功能的AI工具进行了系统性测试，结果令人堪忧：超过60%的新闻查询得到了不准确的答案。

研究结果显示，不同AI平台之间存在显著的错误率差异，其中Grok3的错误率高达94%，而ChatGPT Search的错误率亦达到了67%。值得注意的是，即便是付费版本的服务，如Perplexity Pro及Grok3的高级服务，在回答中也更频繁地提供自信但不准确的回答。研究人员强调，这些AI模型普遍呈现出一种**“自信地错误”**的倾向，意即在缺乏可靠的信息时，它们并不会自动拒绝回答，而是倾向于生成看似逻辑合理的错误答案。

此外，研究进一步揭示了AI搜索引擎在引用来源方面存在的问题。它们常常指向新闻内容的联合发布平台，而非原始出版商的网站。更为令人关切的是，部分AI工具甚至会捏造无效的URL链接，导致用户无法访问信息源。例如，在测试中，Grok3超过一半的引用链接均为失效状态。

这些问题为新闻出版商带来了严峻的挑战。若阻止AI爬虫的抓取，可能导致内容完全失去署名，而若允许抓取，则可能面临内容被广泛使用却无法有效引流回自身网站的困境。时代杂志的首席运营官马克·霍华德对此表现出对透明度与控制权的深切关注。

研究人员指出，考虑到目前约四分之一的美国人已将AI模型视为传统搜索引擎的替代品，如此高的错误率令人对信息的可靠性倍感忧虑。这项研究进一步印证了去年11月发布的类似报告，后者同样指出了ChatGPT在处理新闻内容时的准确性问题。尽管OpenAI和微软承认已收到该研究结果，但尚未针对具体问题作出直接回应。