最近的研究揭示,ChatGPT 在其训练过程中使用了大量受版权保护的材料。研究人员发现,ChatGPT 会故意混淆输出以避免暴露使用了受版权保护的内容。此外,其他大型语言模型也被发现会用受版权保护的文本来生成提示,因为它们通过训练大量文本数据获得能力,而这些数据中通常包含受版权保护的内容。这个研究结果引发了对大型语言模型使用版权材料的关注和讨论。
OpenAI开发的一款先进AI聊天机器人