

当前,有关使用人工智能代码生成工具所引发的法律和道德讨论日益增多。例如,关于GitHub Copilot是否会侵犯开源许可协议以及是否会产生歧视性代码的讨论层出不穷。而这些讨论的核心在于理解代码生成工具如何影响软件开发。
最近,Free Software Foundation发布了一篇题为《版权、许可和Copilot:探索大型语言模型的法律问题》的白皮书,探讨了GitHub和OpenAI的Copilot及Codex在训练数据、输出代码和法律责任等方面所涉及的法律问题,旨在促进对代码生成工具的理解。
该报告重点关注了“数字千年版权法案”(DMCA)第1202(b)条规定的技术保护措施。此条款禁止移除或篡改任何版权管理信息。该报告认为,如果Copilot未能正确归属生成代码的来源,则可能违反此条款。此外,该报告还探讨了Copilot是否能够记住来自具有许可限制的代码片段的训练数据。
其中一个关键论点是,尽管人工智能可以通过模仿现有代码来生成新代码,但它不能完全理解或尊重原始代码的许可条款。这意味着使用人工智能生成的代码可能无意中侵犯了他人的知识产权。例如,法官Jon S. Tigar指出,Copilot有可能“在没有适当归属的情况下,从受版权保护的材料中提取大量内容”,这可能会导致法律纠纷。
进一步地,这种工具的使用也引发了关于创造性和版权归属的根本性问题。如果人工智能可以生成功能与人类编写的代码相似的代码,那么谁应该对生成的代码负责?这份报告旨在通过OpenAI对“自由及开源软件”的代码训练来探讨这些问题。
该报告还探讨了使用未经许可或未归属的代码进行训练所带来的法律影响,强调了训练数据需要遵守相关的法律法规。此外,它还认为,Copilot可能会在未经适当许可的情况下生成代码,从而造成潜在的法律责任。
总的来说,这份白皮书旨在为那些对人工智能的代码生成工具所带来的法律挑战和道德影响感兴趣的开发者提供有价值的见解。它强调了Copilot等代码生成工具在法律和伦理方面引发的复杂问题。
目前,业界对于开源代码许可、代码所有权以及人工智能生成代码的法律责任等问题的讨论仍在继续。
快讯中提到的AI工具

致力于创造对全人类有益的安全 AGI
