AI·新世界

纽约南区法院驳回Raw Story和AlterNet对OpenAI的版权侵权诉讼

2024年11月8日

文章目录[隐藏]

DMCA第1202(b)条
原告的指控
法院驳回的理由
类似案例
第1202(b)条的分歧
对AI和内容创作者的意义

纽约南区法院驳回了一起由左倾在线新闻网站Raw Story Media, Inc.和AlterNet Media, Inc.提起的版权侵权诉讼。这两家公司指控OpenAI在训练其AI模型（如ChatGPT）时使用了未经授权的新闻内容，从而侵犯了版权。这一驳回被认为是版权与AI工具之间持续斗争中的一个重要时刻，尤其是在《数字千年版权法》（DMCA）第1202(b)条下的应用。(地址)

DMCA第1202(b)条

版权管理信息（CMI）：DMCA第1202(b)条旨在保护“版权管理信息”（CMI），包括作者姓名、标题和其他标识版权作品的元数据。
禁止行为：该条款禁止未经授权删除或更改此类信息，特别是如果这样做有助于版权侵权。

原告的指控

指控内容：Raw Story和AlterNet指控OpenAI在训练ChatGPT和其他模型时使用了他们网站上的文章，但没有保留CMI，从而违反了第1202(b)条。
数据抓取：OpenAI并不是唯一可能从网络上抓取此类材料的AI公司。整个行业已经抓取了大量网络数据来训练其模型，这种做法类似于Google在搜索引擎中爬取和索引网页内容。

法院驳回的理由

缺乏诉讼资格：法官Colleen McMahon批准了OpenAI驳回此案的动议，理由是原告缺乏诉讼资格。具体来说，法官发现原告无法证明他们因OpenAI的行为遭受了具体的、实际的伤害，这是美国宪法第三条对任何诉讼进行的基本要求。
生成式AI的特性：法官还考虑了大型语言模型（LLM）接口不断变化的格局，指出这些系统的更新进一步复杂化了归属和可追溯性。生成式AI旨在综合信息，而不是逐字复制，这使得原告的指控更加推测性。
具体证据不足：法官指出，“ChatGPT输出原告文章中抄袭内容的可能性似乎很小。”原告未能提供令人信服的证据，证明他们的特定作品以导致可识别损害的方式直接侵权。

类似案例

Doe 1 v. GitHub：涉及微软Copilot的案件也涉及第1202(b)条的索赔。法院发现Copilot生成的代码并非原始代码的“完全相同复制”，而是重新配置的片段，这使得证明违反CMI要求变得困难。
Sarah Silverman案：法院认为原告未能提供足够证据证明OpenAI主动移除了她的内容的CMI。这一裁决与Raw Story的裁决一致，突显了原告面临的举证负担。

第1202(b)条的分歧

相同性要求：一些法院施加了所谓的“相同性”要求，即原告必须证明侵权作品是原始内容的完全复制，减去CMI。
灵活解释：其他法院则允许更灵活的解释，例如德克萨斯州南区法院最近拒绝了相同性要求，指出即使部分复制也可能构成侵权，如果CMI被故意移除。

对AI和内容创作者的意义

法律先例：Raw Story诉讼的驳回不仅仅是OpenAI的胜利，还表明了法院在快速发展的生成式AI领域如何处理类似的版权索赔。这一裁决可能有助于确立驳回此类及未来索赔的先例。
证明损害的难度：如果没有明确的、可证明的伤害或完全复制，原告可能难以在法庭上获得胜诉。
综合数据 vs. 直接复制：生成式AI如何综合数据而不是直接复制数据，使得在现行版权法下证明侵权变得困难。
透明度和合规性：对于开发者和科技公司来说，透明度、数据记录和合规性是避免法律麻烦的关键。与内容创作者达成许可协议可能成为新的标准。

Raw Story诉讼的驳回反映了法院在处理生成式AI和版权问题时面临的挑战。随着技术的不断发展，法律界也在努力适应新的现实。对于内容创作者来说，确保适当的归属和防止未经授权使用其作品仍然是一个重大挑战，而透明和合规的实践将有助于减少法律风险。