纽约南区法院驳回Raw Story和AlterNet对OpenAI的版权侵权诉讼

纽约南区法院驳回了一起由左倾在线新闻网站Raw Story Media, Inc.和AlterNet Media, Inc.提起的版权侵权诉讼。这两家公司指控OpenAI在训练其AI模型(如ChatGPT)时使用了未经授权的新闻内容,从而侵犯了版权。这一驳回被认为是版权与AI工具之间持续斗争中的一个重要时刻,尤其是在《数字千年版权法》(DMCA)第1202(b)条下的应用。(地址)

DMCA第1202(b)条

  • 版权管理信息(CMI):DMCA第1202(b)条旨在保护“版权管理信息”(CMI),包括作者姓名、标题和其他标识版权作品的元数据。
  • 禁止行为:该条款禁止未经授权删除或更改此类信息,特别是如果这样做有助于版权侵权。

原告的指控

  • 指控内容:Raw Story和AlterNet指控OpenAI在训练ChatGPT和其他模型时使用了他们网站上的文章,但没有保留CMI,从而违反了第1202(b)条。
  • 数据抓取:OpenAI并不是唯一可能从网络上抓取此类材料的AI公司。整个行业已经抓取了大量网络数据来训练其模型,这种做法类似于Google在搜索引擎中爬取和索引网页内容。

法院驳回的理由

  • 缺乏诉讼资格:法官Colleen McMahon批准了OpenAI驳回此案的动议,理由是原告缺乏诉讼资格。具体来说,法官发现原告无法证明他们因OpenAI的行为遭受了具体的、实际的伤害,这是美国宪法第三条对任何诉讼进行的基本要求。
  • 生成式AI的特性:法官还考虑了大型语言模型(LLM)接口不断变化的格局,指出这些系统的更新进一步复杂化了归属和可追溯性。生成式AI旨在综合信息,而不是逐字复制,这使得原告的指控更加推测性。
  • 具体证据不足:法官指出,“ChatGPT输出原告文章中抄袭内容的可能性似乎很小。”原告未能提供令人信服的证据,证明他们的特定作品以导致可识别损害的方式直接侵权。

类似案例

  • Doe 1 v. GitHub:涉及微软Copilot的案件也涉及第1202(b)条的索赔。法院发现Copilot生成的代码并非原始代码的“完全相同复制”,而是重新配置的片段,这使得证明违反CMI要求变得困难。
  • Sarah Silverman案:法院认为原告未能提供足够证据证明OpenAI主动移除了她的内容的CMI。这一裁决与Raw Story的裁决一致,突显了原告面临的举证负担。

第1202(b)条的分歧

  • 相同性要求:一些法院施加了所谓的“相同性”要求,即原告必须证明侵权作品是原始内容的完全复制,减去CMI。
  • 灵活解释:其他法院则允许更灵活的解释,例如德克萨斯州南区法院最近拒绝了相同性要求,指出即使部分复制也可能构成侵权,如果CMI被故意移除。

对AI和内容创作者的意义

  • 法律先例:Raw Story诉讼的驳回不仅仅是OpenAI的胜利,还表明了法院在快速发展的生成式AI领域如何处理类似的版权索赔。这一裁决可能有助于确立驳回此类及未来索赔的先例。
  • 证明损害的难度:如果没有明确的、可证明的伤害或完全复制,原告可能难以在法庭上获得胜诉。
  • 综合数据 vs. 直接复制:生成式AI如何综合数据而不是直接复制数据,使得在现行版权法下证明侵权变得困难。
  • 透明度和合规性:对于开发者和科技公司来说,透明度、数据记录和合规性是避免法律麻烦的关键。与内容创作者达成许可协议可能成为新的标准。

Raw Story诉讼的驳回反映了法院在处理生成式AI和版权问题时面临的挑战。随着技术的不断发展,法律界也在努力适应新的现实。对于内容创作者来说,确保适当的归属和防止未经授权使用其作品仍然是一个重大挑战,而透明和合规的实践将有助于减少法律风险。

我们将24小时内回复。
取消