企鹅兰登书屋修改了版权页上的措辞,保护作者的知识产权不被用于训练大语言模型和其他AI工具

《书商》杂志独家报道,世界最大的贸易出版商企鹅兰登书屋(PRH)已在全球范围内修改了其版权页上的措辞,旨在保护作者的知识产权不被用于训练大型语言模型(LLMs)和其他人工智能(AI)工具。

新版权措辞的核心内容

新的版权声明明确指出:“本书的任何部分均不得以训练人工智能技术或系统的目的使用或复制。”此外,声明还保留了“不受文本和数据挖掘例外的权利”,符合欧洲议会的一项指令。这意味着未经权利持有人的同意,AI公司不得使用这些受版权保护的作品来训练其模型。

行业背景与动因

这一举措的背景是,近年来,AI公司在未经许可的情况下使用大量已发表的作品来训练语言模型,引发了广泛的版权争议。2024年,多家学术出版商如泰勒与弗朗西斯、威利和塞奇宣布与AI公司合作,授权内容。然而,这些合作并未平息版权持有者的担忧。

PRH的立场与行动

PRH英国首席执行官汤姆·韦尔登在8月告知员工,公司“将坚决捍卫属于我们作者和艺术家的知识产权”。同时,他也表示,公司将在“负责任地创新”方面保持灵活性,选择性地使用生成式AI工具,前提是这些工具能够“推进我们的目标”。

行业反应与影响

作者许可和收集协会(PLC)对PRH的这一举措表示欢迎。PLC首席执行官芭芭拉·海斯说:“看到像PRH这样的主要出版商采取新措辞,重申版权原则并明确禁止未经授权的AI训练,这是令人鼓舞的。”她希望更多出版商效仿这一做法。

作者协会(SoA)也对PRH的变化表示欢迎,但强调还需要进一步修改作者合同,增加适当的保障措施。SoA首席执行官安娜·甘利说:“我们希望看到出版合同中的变化,确保在使用生成式AI工具与作品生产相关联时,征求创作者的同意。”

法律与实践建议

版权律师刘千伟指出,训练LLMs可能构成版权侵权,出版商应确保控制这一行为,以保护作者的利益。她建议出版商采取以下措施:

  • 明确声明:在版权页上明确保留所有训练和文本及数据挖掘权利。
  • 技术手段:使用robots.txt文件防止网站内容被抓取。
  • 用户指南:发布指南,指导用户如何选择不将其内容用于AI训练。
  • 机器可读许可证:创建新的机器可读的文本和数据挖掘许可证,确保合法访问。

其他出版商的反应

《书商》杂志联系了其他主要出版商,如Pan Macmillan、Hachette和Simon & Schuster,但这些公司拒绝置评。Faber则最近采用了“AI政策”,禁止自由职业者将其作者的书籍内容复制到AI程序中。

PRH的完整版权声明

以下是PRH版权页的完整声明: “企鹅兰登书屋重视并支持版权。版权激发创造力,鼓励多样化的声音,促进言论自由,并支持充满活力的文化。感谢您购买这本授权版书籍,并通过不复制、扫描或以任何方式分发其任何部分来尊重知识产权法。您正在支持作者,并使企鹅兰登书屋能够继续为每个人出版书籍。本书的任何部分均不得以训练人工智能技术或系统的目的使用或复制。根据2019/790数字单一市场指令第4(3)条,企鹅兰登书屋明确保留此作品不受文本和数据挖掘例外的权利。”(来源

我们将24小时内回复。
取消