多家作家起诉OpenAI等AI巨头未经授权使用盗版书籍训练模型

2025-12-24

摘要：当地时间2025年12月22日，一个由作家组成的群体，包括两届普利策新闻奖得主约翰·卡雷鲁，向美国加州北区地方法院提起集体诉讼，指控OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家AI公司，涉嫌通过使用盗版书籍训练其大语言模型构成“蓄意侵权”。诉状核心指控这些公司从LibGen、Z-Library等“非法影子图书馆”批量下载数百万册盗版书籍，形成了“盗版获取-模型训练-商业变现”的侵权链条。若陪审团认定侵权为故意行为，每部被侵权作品最高可获赔15万美元。加州北区法院已受理全美超过半数的AI版权案件（共25起），此案判决可能成为界定AI训练数据合法性的关键。

线索：本次诉讼凸显了AI产业在数据获取上面临的重大法律与合规风险。如果法院最终支持原告主张，认定大规模使用未经授权的版权内容训练AI模型构成侵权，相关企业可能面临高额赔偿（参考Anthropic此前15亿美元的和解案例），并被迫调整其核心的数据获取与训练策略，增加合规成本。这将对依赖海量文本数据进行模型迭代的AI公司构成长期挑战，可能影响其研发进度和商业模式。同时，案件进展也将为投资者观察AI行业监管框架的演变提供重要风向标。

正文：2025年12月22日，一个由作家组成的群体向美国加州北区地方法院提起集体诉讼，被告包括OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家人工智能公司。原告指控这些公司通过使用盗版书籍训练其大语言模型，构成了“蓄意侵权”。

诉状指出，原告的核心指控围绕一条“双重侵权链条”：上述六家公司被指从LibGen、Z-Library等被称为“非法影子图书馆”的网站批量下载了数百万册小说、纪实作品等盗版书籍，随后将这些作品用于大语言模型的训练与产品优化。原告方认为，这一过程形成了“盗版获取-模型训练-商业变现”的闭环，并强调作家的智力成果支撑了“价值数十亿美元的AI生态”，但未获得相应补偿。

根据相关法律，若陪审团最终认定侵权行为属于故意，每部被侵权的作品最高可判处15万美元的赔偿。

此次诉讼并非AI公司首次卷入文字作品版权纠纷。有报告指出，OpenAI已成为行业内的“被诉大户”，面临至少14起版权诉讼。

回顾过往案例，2023年底，《纽约时报》曾起诉微软和OpenAI侵犯版权，称其数百万篇文章被用于训练智能聊天机器人，并要求被告销毁使用其版权材料的任何AI模型和训练数据，同时为相关损失负责。2025年6月，OpenAI对此案中《纽约时报》要求无限期保留用户数据的诉讼请求提起了上诉，认为该请求违背了其隐私承诺。

除OpenAI外，《纽约时报》在2024年10月也曾向AI初创公司Perplexity发出“停止并终止”通知。谷歌则在2025年12月初收到迪士尼的停止侵权函，被指未经授权复制大量版权作品用于AI开发。Meta也多次因模型训练数据问题收到来自好莱坞制片厂的侵权警告。

其中，Anthropic的案例具有标志性。该公司因使用盗版书籍训练其Claude模型而被起诉，并于2025年6月被美国加州法院裁定“盗版数据不适用合理使用”原则，最终以支付15亿美元和解并销毁侵权数据告终。

诉讼中提及的xAI与Perplexity AI两家公司，虽然成立时间较短，但此次被指控的侵权模式与行业巨头高度一致。

目前，受理此案的加州北区地方法院已累计受理25起AI版权相关案件，数量占全美同类案件的一半以上。该案的判决结果，预计将对未来AI训练数据的合法性边界产生重要影响。

发布时间：2025-12-23T09:22:04+00:00

多家作家起诉OpenAI等AI巨头未经授权使用盗版书籍训练模型

相关推荐

评论 ( 0 )

取消回复

多家作家起诉OpenAI等AI巨头未经授权使用盗版书籍训练模型

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站