ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

多家作家起诉OpenAI等AI巨头未经授权使用盗版书籍训练模型

2025-12-24

摘要:当地时间2025年12月22日,一个由作家组成的群体,包括两届普利策新闻奖得主约翰·卡雷鲁,向美国加州北区地方法院提起集体诉讼,指控OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家AI公司,涉嫌通过使用盗版书籍训练其大语言模型构成“蓄意侵权”。诉状核心指控这些公司从LibGen、Z-Library等“非法影子图书馆”批量下载数百万册盗版书籍,形成了“盗版获取-模型训练-商业变现”的侵权链条。若陪审团认定侵权为故意行为,每部被侵权作品最高可获赔15万美元。加州北区法院已受理全美超过半数的AI版权案件(共25起),此案判决可能成为界定AI训练数据合法性的关键。

线索:本次诉讼凸显了AI产业在数据获取上面临的重大法律与合规风险。如果法院最终支持原告主张,认定大规模使用未经授权的版权内容训练AI模型构成侵权,相关企业可能面临高额赔偿(参考Anthropic此前15亿美元的和解案例),并被迫调整其核心的数据获取与训练策略,增加合规成本。这将对依赖海量文本数据进行模型迭代的AI公司构成长期挑战,可能影响其研发进度和商业模式。同时,案件进展也将为投资者观察AI行业监管框架的演变提供重要风向标。

正文:2025年12月22日,一个由作家组成的群体向美国加州北区地方法院提起集体诉讼,被告包括OpenAI、谷歌、Meta、Anthropic、xAI及Perplexity AI六家人工智能公司。原告指控这些公司通过使用盗版书籍训练其大语言模型,构成了“蓄意侵权”。

诉状指出,原告的核心指控围绕一条“双重侵权链条”:上述六家公司被指从LibGen、Z-Library等被称为“非法影子图书馆”的网站批量下载了数百万册小说、纪实作品等盗版书籍,随后将这些作品用于大语言模型的训练与产品优化。原告方认为,这一过程形成了“盗版获取-模型训练-商业变现”的闭环,并强调作家的智力成果支撑了“价值数十亿美元的AI生态”,但未获得相应补偿。

根据相关法律,若陪审团最终认定侵权行为属于故意,每部被侵权的作品最高可判处15万美元的赔偿。

此次诉讼并非AI公司首次卷入文字作品版权纠纷。有报告指出,OpenAI已成为行业内的“被诉大户”,面临至少14起版权诉讼。

回顾过往案例,2023年底,《纽约时报》曾起诉微软和OpenAI侵犯版权,称其数百万篇文章被用于训练智能聊天机器人,并要求被告销毁使用其版权材料的任何AI模型和训练数据,同时为相关损失负责。2025年6月,OpenAI对此案中《纽约时报》要求无限期保留用户数据的诉讼请求提起了上诉,认为该请求违背了其隐私承诺。

除OpenAI外,《纽约时报》在2024年10月也曾向AI初创公司Perplexity发出“停止并终止”通知。谷歌则在2025年12月初收到迪士尼的停止侵权函,被指未经授权复制大量版权作品用于AI开发。Meta也多次因模型训练数据问题收到来自好莱坞制片厂的侵权警告。

其中,Anthropic的案例具有标志性。该公司因使用盗版书籍训练其Claude模型而被起诉,并于2025年6月被美国加州法院裁定“盗版数据不适用合理使用”原则,最终以支付15亿美元和解并销毁侵权数据告终。

诉讼中提及的xAI与Perplexity AI两家公司,虽然成立时间较短,但此次被指控的侵权模式与行业巨头高度一致。

目前,受理此案的加州北区地方法院已累计受理25起AI版权相关案件,数量占全美同类案件的一半以上。该案的判决结果,预计将对未来AI训练数据的合法性边界产生重要影响。

发布时间:2025-12-23T09:22:04+00:00

相关推荐

评论 ( 0 )

3.4 W

文章

65.6 W

点赞

回顶部