Anthropic支付15億美元和解版權訴訟,賠償作者因盜版訓練聊天機械人
人工智能公司Anthropic同意支付15億美元,和解一宗集體訴訟,該訴訟由多位作者發起,指控公司盜用其作品訓練聊天機械人。這宗具有劃時代意義的和解案,若法官於周一批准,或成為人工智能企業與作家、視覺藝術家及其他創意專業人士之間版權糾紛的轉捩點。
Anthropic同意向約50萬本涉案書籍的作者,每本支付約3,000美元賠償。訴訟代表律師Justin Nelson稱:「據我們所知,這是有史以來最大規模的版權賠償,亦是人工智能時代的首宗此類案件。」
三位作者——驚悚小說家Andrea Bartz及非小說作家Charles Graeber和Kirk Wallace Johnson——於去年起訴,代表一批作家及出版社,指控Anthropic從盜版網站下載他們的書籍訓練其聊天機械人Claude。
2025年6月,聯邦法官William Alsup作出混合判決,認為以版權書籍訓練AI聊天機械人本身不犯法,但Anthropic非法取得數百萬本書籍的行為屬違法。若案件繼續審理,專家估計Anthropic可能面臨數十億美元損失,甚至有倒閉風險。
Anthropic於周五表示,若和解獲批,將解決原告的所有剩餘索償,並承諾銷毀所下載的原始書籍文件。書籍作為AI大型語言模型訓練的重要數據來源,包含數十億字句,支撐著像Claude及其主要競爭對手OpenAI的ChatGPT等聊天機械人運作。
法官Alsup的判決指出,Anthropic下載超過700萬本數字化書籍,明知來自盜版來源,起初約20萬本來自名為Books3的在線圖書庫,後續又從盜版網站Library Genesis和Pirate Library Mirror分別取得數百萬本書籍。Bartz的處女作《The Lost Night》亦被發現包含於Books3數據集中。
作者公會曾向會員指,若案件審理發現Anthropic故意侵權,最低賠償額為每本書750美元,和解金額大幅提升至約3,000美元,反映涉案書籍庫存經過篩選,剔除重複及無版權保護作品。
作者公會行政總裁Mary Rasenberger讚揚和解結果「對作者、出版社及版權持有人均屬佳音」,向業界發出強烈訊息:非法盜用作者作品以訓練AI將面臨嚴重後果。
丹麥權利聯盟則指出,和解對未在美國註冊版權的歐洲作者幫助有限,並批評科技企業先以違規手段擴展業務,之後只需支付相對較低的罰款,視作經營成本之一。
Anthropic由前OpenAI高管於2021年創立,最新估值達1830億美元,預計今年營收50億美元,但至今未有盈利,主要依賴投資者支持研發高成本AI技術,期待未來回報。
此和解案或影響其他相關訴訟,包括作者和報章對OpenAI及其合作夥伴微軟提起的官司。法律分析師William Long認為,該案顯示創作者與AI公司或可透過和解解決爭議,避免漫長且昂貴的訴訟。
法官Alsup的判決也表明,利用版權作品訓練AI並生成新文本屬「合理使用」,因為這是「本質上的變革性行為」,並非簡單複製。然而,法庭文件揭示Anthropic內部對使用盜版網站的合法性存疑,後來聘請前谷歌圖書負責人Tom Turvey,轉而購買書籍並自行掃描數碼化,但未能抹去先前的盜版行為。
—
評論與啟示
這宗Anthropic與作者的和解案,標誌著人工智能訓練數據版權問題進入一個新階段。過去AI公司普遍採用「大數據」策略,從互聯網上無差別抓取資料,包括盜版書籍,來訓練語言模型。如今,隨著版權持有者的反擊及法律介入,這種無限制的資料攫取模式開始受到制約。
和解金額高達15億美元,反映出版權方的實力與決心,也警示AI企業必須重視數據合法性,否則面臨巨額賠償風險。這或促使AI公司轉向採用授權資料,甚至與作者和出版社合作,共創雙贏局面。
然而,丹麥權利聯盟的批評亦值得反思:科技巨頭往往先行擴張市場,事後才支付和解金,這種「先違規後賠償」的模式,可能成為業界潛規則。未來監管機構或需加強法律框架,防止企業以罰款作為經營成本,保障創作者權益。
此外,這起案件亦反映出人工智能倫理和法律的複雜性。AI生成內容雖具變革性,但基礎素材的合法性不可忽視。如何平衡創新與版權保護,將是未來AI發展的關鍵課題。
最後,這宗案件也提醒香港及全球創意產業從業者,應積極關注AI技術對版權生態的影響,爭取合理的權益保障,同時促進AI技術健康發展。面對人工智能的浪潮,創作者和技術公司必須攜手合作,建立公平且可持續的數據使用標準。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。
