紐約時報記者控告Google、xAI及OpenAI濫用著作權訓練聊天機械人
調查記者約翰·卡瑞魯(John Carreyrou),以揭露硅谷血液檢測創企Theranos詐騙案聞名,於12月22日向加州聯邦法院提起訴訟,狀告Elon Musk旗下的xAI、Anthropic、Google、OpenAI、Meta Platforms及Perplexity等人工智能公司,指控他們在未經授權下使用受版權保護的書籍內容作為訓練大型語言模型(LLM)的資料來源。
卡瑞魯與其他五位作家共同提告,控訴這些AI企業非法盜用他們的著作,將內容餵入驅動聊天機械人的語言模型中。此案是眾多作者及著作權持有人因AI訓練資料使用問題而對科技公司提起的訴訟之一,亦是首次將xAI列為被告。
被告方發言人暫未對訴訟作出回應。與其他正在進行的集體訴訟不同,這次原告選擇分開提告,避免集體訴訟中被告以低價和解來消除大量高價值索償的情況。訴狀中指出:「大型語言模型公司不應該輕易以廉價方式消滅數以千計的高價值索償。」
值得注意的是,Anthropic公司於今年8月已達成一宗AI訓練版權糾紛的重大和解,支付15億美元賠償給一個作者集體,該集體指控Anthropic非法盜用了數百萬本書。此次新訴訟指出,該和解案中,集體成員每本侵權作品只能獲得版權法規定的最高賠償額15萬美元的2%,遠遠不夠。
這次訴訟由Freedman Normand Friedland律師事務所代理,Kyle Roche律師參與提告,他在2023年曾被卡瑞魯報導。此前在Anthropic集體訴訟的聽證會上,法官批評Roche共同創辦的另一律師事務所試圖鼓動作者退出和解協議,尋求更有利的賠償。Roche本人未對本案置評。
卡瑞魯在隨後的聽證中直言,Anthropic盜用書籍訓練AI是其「原罪」,且此前和解不足以彌補損失。
—
評論與觀點
這宗訴訟標誌著AI訓練資料版權問題正逐漸成為法律與倫理的焦點。隨著大型語言模型和生成式AI技術迅速普及,企業對大量文字資料的需求暴增,涉及的版權爭議也越來越多。原告選擇分散訴訟而非參與集體和解,顯示他們對於維護個別權益的決心,也反映出對於現有和解金額過低的不滿。
這起案件同時揭示出科技巨頭在利用公開或未經授權資料訓練AI時,面臨的法律風險與道德責任。AI模型的效能很大程度上依賴於龐大的數據集,但這些數據背後往往涉及無數創作者的智慧財產權。如何平衡技術發展與著作權保護,將是未來監管政策與法律判決的重要課題。
此外,案件還涉及Elon Musk創立的新AI公司xAI,凸顯出新興AI企業同樣免不了版權爭議的困境。未來,科技公司或需尋求更透明和合規的資料使用方式,或與內容創作者達成合理授權協議,才能確保AI技術可持續發展。
總括而言,這場訴訟不僅關乎個別著作權人的權益,更是一次對AI產業生態中「公平使用」與「知識產權」界限的檢視。香港的讀者亦應關注此類案件,因為本地與國際的AI發展與規範趨勢息息相關,對未來數碼內容創作及利用有深遠影響。
以上文章由特價GPT API KEY所翻譯及撰寫。