
盜版書籍數據庫LibGen被Meta用於訓練AI,包含藝術家、建築師、畫廊和博物館的書籍
作者:Karen K. Ho
日期:2025年3月20日下午4:02
這個龐大的數據庫中也包含了安迪·沃荷、艾未未和瑪麗娜·阿布拉莫維奇等藝術家的作品。
Library Genesis(LibGen)是一個包含數百萬本書籍、科學論文、漫畫和雜誌的盜版數據庫,Meta將其用於訓練其旗艦AI模型Llama 3。根據3月19日公布的法庭文件,Meta的高層獲得了首席執行官馬克·祖克伯格的許可,下載並使用LibGen來訓練其AI模型。
目前,LibGen的收藏中包含超過750萬本書和8100萬篇研究論文。儘管大部分內容集中在科學、技術、工程和數學領域,但該數據庫也包括由博物館、藝術家、建築師和藝術畫廊撰寫和出版的文學作品。
與此相關的文章
涉及沃荷和波洛克盜竊案的犯罪團夥成員被判入獄
佳士得的AI藝術拍賣突破爭議,超出預期
Meta內部關於使用LibGen的決定的通訊最近被解密,這是因為幾位LibGen數據庫中書籍的作者,包括塔-內希西·科茨、莎拉·西爾弗曼和大衛·亨利·黃,對該公司提起了版權侵權訴訟。今年早些時候,另一組類似的作者也揭露OpenAI過去曾使用LibGen。
雖然大多數人可能對LibGen盜版的內容並不知情,但基於其龐大數據庫訓練的生成AI產品已經嵌入到許多受歡迎的產品中,這些產品每天有數百萬用戶使用,比如Meta的Facebook、Instagram、Whatsapp或OpenAI的ChatGPT。
(Meta的發言人拒絕對《大西洋月刊》發表評論,理由是公司正在進行的訴訟。OpenAI也沒有對《大西洋月刊》的評論請求作出回應。)
《大西洋月刊》使用了一些LibGen的元數據來創建一個可按作者名稱搜索的互動數據庫。在結果中,ARTnews發現了以下內容:
– 約翰·沃特斯的書籍《Make Trouble》,基於他在2015年羅德島設計學院的畢業典禮演講
– 加哥西安畫廊於2018年出版的珍妮·薩維爾的專著
– 所羅門·R·古根海姆博物館的《馬克·羅斯科,1903-1970:回顧展》、毛里齊奧·卡特蘭和《偉大的烏托邦:俄羅斯和蘇聯的前衛,1915-1932》的展覽目錄
– 2015年在布魯克林博物館舉行的基亨德·威利個展的展覽目錄
– 由國家藝術館出版的一本童書和兩本精裝書
– 安迪·沃荷的書籍,包括英語、西班牙語、意大利語和葡萄牙語版本
– 來自著名黎巴嫩裔美國畫家和作家埃特爾·阿德南的幾部作品
– 佩吉·古根海姆的《藝術瘾者的自白》的英文和意大利文版
– MoMA館長格倫·D·洛瑞的三篇年度報告
– 瓦西里·康丁斯基的《點與線到平面》,由建築師霍華德·迪爾斯廷和古根海姆博物館聯合創始人希拉·瑞貝翻譯
– 傑瑞·薩爾茨的《如何成為藝術家》和《藝術就是生活:偶像與破壞者、先知和警惕者,以及夜晚的希望閃光》
– 《MoMA亮點:紐約現代藝術博物館的350件作品》的中文翻譯
– 瑪麗娜·阿布拉莫維奇的傳記《穿越牆壁》的意大利文版,與詹姆斯·卡普蘭共同撰寫
– 法蘭克·勞埃德·賴特1932年書籍《消失的城市》的俄文翻譯和德文版《人性建築》
– 艾未未的《千年的喜悅與悲傷:回憶錄》的英文、意大利文和葡萄牙文版本
– 多部美國藝術雜誌《Bomb》、《藝術公報》、《藝術期刊》、《伯靈頓雜誌》和《大街》
此外,還有關於小野洋子、大衛·伯恩、羅伯特·麥普爾索普、艾德·魯斯查、戴維·霍克尼和路德維希·密斯·范·德·羅赫的作品結果。
編輯註:ARTnews記者Karen K. Ho的作品也通過《無法言喻的行為:真實犯罪、謀殺、欺詐的故事》這本選集在LibGen的數據庫中被用來訓練Meta的AI,該書由莎拉·韋恩曼編輯。
這一事件引發了對於知識產權的深刻反思,尤其是在當前科技迅速發展的背景下。Meta利用盜版數據庫進行AI訓練的行為,不僅涉及法律問題,還挑戰了對藝術作品和知識產權的基本尊重。這也提醒我們,隨著AI技術的進步,如何平衡創作自由與知識產權的保護將成為未來的重要議題。如何在促進創新與保護創作者權益之間找到一個合理的平衡點,將是未來社會需要面對的挑戰。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。