AI革命衝擊版權法,法律界要變陣?

Ai

隨著人工智能革命的進行,版權法必須演變

隨著我們的法律系統面對新技術所帶來的新問題,對知識產權的處理方式必須改變,這是出版行業分析師克里斯多夫·肯尼利的觀點。

在網絡時代,版權侵權訴訟經常成為新聞焦點,並引起公眾對技術在迅速超越既有法律先例的關注。2004年,在Web 1.0的高峰期,美國出版商協會和美國作家公會起訴搜索巨頭谷歌,因其在未經許可的情況下掃描整個圖書館的書籍和其他出版物。最終,這場被稱為“谷歌圖書案”的訴訟以原告失利告終,聯邦法官於2013年裁定該掃描屬於“變革性使用”,並不構成侵權。

2024年的網絡環境與2004年完全不同,雖然自谷歌圖書案以來原告並未改變,但今天的被告則是新興的技術公司:人工智能公司。

2022年11月,OpenAI推出了ChatGPT,這是一款免費的“生成性人工智能”工具,能用人類語言回答問題。隨之而來,谷歌、蘋果、Meta(Facebook)和亞馬遜等公司也加快了競爭性AI程序的開發。OpenAI的首席執行官山姆·奧特曼在推特上預測:“與電腦對話將會成為一件大事。”

可以預見的是,書籍、藝術作品和音樂的版權持有者將會指控OpenAI侵犯版權。事實上,許多受害創作者已經排隊尋求法律支持。作家公會已經提起集體訴訟。當前最著名的案件是《紐約時報》於2023年12月對OpenAI提起的訴訟。

大型語言模型(LLM)如ChatGPT在“訓練”過程中,會基於大量現有作品所轉換的數據來“學習”創造圖像和文本。訴訟聲稱,這些聊天機器人、機器人和學習機器的教育來源於商業創作的作品,卻未經許可或補償。

在大型語言模型的背景下,“大型”二字真是恰如其分。BBC報導指出,ChatGPT的訓練數據來源達570GB,約3000億個單詞。除了書籍、期刊和報紙,AI數據庫還來源於大量的數字化圖書館和博物館收藏、公共文件(如法庭訴訟和立法),以及維基百科條目和社交媒體帖子。

然而,擁有深厚類比根基的傳媒集團數量卻在不斷減少。當今主導的媒體參與者,實際上是所有人:你我皆是所謂的用戶生成內容(UGC)的創作者。大型語言模型對個別用戶數據的消耗意味著,實際上我們每個人都成為了這些模型的利益相關者。在新的媒體生態系統中,AI與UGC之間存在著一種共生的信息與轉化循環(不幸的是,錯誤信息和假消息也在這一合成中佔有一席之地)。

與此同時,版權自動歸屬於每一個“固定”作品,無論是用智能手機拍攝的照片還是在TikTok上發布的舞蹈。如今,每天創作的這類作品數以十億計,這些“知識產權”技術上由個人或組織擁有。

隨著大型語言模型的出現,是時候考慮將版權視為一種公共財。作為公共財的版權,任何用於訓練AI解決方案的作品使用補償,不僅應該流向以盈利為目的的企業,也應該流向公眾。

就像歷史遺跡一樣,TikTok舞蹈和Instagram帖子構成了2024年社區或國家的文化資本,為其提供靈感。社交媒體產出的價值如同自然資源,應該以總體來看待。

在新西蘭,政府、博物館和創意產業的代表已承認在任何AI系統中使用毛利人的寶藏(taonga)時,必須尊重其文化,並考慮這種使用對毛利文化(tikanga)的影響。在意大利,文化遺產法要求對國家珍寶(包括達芬奇的藝術作品)的數字使用進行授權和支付。更多的政府,包括美國國會,應該迅速行動,主張對共同創作表達的國家利益。OpenAI與Meta、蘋果、谷歌、亞馬遜等有望受益的企業,必須認識到對於其AI產品所依賴的數據,對人民所欠的債務。

收集的費用不必對開發者造成負擔,且這些費用可能會非常有用。或許其中一部分可以用來支持公共數字素養和網上公民對話的教育。

克里斯多夫·肯尼利是出版行業分析師和市場顧問。這篇文章的版本早前已在2024年法蘭克福數字補充報告中發表。

在這篇文章中,肯尼利提出了一個至關重要的觀點:隨著人工智能技術的快速發展,我們的法律體系必須相應地進行調整。特別是隨著數字內容創作的普及,版權問題變得更加複雜且亟需解決。這不僅僅是法律問題,更是對文化創作未來的深刻思考。

在當今的數字時代,個體創作者的聲音與大型企業的利益之間的平衡變得愈發重要。社交媒體的興起使得每個人都能成為創作者,但同時也帶來了版權的模糊性。因此,建立一個公平的版權體系,以確保所有創作者的權益,並合理地分配AI訓練所需的數據資源,是未來法律改革的重點。

此外,文章也提到了一些國家在這方面的先行做法,這表明了全球對於如何處理這一問題的不同看法和策略。這對於香港的創意產業來說,也是一個值得借鑒的方向,特別是在多元文化的背景下,如何保護原創作品同時促進創新,將是未來發展的關鍵。

以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。

Chat Icon