《黑道家族》和《絕命毒師》在超過139,000部電影和電視劇劇本中被用來訓練AI
由於作家罷工而使好萊塢停擺了一整個夏天,這場運動的要求最終似乎並未如作家們所期待的那樣得到滿足。作家兼程式設計師亞歷克斯·瑞斯納(Alex Reisner)在聽到一位編劇提到一些劇本與經典電影《教父》相似後,開始深入研究用來訓練AI的龐大數據集。瑞斯納在《大西洋月刊》的文章中揭露,這個AI訓練數據集包含了超過53,000部電影劇本和85,000集電視節目劇本,包括《辛普森一家》、《雙峰》、《黑道家族》和《絕命毒師》的劇本。
瑞斯納報告指出,這個數據集被蘋果、Anthropic、Meta、Nvidia、Salesforce、彭博社等公司使用,涵蓋了1950年至2016年所有最佳影片提名的電影劇本。不僅包括《警察故事》的每一集劇本,還包含了像金球獎和奧斯卡頒獎典禮的預錄對話。AI機器對任何東西都沒有安全感。
在瑞斯納引起公眾對用於訓練大型語言模型(LLMs)的無數寫作作品的關注後,作家和媒體愛好者們都感到憤怒。有些粉絲和編劇開始深入調查這些LLMs的資料來源,結果發現其實非常龐大。
作家們對AI竊取他們的作品感到憤怒
儘管用於生成電影圖像的AI對大多數觀眾來說仍然是冒犯,但這與直接使用作家劇本來訓練AI寫作的行為相比,顯得微不足道。亞歷克斯·瑞斯納甚至創建了一個數據庫搜索引擎,讓《大西洋月刊》的訂閱者可以自行探索。那些進行查詢的人發現,沒有人能逃過AI數據庫的範圍。
許多作家對於自己過去的作品被用來訓練可能會取代他們的技術感到震驚和厭惡。《少年泰坦》的編劇大衛·斯拉克(David Slack)告訴《The Ankler》,他發現自己的42部劇本被納入數據庫,包括《關鍵時刻》、《謊言的謊言》和《不明真相》等作品。
「我非常生氣,完全無法忍受。這太噁心了。這是我大量的心血……這些是我全心全意投入的作品。」- 大衛·斯拉克通過《The Ankler》表示。
作家們每天在娛樂產業中遭受虐待,對於他們所發表的作品幾乎沒有任何版稅可言。而現在,他們甚至在某種程度上被無視到了極點。這次LLM訓練的重大越界行為,作家和觀眾都不會輕易忘記。顯然,尚有很多工作需要完成,以確保這個行業的未來不會受到AI興起的威脅。
這個數據庫搜索工具可以在這裡找到。你很可能會在裡面找到你最喜愛的媒體作品。
—
在這篇文章中,我們看到了AI如何在不經意間侵犯了創作者的權益,這引發了廣泛的憤怒和討論。作為讀者,我們不禁要思考,這樣的技術發展是否真的能改善創作過程,還是會對創作者造成更大的威脅?在追求創新和效率的同時,娛樂產業是否應該更加重視作家的創作權益?未來的方向必須在技術進步與人類創意之間找到一個平衡點,否則我們可能會目睹一個充滿無法替代的創意作品的世界,卻失去了真正的創作者。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。