歐盟AI法規:科技巨頭的合規挑戰

歐盟 AI 法規檢查工具揭示大科技公司合規難題

根據路透社獲得的數據,一些最具影響力的人工智能模型在歐洲法規的關鍵領域,如網絡安全韌性和歧視性輸出方面表現不佳。

歐盟在 OpenAI 於 2022 年底向公眾推出 ChatGPT 前,已長期討論新的 AI 法規。這款創紀錄受歡迎的模型及其引發的公眾辯論,促使立法者制定針對「通用人工智能」(GPAI)的具體規則。

現在,由瑞士初創公司 LatticeFlow 及其合作夥伴設計、並獲得歐盟官員支持的新工具,已根據即將在未來兩年內分階段生效的廣泛 AI 法案,對 Meta(NASDAQ:META)和 OpenAI 等大科技公司開發的生成式 AI 模型進行了多個類別的測試。

LatticeFlow 於週三發布的排行榜顯示,由阿里巴巴(NYSE:BABA)、Anthropic、OpenAI、Meta 和 Mistral 開發的模型平均得分均在 0.75 以上。

然而,該公司的「大型語言模型(LLM)檢查工具」揭示了一些模型在關鍵領域的缺陷,突顯出公司可能需要分配資源以確保合規。

未能遵守 AI 法案的公司將面臨 3500 萬歐元(3800 萬美元)或全球年營收 7% 的罰款。

混合結果

目前,歐盟仍在試圖確立如何執行 AI 法案中針對生成式 AI 工具(如 ChatGPT)的規則,並計劃在 2025 年春季召集專家制定一套技術守則。

但由 LatticeFlow 與瑞士蘇黎世聯邦理工學院(ETH Zurich)和保加利亞研究所 INSAIT 合作開發的測試,提供了科技公司可能在法律方面存在不足的早期指標。

例如,歧視性輸出一直是生成式 AI 模型開發中的持續問題,反映了人類在性別、種族等方面的偏見。

在測試歧視性輸出時,LatticeFlow 的 LLM 檢查工具給予 OpenAI 的「GPT-3.5 Turbo」相對較低的 0.46 分。同一類別中,阿里巴巴雲的「Qwen1.5 72B Chat」模型僅獲得 0.37 分。

在測試一種名為「提示劫持」的網絡攻擊時,LLM 檢查工具給予 Meta 的「Llama 2 13B Chat」模型 0.42 分。在同一類別中,法國初創公司 Mistral 的「8x7B Instruct」模型獲得 0.38 分。

由 Google 支持的 Anthropic 開發的「Claude 3 Opus」模型獲得了最高的平均分數 0.89。

該測試是根據 AI 法案的文本設計的,並將隨著進一步的執法措施的引入而擴展。LatticeFlow 表示,LLM 檢查工具將免費提供給開發者在線測試其模型的合規性。

該公司的首席執行官兼聯合創始人 Petar Tsankov 告訴路透社,測試結果總體上是積極的,並為公司提供了一條路線圖,以便他們根據 AI 法案微調其模型。

「歐盟仍在制定所有的合規基準,但我們已經可以看到一些模型的差距,」他說。「我們相信,隨著對合規優化的更多關注,模型提供者可以很好地準備好滿足監管要求。」

Meta 拒絕評論。阿里巴巴、Anthropic、Mistral 和 OpenAI 沒有立即回應評論請求。

儘管歐盟委員會無法驗證外部工具,但該機構在 LLM 檢查工具的開發過程中一直被告知,並將其描述為「將新法律付諸行動的第一步」。

歐盟委員會發言人表示:「委員會歡迎這項研究和 AI 模型評估平台,這是將歐盟 AI 法案轉化為技術要求的第一步。」

($1 = 0.9173 歐元)

評論

這篇文章揭示了歐盟在人工智能法規上的最新動態,特別是針對生成式 AI 模型的合規性測試。這不僅對科技公司提出了新的挑戰,也對整個行業的未來發展方向有著深遠的影響。從測試結果來看,一些知名公司的 AI 模型在關鍵領域仍然存在顯著的缺陷,這表明科技公司在開發 AI 技術時,除了追求性能外,還需要更加重視法規和道德標準。

對香港的科技和金融界來說,這無疑是一個重要的信號。隨著全球對 AI 技術的監管趨嚴,香港的公司如果想在國際市場上立足,必須提前做好準備,確保其技術和產品符合國際標準。此外,這也為本地初創公司提供了一個機會,通過開發合規性更強的技術來贏得市場優勢。

總的來說,這篇文章強調了合規性在未來技術發展中的重要性,並提醒我們在追求創新和技術突破的同時,不應忽視法規和道德的約束。這對於整個行業的健康發展至關重要。

以上文章由特價GPT API根據網上資料所翻譯及撰寫,過程中沒有任何人類參與 🙂

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *