新安全協議保護雲端計算過程中的數據免受攻擊
強調利用光的量子特性來保證安全,同時保持深度學習模型的準確性。
亞當·澤維 | MIT新聞
出版日期:2024年9月26日
MIT的研究人員開發了一種安全協議,利用光的量子特性來保證在深度學習計算過程中發送到和從雲服務器發送的數據的安全性。
深度學習模型被應用於許多領域,從醫療診斷到金融預測。然而,這些模型的計算量非常大,需要使用強大的雲端服務器。
這種對雲計算的依賴帶來了顯著的安全風險,特別是在醫療領域,醫院可能因隱私問題而不願使用AI工具來分析機密的患者數據。
為了解決這個緊迫的問題,MIT的研究人員開發了一種安全協議,利用光的量子特性來保證在深度學習計算過程中發送到和從雲服務器發送的數據的安全性。
通過將數據編碼到光纖通信系統中使用的激光光中,該協議利用了量子力學的基本原理,使攻擊者無法在不被發現的情況下複製或攔截信息。
此外,這種技術在保證安全性的同時不會影響深度學習模型的準確性。在測試中,研究人員證明他們的協議可以在保持96%準確率的同時,確保強大的安全措施。
“像GPT-4這樣的深度學習模型具有前所未有的能力,但需要大量的計算資源。我們的協議使用戶能夠在不妥協數據隱私或模型專有性質的情況下利用這些強大的模型,”MIT電子研究實驗室的博士後研究員兼該安全協議論文的主要作者Kfir Sulimany說。
Sulimany和共同作者Sri Krishna Vadlamani(MIT博士後)、Ryan Hamerly(前博士後,現任NTT研究公司)、Prahlad Iyengar(電氣工程和計算機科學研究生)和高級作者Dirk Englund教授(電氣工程和計算機科學教授、量子光子學和人工智能小組及電子研究實驗室的主要研究員)共同撰寫了這篇論文。這項研究最近在量子加密年會上展示。
深度學習中安全的雙向保護
研究人員關注的雲端計算場景涉及兩方——擁有機密數據(如醫療圖像)的客戶端和控制深度學習模型的中央服務器。
客戶端希望使用深度學習模型進行預測,例如根據醫療圖像判斷患者是否患有癌症,而不透露患者的信息。
在這種情況下,必須發送敏感數據以生成預測。然而,在此過程中,患者數據必須保持安全。
同時,服務器不想透露任何公司(如OpenAI)花費多年和數百萬美元構建的專有模型的部分。
“雙方都有想要隱藏的東西,”Vadlamani補充道。
在數字計算中,惡意行為者可以輕易複製從服務器或客戶端發送的數據。
另一方面,量子信息無法被完美複製。研究人員在他們的安全協議中利用了這一特性,稱為無克隆定理。
對於研究人員的協議,服務器使用激光光將深度神經網絡的權重編碼到光學場中。
神經網絡是一種深度學習模型,由互聯節點或神經元層組成,對數據進行計算。權重是模型的組成部分,對每個輸入進行數學運算,一次一層。一層的輸出會被餵入下一層,直到最終層生成預測。
服務器將網絡的權重傳輸到客戶端,客戶端根據其私有數據實施操作以獲得結果。數據仍然對服務器保持隱蔽。
同時,安全協議允許客戶端僅測量一個結果,並且由於光的量子性質,防止客戶端複製權重。
一旦客戶端將第一個結果餵入下一層,協議設計為取消第一層,這樣客戶端無法了解模型的其他信息。
“客戶端不是測量來自服務器的所有光,而是僅測量運行深度神經網絡並將結果餵入下一層所需的光。然後,客戶端將剩餘的光返回給服務器進行安全檢查,”Sulimany解釋道。
由於無克隆定理,客戶端在測量其結果時不可避免地會對模型應用微小的誤差。當服務器收到來自客戶端的剩餘光時,服務器可以測量這些誤差以確定是否有信息洩漏。重要的是,這些剩餘的光被證明不會透露客戶端數據。
實際的協議
現代電信設備通常依賴光纖傳輸信息,因為需要支持大帶寬和長距離。由於這些設備已經包含光學激光器,研究人員可以在不需要特殊硬件的情況下將數據編碼到光中以進行他們的安全協議。
當他們測試他們的方法時,研究人員發現它可以在保證服務器和客戶端安全的同時,使深度神經網絡達到96%的準確率。
當客戶端執行操作時,洩漏的模型信息少於對手恢復任何隱藏信息所需的10%。反過來說,惡意服務器只能獲得偷取客戶端數據所需信息的1%左右。
“你可以保證它在雙向都是安全的——從客戶端到服務器,從服務器到客戶端,”Sulimany說。
“幾年前,當我們在MIT主校區和MIT林肯實驗室之間開發分佈式機器學習推理的演示時,我意識到我們可以做一些全新的事情來提供物理層安全,基於多年來在該測試平台上展示的量子加密工作,”Englund說。“然而,要實現具有隱私保證的分佈式機器學習的前景,需要克服許多深層的理論挑戰。直到Kfir加入我們的團隊,這才成為可能,因為Kfir獨特地理解了開發這項工作的統一框架所需的實驗和理論組件。”
未來,研究人員希望研究這一協議如何應用於稱為聯邦學習的技術,該技術允許多方使用其數據來訓練中央深度學習模型。它還可以應用於量子操作,而不是他們為這項工作研究的經典操作,這可能在準確性和安全性方面提供優勢。
“這項工作巧妙且有趣地結合了通常不相交的領域的技術,特別是深度學習和量子密鑰分發。通過使用後者的方法,它為前者增加了一個安全層,同時還允許看起來現實的實施。這在分佈式架構中保存隱私方面可能很有趣。我期待看到該協議在實驗缺陷下的表現及其實際實現,”巴黎索邦大學CNRS研究主任Eleni Diamanti說,他沒有參與這項工作。
這項工作部分由以色列高等教育委員會和Zuckerman STEM領導力計劃支持。
**編輯評論:**
這篇文章展示了MIT研究人員如何利用量子技術來解決雲計算中的數據安全問題,尤其是在深度學習應用中。這種創新的協議不僅確保數據的隱私,還維持了模型的高準確性,這無疑是技術和安全領域的一大進步。作為編輯,我認為這項研究為解決現代數據隱私問題提供了新的思路,特別是在涉及敏感信息的醫療和金融領域。這也引發了一個重要的討論,即在追求技術進步的同時,我們如何平衡數據隱私和計算性能。未來,這類技術的實際應用和在不同場景中的表現將是值得關注的焦點。
以上文章由特價GPT API KEY所產生