DeepSeek AI模型收集大量用戶數據,並存儲於中國伺服器
DeepSeek最新推出的R1大型語言模型(LLM)已經因其發布導致AI股票大跌而聞名,而其隱私政策的披露可能會引起更多關注——該公司從在線用戶那裡收集大量數據,包括按鍵記錄、密碼以及用戶在查詢中輸入的數據(如圖片和文本),並將這些數據存儲在中國的伺服器上。
根據DeepSeek的說法,個人信息如出生日期、電子郵件地址、電話號碼和密碼等都是可以收集的。用戶提供給R1 LLM的任何內容,從文本和音頻提示到上傳的文件,都可能被DeepSeek收集。而每當有人聯繫DeepSeek時,該公司表示可能會保存用戶的身份證明,這顯然包括駕駛執照等文件。
不僅如此,DeepSeek還記錄與用戶硬件相關的任何信息:IP地址、手機型號、語言等等。該公司的數據收集工作如此徹底,以至於他們甚至記錄“按鍵模式或節奏”。傳統的用戶追蹤方法——Cookies,亦會促進用戶數據的收集。
由於R1是“開源”的,它可以在任何硬件上運行,這通常對隱私有利——如果在自己的硬件上本地運行該模型,則應不會導致數據收集。然而,DeepSeek通過其網站和移動應用提供R1的在線訪問,這意味著該AI公司處理並儲存在線用戶的數據。值得慶幸的是,DeepSeek對於其從在線用戶收集的數據、存儲位置以及用途非常透明,並在其隱私政策網頁上詳細列出,幾乎沒有什麼是該公司不會收集的。
儘管對於擁有大量用戶數據的公司來說,將這些數據出售給廣告公司等感興趣的企業是常見做法,DeepSeek也表示可能會這樣做,但他們亦承認“廣告商、測量和其他合作夥伴會與我們分享有關你的信息以及你在服務之外的行為,例如你在其他網站和應用上的活動或在商店中的購買產品或服務。”擁有這麼多信息,DeepSeek似乎有能力對其用戶有深入的了解。
DeepSeek的“企業集團”也可以訪問其收集的數據,以提供“某些功能,例如存儲、內容交付、安全性、研究與開發、分析、客戶和技術支持以及內容管理”。
至於所有這些信息的存儲地,隱私政策表示所有數據均存放在中國的伺服器上,這一點可能引發嚴重爭議。美國政府對於個人信息被中國政府掌握的擔憂是拜登政府試圖禁用TikTok的一個關鍵因素,這使得DeepSeek可能也面臨類似的審查。
當然,前總統拜登在任期最後幾天曾試圖推翻TikTok禁令,而特朗普總統在第二次上任後不久便延遲了該應用的命運。因此,DeepSeek在適當的情況下也可能會被寬容對待。
另一方面,特朗普的盟友包括Meta的馬克·祖克伯格和OpenAI的山姆·奧特曼,他們可能對R1 LLM在其模型上表現出色感到不快。此外,DeepSeek導致許多美國科技公司的股價大幅下跌,這也讓人很難想像DeepSeek在共和黨總統心目中留下了良好的印象。
由中國AI公司DeepSeek開發的R1是一個開源的LLM,具有尖端性能,且所需計算能力僅為一般的十分之一。該模型擁有6710億個參數,是目前最重要的AI模型之一,訓練僅需280萬GPU小時,而Meta的Llama 3則需要3080萬GPU小時,約是其11倍。
DeepSeek在一個多月前就已經炫耀了這些成就,但R1於1月20日發布,股市直到昨日才完全意識到其影響。市場反應是拋售包括Nvidia在內的AI公司股票。雖然DeepSeek的關注度上升,但許多人也開始檢視其如何處理用戶隱私,這對於任何涉及AI和中國開發的軟件來說都是一個特別棘手的問題。
—
這篇文章揭示了DeepSeek在數據收集方面的透明度,卻同時引發了關於用戶隱私的重大擔憂。特別是在當前全球對數據安全和隱私的高度關注下,DeepSeek的行為可能會引起更多關注和討論。企業有責任保護用戶的數據,而不僅僅是滿足商業需求。這也引發了人們對於開源技術的思考:開源並不意味著安全,特別是當背後的數據存儲和處理涉及敏感的國際政治問題時。此案例提醒用戶在使用任何AI工具時,必須更加謹慎,並考慮其潛在的風險。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。