中國如何在美國晶片限制下推進人工智能
2017年,北京公布了一個雄心勃勃的藍圖,計劃在2030年前主導人工智能的發展。到2020年,這個計劃要求在人工智能領域取得“標誌性進展”以展示其進步。然而,2022年底,OpenAI推出的ChatGPT讓全世界驚訝不已,卻也讓中國措手不及。
當時,領先的中國科技公司仍在經歷為期18個月的政府打壓,這場打壓導致中國科技行業損失約1萬億美元。直到快一年後,才有幾個中國AI聊天機器人獲得政府批准公開發布。有些人質疑中國的審查制度會否影響該國的人工智能雄心。與此同時,拜登政府在ChatGPT推出前一個月公佈的出口管制措施,旨在切斷中國獲取訓練大型AI模型所需的先進半導體的渠道。沒有尖端晶片,北京2030年實現人工智能霸權的目標似乎變得愈加遙不可及。
不過,快轉至今天,一系列令人印象深刻的中國產品發布表明,美國在人工智能領域的領先地位正在縮小。11月,阿里巴巴和中國AI開發公司DeepSeek推出了推理模型,在某些指標上可與OpenAI的o1-preview相媲美。同月,中國遊戲巨頭騰訊推出了Hunyuan-Large,一個開源模型,該公司的測試結果顯示在多項基準測試中超越了美國開發的頂級開源模型。隨著2024年最後幾天的到來,DeepSeek發布的DeepSeek-v3在一個受歡迎的在線排行榜上名列第一,並在表現上與OpenAI和Anthropic的頂級封閉系統不相上下。
在DeepSeek-v3發布之前,這一趨勢已經引起了谷歌前首席執行官埃里克·施密特的注意。2024年5月,施密特自信地表示,美國在人工智能領域仍保持著兩到三年的領先,“這在我看來是永恆的”。然而到了11月,在哈佛甘迺迪政府學院的一次演講中,施密特的調子發生了變化。他引用了阿里巴巴和騰訊的進展作為中國縮小差距的證據。他表示:“這讓我感到震驚,我原以為我們對晶片的限制會讓他們滯後。”
人工智能的全球影響
在國家榮譽的背後,誰主導人工智能將對全球權力平衡產生深遠影響。如果人工智能代理能夠自動化大量勞動力,這可能會為各國經濟帶來提升。未來的系統,能夠指揮武器或駭客對手,可能會提供決定性的軍事優勢。隨著各國在兩個超級大國之間被迫選擇中國或美國的AI系統,人工智能可能成為全球影響力的強大工具。中國的快速進步讓人質疑美國對半導體的出口管制是否足以維持其優勢。
建立更強大的人工智能依賴於三個基本要素:數據、創新算法和原始計算能力。大型語言模型(如GPT-4o)的訓練數據通常來自互聯網,這意味著世界各地的開發者都能夠獲取。同樣,算法或改進AI系統的新思路也能輕易跨越國界,因為新技術通常在學術論文中分享。即使不這樣,中國擁有豐富的人工智能人才,產出的頂尖AI研究人員數量超過美國。相比之下,先進晶片的製造則非常困難,與算法或數據不同,它們是一種物理商品,可以在邊界受到限制。
先進半導體的供應鏈由美國及其盟友主導。美國公司Nvidia和AMD在用於人工智能的數據中心GPU市場上形成了有效的雙頭壟斷。它們的設計複雜,晶體管尺寸以單位納米計算,目前只有台灣公司TSMC能夠生產這些頂尖晶片。為此,TSMC依賴於只有荷蘭公司ASML能夠製造的數百萬美元的機器。
美國試圖利用這一點來獲取優勢。2022年,拜登政府推出了出口管制,禁止向中國出售尖端晶片。這一舉措是在特朗普政府第一任期內開始的一系列措施的延續,旨在限制中國獲取晶片製造技術。這些努力不僅限制了先進晶片流入中國,還阻礙了該國的國內晶片產業。美國商務部長吉娜·雷蒙多在4月的《60分鐘》節目中表示,中國的晶片落後於美國“數年”。
然而,2022年的出口管制在公佈前就遇到了首個障礙,因為中國的開發者據報導已經囤積了即將被限制的晶片。DeepSeek這家中國開發商組建了一個集群,擁有10,000個即將禁止的Nvidia A100 GPU,這是在出口管制措施出台前一年完成的。
走私也可能削弱了出口管制的有效性。10月,路透社報導說,在中國公司華為的一個產品上發現了受限的TSMC晶片。據報導,中國公司還通過在中國以外的空殼公司獲得受限晶片。其他公司則通過租用海外雲服務提供商的GPU訪問來繞過出口管制。12月,《華爾街日報》報導,美國正準備採取新措施,限制中國通過其他國家獲取晶片的能力。
未來的挑戰與機遇
儘管美國的出口管制限制了中國對最尖端半導體的獲取,但仍然允許出售較低性能的晶片。決定哪些晶片可以或不可以出售的過程證明是具有挑戰性的。2022年,Nvidia調整了其旗艦晶片的設計,為中國市場創造了一個符合限制標準的版本。該晶片仍然對人工智能的發展有用,這促使美國在2023年10月加強了限制。“我們有一年時間讓中國幾乎可以購買同樣好的晶片,”RAND公司技術與安全政策中心的AI和計算負責人倫納特·海姆表示。他說,這一漏洞,加上新晶片進入AI開發者基礎設施所需的時間,是我們尚未看到出口管制對中國人工智能發展產生全面影響的原因。
目前尚不清楚目前的限制是否達到了正確的平衡。11月,騰訊發布了一個名為Hunyuan-Large的語言模型,在多個基準測試中超越了Meta的最強版本Llama 3.1。雖然基準測試並不是比較AI模型整體智能的完美指標,但據伯克利風險與安全實驗室的研究,Hunyuan-Large的表現令人印象深刻,因為它使用的是性能較低且不受限制的Nvidia H20 GPU進行訓練。“他們顯然在硬件的使用上做得更好,因為他們有更好的軟件,”該研究的作者、同時也是國防部國防創新單位顧問的瑞特維克·古普塔說。被認為是目前最強開源模型的DeepSeek-v3也使用了相對較少的計算資源進行訓練。儘管對當選總統特朗普的人工智能政策將如何影響未來存在重大不確定性,但幾位專家在11月告訴《時代》雜誌,他們預計出口管制將持續下去,甚至會擴大。
在12月新限制出台之前,中國公司再次囤積了即將被封鎖的晶片。“這整個策略需要重新考慮,”古普塔表示。“不要再對這些硬件晶片玩打地鼠遊戲。”他建議,美國應該集中精力防止軍事人工智能系統的發展,而不是通過限制晶片的獲取來延緩大型語言模型的發展,因為這些系統通常需要的計算能力較少。儘管他承認,對晶片供應鏈其他部分(如ASML生產晶片所需的機器)的限制在減緩中國國內晶片產業方面發揮了關鍵作用。
海姆表示,在過去一年中,美國的領先地位已經縮小,儘管他指出,儘管中國現在可能與美國的最佳開源模型相匹配,但這些模型仍然落後於頂級封閉模型約一年。他補充道,縮小差距並不一定意味著出口管制失敗。“讓我們擺脫出口管制有效或無效的二元觀念,”他表示,並補充說,中國可能需要更長的時間才能感受到這些影響。
過去十年,訓練人工智能模型所需的計算能力驟增。例如,2023年發布的OpenAI的GPT-4估計使用了約10,000倍於2019年發布的GPT-2的計算能力。有跡象表明,這一趨勢將繼續下去,因為美國公司如X和亞馬遜正在建造擁有數十萬GPU的大型超級計算機,遠超當今領先人工智能模型所需的計算能力。如果這一趨勢持續,海姆預測,美國的晶片出口限制將阻礙中國在人工智能發展上保持步伐。“出口管制主要影響的是數量,”海姆說,並補充說,即使一些受限晶片進入中國開發者手中,通過減少數量,出口管制使得大規模訓練和部署模型變得更加困難。“我確實預計隨著時間的推移,出口管制會越來越嚴厲,只要計算能力仍然重要,”他說。
在華盛頓,“目前對於將中國帶到談判桌上存在猶豫,”卡內基國際和平基金會技術與國際事務項目的訪問學者斯科特·辛格表示。隱含的理由是:“如果美國處於領先地位,為什麼我們要分享任何東西?”
但他指出,與中國在人工智能方面進行談判有令人信服的理由。“中國不必領先就能成為災難性風險的來源,”他說,並補充道,儘管受到計算限制,中國仍在不斷進步,這意味著它有一天可能會生產出具有危險能力的人工智能。“如果中國的距離更近,考慮一下你想要與他們進行哪些類型的對話,以確保雙方的系統保持安全,”辛格說。
在這篇文章中,我們可以看到中國在人工智能領域迅速崛起的原因,以及美國的出口管制是否能夠有效阻止中國的進步。隨著技術的迅速發展,國際間的競爭只會愈演愈烈,未來的全球科技格局將如何變化,值得我們深思。中國的進步不僅是對美國技術壟斷的挑戰,也可能對全球安全構成新的風險。這提醒我們,在應對科技競爭的同時,國際合作和對話的重要性。
以上文章由特價GPT API KEY所翻譯及撰寫。而圖片則由FLUX根據內容自動生成。