快科技8月10日消息,美國前腳剛允許NVIDIA對華出售H20,後腳國家網信辦就H20算力晶片漏洞後門安全風險約談NVIDIA公司。
雖然NVIDIA在自辯聲明中提到,「網絡安全對我們至關重要。NVIDIA的晶片不存在『後門』,並不會讓任何人有遠程訪問或控制這些晶片的途徑。」
但人民日報發文表示,回應歸回應,對於H20晶片存在的「追蹤定位」和「遠程關閉」風險質疑,企業唯有按照約談要求,拿出令人信服的安全證明,才能消除中國用戶的後顧之憂,重新贏得市場信任。
今天,中央廣播電視總台旗下的新媒體「玉淵譚天」獨家發文,首次曝光了美國如何給晶片安「後門」。
先從基本的邏輯說起。
今年5月,美國眾議員比爾·福斯特(Bill Foster)牽頭提出一項法案,要求美國商務部強制美國晶片企業在受出口管制的晶片中加入「後門」。
比爾·福斯特是物理學博士,曾經有過晶片設計的工作經驗,所以他十分篤定地說,相關的技術十分成熟,完全可以實現。
比爾·福斯特想要實現的,總結起來就是兩件事,一個是「追蹤定位」,一個是「遠程關閉」。
玉淵譚天從專業人士處了解到,比爾·福斯特的判斷是準確的,這兩項功能,從技術上完全可以實現。
「後門」主要分為兩種,硬體「後門」和軟體「後門」。
硬體「後門」是晶片在設計或製造時留下的物理裝置,主要是具有「後門」功能的邏輯電路。
軟體「後門」可以理解為在軟體中植入具有「後門」功能的指令,通過運行軟體來對用戶的系統造成破壞、竊取機密等。
拿英偉達H20晶片舉例。
單從硬體「後門」角度考慮,就完全可以實現「遠程關閉」等功能。
H20晶片上有多個組件,包括:GPU核心、電源管理模塊等。只要在H20晶片的電源管理模塊中植入「遠程關閉」電路,設定相應的觸發機制,就能在不依靠外部條件的情況下實現這一功能。當晶片滿足以下條件:
激活時間達到提前設定的指標;
溫度、電壓等物理條件符合提前設定的指標。
H20晶片的電源管理模塊就可以執行相應操作,包括:直接切斷晶片核心電源;將電壓調整到不穩定區域,導致晶片功能異常等。比如,最簡單直接的操作就是,賣給中國的晶片可以定時,設置用滿500個小時就自動關閉。
這樣一來,晶片直接無法使用,毫不誇張地說,所有的投入都相當於打水漂了。
另一種實現「遠程關閉」的硬體「後門」,是修改H20晶片的固件引導程序。當晶片啟動時,引導程序會檢查特定條件(如地理位置信息、授權狀態等),如果條件不滿足,就可以拒絕晶片啟動、啟動時禁用部分高級功能或限制晶片性能等。目前H20幾乎是專供中國的,如果晶片裡設置了「後門」,那麼「後門」的功能就具有高度的定向性,一旦啟動基本不會有「誤傷」。
奇安信威脅情報中心安全專家告訴玉淵譚天,從技術層面上來說,在生產階段,特定拒絕服務功能的硬體「後門」較好實現,但其實,這種方式的成本和代價都相對較高,通過軟體設置或者軟硬體配合的方式安「後門」,才是最靈活的。
而利用軟體激活「後門」,有一個很重要的抓手,就是CUDA。CUDA(Compute Unified Device Architecture,統一計算設備架構),它不是一個產品,而是一種生態系統。
全球有超過400萬開發者在使用CUDA,它覆蓋了全球90%的人工智慧研究機構。過去近20年間,它形成了一種正向循環:
越多開發者使用CUDA,就會催生出越多基於CUDA的應用程序,這些程序又吸引更多開發者和用戶加入CUDA。
也就是說,當你想使用CUDA的最新功能,就需要把更新的軟體導進系統里。在這個更新驅動程序的環節中,晶片所在的系統,就有可能被加入激活「後門」的指令,這個安「後門」的方式可以實現很多功能。
如果網際網路連接存在,通過動態地接收數據解密執行,就能實現「追蹤定位」功能,甚至更常規的文件收集、擊鍵記錄、螢幕截取等「後門」功能也可以實現。也就是說,軟硬體「後門」配合下,信息泄露輕而易舉。
奇安信威脅情報中心安全專家告訴譚主,美國塑造人工智慧霸權的抓手,一個是硬體,一個是軟體生態系統。對於其他國家來說,不僅要從硬體層面努力做到替代,也要建設起自主可控的軟體生態系統。
為了完成上述的這些布置,美方曾經系統設計過一個機制——片上治理機制。這個機制就提到,美國政府需要成立相關的部門,來協調晶片設計、生產、製造的各個環節,包括協調企業和盟友,來達到對人工智慧晶片的控制。
片上治理機制,能實現以下幾種功能:
一是許可鎖定。若發現違規情況,廠商將立即停止簽發新的許可證,晶片則因無法更新而失效。
二是追蹤定位。目標晶片與多個地標服務器交互的響應速度,可以反映其大致位置。晶片本身能實現主動查詢,只限制在特定地理區域運行。
三是使用監測。內置硬體能夠記錄晶片狀態、訓練任務、計算量等關鍵信息,要求用戶驗證晶片使用方式,確保開發符合美國的監管要求。
四是使用限制。片上治理機制限制晶片在大型集群計算機和超級計算機中的使用,保護敏感數據訪問,並只允許晶片運行經過批准的代碼或模型。
在一份詳細介紹「片上治理機制」的報告中提到,NVIDIA的人工智慧晶片其實已經廣泛部署了片上治理所需的大部分功能,只不過有些還沒有激活而已。
新美國安全中心報告《安全、可管控的晶片——使用片上治理機制來管理人工智慧和高級計算的國家安全風險》,報告中提到,片上治理所需的許多功能已在各類晶片上廣泛部署,包括尖端的人工智慧晶片。AMD、蘋果、英特爾和英偉達等領先企業銷售的晶片就具備上述諸多政策所需的功能。
而如果晶片上還沒有這些功能,報告也特別提到,美國及其盟友掌握著最先進人工智慧晶片的產業鏈,因此,美國只需要「協調」好這些盟友,確保這些晶片都內置硬體,還是可以實現控制。
為了獲得晶片企業的配合,報告還建議,採取一些「激勵」措施,比如「預先市場承諾」——如果企業配合,滿足美國政府設置「後門」的要求,那美國政府可以將其排除在出口管制之外。其中就特別提到,放寬對「中國低風險客戶」的出口。
結合這條信息,再看美國政府允許英偉達出口H20到中國,不免有些細思極恐。
無論從哪個角度講,H20對於中國來說,都算不上是一款安全的晶片。
最後,玉淵譚天還表示,除了不安全,H20也不先進。
根據相關機構數據,相比於H20的標準版——H100,H20的整體算力只有約20%,其GPU核心的數量比H100減少41%,性能降低28%,這也導致H20無法滿足萬億級大模型訓練需求。
除了不先進,H20也不環保。
去年7月,國家發展改革委聯合有關部門印發了一個名叫《數據中心綠色低碳發展專項行動計劃》的文件。《行動計劃》中提到,到2030年底,全國數據中心平均電能利用效率、單位算力能效和碳效達到國際先進水平。
一般來說,對於採用14nm以下工藝的服務器GPU,節能水平的能效比需達到0.5TFLOPS/W,先進水平需達到1.0TFLOPS/W。
根據相關機構測算,H20的能效比大約為0.37TFLOPS/W,不滿足0.5TFLOPS/W的節能水平。
我們都知道,算力某種程度上也是電力,人工智慧的發展會新增大量的能源需求。而這些新增的需求,也需要符合中國綠色轉型的節奏。
從這個角度來講,H20,當然不是一個好選擇。
當一款晶片,既不環保,也不先進,更不安全時,作為消費者,我們當然可以選擇,不買。