【導(dǎo)讀】近日,AMD和英偉達接到消息,美國政府要求其對中國區(qū)斷供高端GPU。
8月31日晚,集微網(wǎng)突然發(fā)布消息稱,AMD和英偉達中國區(qū)已相繼接到總部通知,要對中國區(qū)客戶斷供用于人工智能和數(shù)據(jù)中心的頂級計算芯片。
AMD方面:
暫停對中國區(qū)所有MI100和MI200發(fā)貨;
統(tǒng)計中國區(qū)Ml100已發(fā)貨量;
統(tǒng)計中國區(qū)MI200已發(fā)貨客戶清單和發(fā)貨明細。
英偉達方面:
暫停對中國區(qū)所有客戶所有代理商的A100和H100的發(fā)貨,其它GPU卡不受影響;
各服務(wù)器OEM庫存的A100可以對各自的行業(yè)客戶繼續(xù)交付, 英偉達中國區(qū)目前沒有對OEM發(fā)任何Letter。
目前,英偉達H100在今年GTC大會上剛剛發(fā)布還未出貨。但已經(jīng)出貨2年的A100在最新MLPerf中,打破16項性能記錄領(lǐng)跑。
可見,僅英偉達這兩款高端GPU的斷供,直接打擊了智能計算以及AI大模型的訓(xùn)練。
截至發(fā)稿前,AMD和英偉達都未予置評。
美國再次加大力度!
遺憾的是,這個消息似乎并不是空穴來風(fēng)。
根據(jù)英偉達向美國證券交易委員會提交的一份文件,美國政府已于8月26日對英偉達下發(fā)了通知,對現(xiàn)有的A100和即將推出的H100提出了新的出口管制許可,并立即生效。
此外,DGX或任何其他采用A100或H100和A100X的系統(tǒng),以及未來任何能夠在峰值性能和I/O性能達到或高于A100的,都在新的許可證要求范圍之內(nèi)。
文件顯示,該禁令針對的地區(qū)為中國大陸、中國香港和俄羅斯。不過,英偉達在俄羅斯并沒有付費客戶。
英偉達表示,此舉可能會影響到H100的開發(fā),以及支持A100現(xiàn)有客戶的能力,并可能進一步要求公司將某些業(yè)務(wù)從中國轉(zhuǎn)移出去。
2022CTC大會H100發(fā)布
目前,英偉達正與美國政府接觸,試圖為公司的內(nèi)部開發(fā)和支持活動尋求豁免。
英偉達發(fā)言人也表示,「我們正在與中國客戶商討對策,以滿足他們計劃或未來購買替代產(chǎn)品的需求。如果客戶需要的替代產(chǎn)品不足,我們會為客戶尋求豁免或許可證,但不能保證美國政府會批準(zhǔn),或及時回應(yīng)。」
受該禁令的影響,英偉達股價開盤后下跌近6.6%。
在8月24日英偉達曾預(yù)計,第三財季銷售額約為59億美元,然而禁令一出,英偉達第三季度在中國的潛在銷售額可能會損失4億美元,如果客戶不想購買替(舊)代(的)產(chǎn)品,而美國政府不及時或拒絕向重要客戶發(fā)放許可證的話。
此外,據(jù)AMD的一位發(fā)言人稱,美國政府也已經(jīng)通知他們說要停止向中國出口頂級的人工智能芯片。
AMD表示,新的許可要求將阻止MI250芯片運往中國,但MI100芯片應(yīng)該不會受到影響。
AMD認為,新規(guī)并不會對其業(yè)務(wù)產(chǎn)生實質(zhì)性影響。但股價仍在開盤后下跌了。
對國內(nèi)影響有多大?
近年來,美國不僅針對中國不斷地加強芯片的出口限制,并且還試圖將制造業(yè)帶回本土。
拜登已經(jīng)正式簽署《芯片與科學(xué)法案》,美國商務(wù)部向中國斷供了可用于14nm以下先進制程芯片制造的設(shè)備,實施了對EDA軟件工具的出口管制,且美國正在促成與其他國家的結(jié)盟。
而美國此次對英偉達和AMD實施芯片的出口禁令,除了阻礙英偉達在中國高達4億美元的業(yè)務(wù)以外,還會影響國內(nèi)AI領(lǐng)域的研究。
不過目前來看,對消費電子領(lǐng)域的影響并不嚴(yán)重。除了這兩家的芯片,還有像高通、聯(lián)發(fā)科、三星等芯片可用。
智能計算
但是,大多數(shù)國內(nèi)服務(wù)器離不開這兩家都芯片。顯然,美國的這番斷供就是沖著算力去的,目的就是阻礙中國在人工智能領(lǐng)域領(lǐng)先世界。
建設(shè)強大的智算中心就需要高端GPU,如果沒有智算,智慧交通、智慧城市、工業(yè)互聯(lián)等眾多領(lǐng)域都會受到影響。
因此,芯片斷供將會直接影響國內(nèi)的云計算產(chǎn)業(yè)及人工智能產(chǎn)業(yè)的發(fā)展。
根據(jù)6月份最新全球超算TOP500榜單,排在前十的超算中基本上都用到了AMD、英偉達、英特爾的處理器或技術(shù)。
其中,中國神威·太湖之光超級計算機用的是我們自主研發(fā)的神威26010眾核處理器。天河二號超級計算機則是使用基于英特爾集成眾核架構(gòu)的Xeon Phi 31S1P協(xié)處理器。
因此,斷供AMD和英偉達對我國最有影響力的兩大超算并未造成影響。
然而,對于國內(nèi)提供服務(wù)器的企業(yè)來講,就不那么幸運了。服務(wù)器都是企業(yè)用得多,比如數(shù)據(jù)中心、云計算。
目前,國內(nèi)像阿里等公司都在開始自研云原生處理器,這是值得肯定的。
元宇宙
要知道,GPU是元宇宙核心計算資源的底座。未來,元宇宙市場規(guī)?;虺?700億美元。
元宇宙中有大量的程序需要計算,構(gòu)成元宇宙的虛擬內(nèi)容、區(qū)塊鏈網(wǎng)絡(luò)、人工智能技術(shù)都離不開算力的支撐。
沒有強大的算力支撐,元宇宙就如同空中樓閣。
因此,元宇宙中更加真實的建模與交互需要更強的算力作為前提,更加說明我們自研GPU的重要性。
AI大模型
另外,如果沒有英偉達和AMD等公司的芯片,國內(nèi)在圖像、語音識別以及其他機器學(xué)習(xí)方面的任務(wù)也將受到嚴(yán)重的影響。
2020年大火的GPT-3參數(shù)規(guī)模達到1750億,而且,其訓(xùn)練數(shù)據(jù)集規(guī)模也超過500GB。
訓(xùn)練這么大的AI模型,必然會吃很大的算力,僅GPT-3就消耗了10000塊GPU,花了30天才完成。
那么,斷供高端GPU將如何影響國內(nèi)AI模型的訓(xùn)練呢?
拿英偉達A100來舉例,它的深度學(xué)習(xí)性能在2021年的實測中可達V100的3.5倍。而在最新的AI芯片跑分大賽結(jié)果中,A100打破了16項性能紀(jì)錄。
相比于「只有」540億個晶體管的前輩A100,英偉達在H100中裝入了800億個晶體管,并采用了定制的臺積電4nm工藝。
在算力上,H100的FP16、TF32以及FP64的性能都是A100的3倍,分別為2000 TFLOPS、1000 TFLOPS和60 TFLOPS。此外,H100還增加了對FP8的支持,算力高達4000 TFLOPS,比A100快6倍。
在AI訓(xùn)練中,如果采用H100來訓(xùn)練GPT-3的話,就可以將速度提升6.3倍,如果結(jié)合新的精度、芯片互聯(lián)技術(shù)和軟件,則可以提升至9倍。
此外,在新的Hopper架構(gòu)加持下,大型模型的訓(xùn)練可以在數(shù)天甚至數(shù)小時內(nèi)完成。
其中,Transformer Engine可以用2倍于FP16的速度打包和處理FP8數(shù)據(jù),于是模型的每一層可以用FP8處理的數(shù)據(jù)都可以提升2倍的速度。
如果美國真的對高端GPU斷供,國產(chǎn)GPU是否有可行的替代方案呢?
國產(chǎn)GPU準(zhǔn)備好了嗎?
「芯智訊」在一篇較為詳盡的總結(jié)中表示,從整體來看,目前國產(chǎn)GPU仍處在一個發(fā)展的初期。
在圖形顯卡領(lǐng)域,只有景嘉微取得了一些成績,但與英偉達和AMD還有較大的差距。
而對于此次斷供影響到的高性能計算領(lǐng)域,文章分析稱,僅天數(shù)智芯、壁仞科技和芯動科技有推出相應(yīng)的產(chǎn)品。
其中,根據(jù)壁仞科技官方公布的數(shù)據(jù),BR100在AI算力方面已經(jīng)超過了英偉達的A100。不過,由于該產(chǎn)品才剛剛推出,所以仍需要市場來檢驗。
一直以來美國對國內(nèi)不斷打壓,國產(chǎn)GPU廠商也在加速自身研發(fā),就是為了在緊要關(guān)頭能夠?qū)崿F(xiàn)自給自足。
現(xiàn)在,這條自研路仍任重道遠。
參考資料:
https://mp.weixin.qq.com/s/V7X2gRVZchHVg9WTrI_P-g
https://laoyaoba.com/n/831077
https://www.reuters.com/technology/nvidia-says-us-has-imposed-new-license-requirement-future-exports-china-2022-08-31/
https://www.reuters.com/technology/amd-says-us-told-it-stop-shipping-top-ai-chip-china-2022-08-31/
文章轉(zhuǎn)自:https://mp.weixin.qq.com/s/FzGMX_s0-KHS1mk7lvMMDw
服務(wù)熱線
微信客服