【明報專訊】據外國媒體報道,經過一輪討價還價之後,美國商務部改變主意,Nvidia(美:NVDA)針對中國內地市場而設計的3款中國「特供版」人工智能(AI)晶片HGX H20 SXM、L20 PCIe、L2 PCIe,將會重新獲得放行,由今年第二季開始量產和出貨。
事緣美國政府在去年10月17日頒佈的新的出口禁令,進一步限制Nvidia的高性能AI晶片出口到內地。Nvidia被迫停止A100、A800、H100、H800和L40S等晶片向內地出貨。為此,Nvidia趕緊設計3款專門針對中國內地市場的「特供版」AI晶片,3款晶片都是基於H100晶片修改而來,在性能上大幅降級,以避開美國政府的出口管制。但又遭到美國商務部長雷蒙多反對,公開斥責該公司此舉是「打擦邊球」。
美國商務部認為,這3款本來不在出口管制清單之內的降級AI晶片仍然屬於敏感技術,可能會被中國內地應用於軍事目的,故要求Nvidia停止出口到中國內地的計劃。 經過一番協商和妥協之後,Nvidia終於獲得美國商務部同意,可以向中國內地的客戶提供上述3款低檔AI晶片,但傳聞前提是也需要申請出口許可證,以及必須在某個日期之前完成出貨。
Nvidia發言人表示,該公司對美國政府的決定感到滿意,也感謝中國內地的客戶和合作伙伴的支持和信任。
但順得哥情失嫂意,這些性能大幅降級的AI晶片,又令到內地的雲端運算大客戶採購意願大減。據知情人士透露,由去年11月起,阿里巴巴(9988)和騰訊(0700)等內地大公司一直在測試Nvidia這些「特供版」AI晶片的樣本。它們最近已向Nvidia表明,今年訂購這些「特供版」AI晶片的數量,將會遠遠少於之前原先計劃採購、但已經被禁出口到內地的Nvidia高性能AI晶片(例如A100和H100等)的數量。
相反,阿里和騰訊正在將一些先進AI晶片的訂單轉交給內地的本土公司,並且更加倚賴它們內部開發的AI晶片;而百度(9888)和字節跳動也是如此。
根據網上曝光的數據,Nvidia的H100 SXM晶片浮點運算性能高達1979 TeraFLOPs(TeraFLOP即每秒1萬億次浮點運算)。而HGX H20 SXM晶片是H100 SXM縮小版,但其浮點運算性能只是296 TeraFLOPs,只是H100 SXM的大約15%。而L20的浮點運算性能更只是239 TeraFLOPs,L2的浮點運算性能更低至193 TeraFLOPs,分別只是H100 SXM的大約12%和9.75%。如此巨大的性能差距,難怪被內地的科網巨頭嫌棄,寧願部分轉用國產AI晶片。
據報道,除了Nvidia的AI晶片,現時內地市場最流行的AI晶片可能是華為的「昇騰910B」(Ascend 910B);其次,海光(滬:688041)的DCU亦不錯,兩者可以勉強對標Nvidia的A100晶片云云。去年8月,百度和華為簽約,以4.5億元人民幣採購1600枚「昇騰910B」晶片。
長期以來,百度在「文心一言」語言大模型的推理端都是使用自家研發的「昆崙芯二代」晶片,在訓練端主要倚靠Nvidia的V100和A100晶片。上述的採購案相信意味着,百度在「文心一言」的訓練端開始使用華為的「昇騰910B」晶片。
另外,360集團去年亦採購了大約1000枚「昇騰」晶片;神州數碼(深:000034)和恒為科技(滬:603496)用4億元人民幣,向華為採購一批「昇騰」伺服器。而華為還研發了「昇騰910C」晶片,將會在今年安裝在它的深圳鵬城雲腦第三期。
「現在業內基本都按照國產晶片來規劃算力,科大訊飛(深:002230)早就已經按照不購買美國晶片來佈局未來。」科大訊飛創辦人兼董事長劉慶峰說。
美國政府忽然對Nvidia的中國「特供版」晶片開綠燈,顯然也是因為憂慮過度限制AI晶片出口到內地,反而會倒迫內地業者採用國產AI晶片。畢竟,AI晶片為應用於伺服器、超級電腦和數據中心,而非安裝在智能手機內,14納米和7納米的製程技術暫時也夠用。