moneymonday
指數/外匯
明報APP

報章內容

薛偉傑:Cerebras專攻巨型AI晶片 或成Nvidia最強對手?

【明報專訊】近幾年,Nvidia(美:NVDA)的人工智能(AI)晶片幾乎壟斷了市場,其業績絕大多數時間都遠超預期,推動其股價節節上升,市值已由2022年底的3595億美元,大幅上升至上周的2.357萬億美元,成全球市值第三高的上市公司,更大有追上全球市值第二高的蘋果(美:AAPL)之勢。

但正當Nvidia備受股民追捧時,有些業內人士卻認為,它的最強對手已經誕生。甚至,連全球運算速度最快AI晶片這個寶座,亦早已經被該公司奪走了!這間黑馬公司就是Cerebras Systems。

整片12吋晶圓打造 WSE-3內藏4萬億晶體管

美國初創AI晶片公司Cerebras Systems成立於2016年,專門研發超大面積的AI晶片,以提升運算架構的整合度和簡化集群連接,從而提升整體的AI運算速度。

它的構思說出來不難理解,就是將整片12吋直徑的晶圓用來製成一枚AI晶片。這樣可以令一枚AI晶片包含更多晶體管之外,亦可以將記憶體(RAM)和互聯結構等也直接整合到晶片上。這種晶片設計方式稱為「晶圓級集成」。其好處是,可以減少很多物理連接,簡化系統結構,兼縮短數據傳送距離,大大減少海量數據在電腦主機板上傳送所浪費的時間,從而提升整體的運算速度和節省電力。

此外,由於大型AI晶片的運算性能較強大,數據中心運行和訓練AI大模型的群集便毋須用到數千至1萬枚傳統AI晶片,可以改為使用大約100枚大型AI晶片。這樣可以令AI大模型的編程較為簡單,減少部分程式碼。

據報,其實早在1970年代,Texas Instruments等多家美國公司已曾經嘗試將整片晶圓打造成一枚晶片,但全部都不成功。有說,這主要是因為晶圓是由單晶矽柱體切片製成,某些位置總會有些缺陷,即使製成晶片後,也無法使用。傳統上,將一片晶圓分割製成數十枚至數百枚晶片的方式,只需將剛好出現在那些缺陷位置的小量晶片拋棄就行,只是良率達不到100%而已,但仍然維持在高水平。

不過,「晶圓級集成」的晶片不同,因為它是將整片晶圓製成一枚晶片,那些缺陷隨時會令到良率變成零,即是所有造出來的「晶圓級集成」晶片都無法使用。曾經有一段長時間,半導體業者以為這個難題無法解決。

據報道,Cerebras Systems研究出技術成功繞過這些缺陷,加上台積電的成熟代工工藝,令到它的「晶圓級集成」晶片的良率反而變成100%。

2019年8月,Cerebras Systems發表了它的Wafer Scale Engine(WSE)系列AI晶片的第一代產品WSE-1。WSE-1面積46,225平方毫米(215毫米 x 215毫米),是普通晶片面積的50倍以上,比一本書還要大。WSE-1由台積電以16納米製程技術製成,共有1.2萬億個晶體管,集成了40萬個AI內核和18GB SRAM,記憶體頻寬每秒9PB。

2021年4月,Cerebras Systems再發表它的第二代晶片WSE-2。WSE-2的面積大致不變,由台積電以7納米製程技術製成,共有2.6萬億個晶體管,集成了85萬個AI內核和40GB SRAM,記憶體頻寬每秒20PB。除了面積相近,其他數據都比WSE-1高出1倍以上。

今年3月14日,Cerebras Systems再宣布推出它的第三代晶片WSE-3。WSE-3的面積大約也是46,225平方毫米,由台積電以5納米製程技術製成,共有4萬億個晶體管,集成了90萬個AI內核和44GB SRAM,記憶體頻寬每秒21PB。

該公司聲稱,WSE-3是專為訓練「生成式人工智能」(AIGC)模型而設計,這方面的性能可以高出Nvidia的H100晶片多倍。

不獨立發售晶片 自行設計AI運算系統

不過,Cerebras Systems並不獨立發售晶片。它使用自家晶片,自行設計了一些專門作人工智能運算用途的電腦系統。配備WSE-1晶片的系統稱為CS-1,當時每套報價250萬美元;而配備WSE-2晶片的系統則稱為CS-2。

據悉,CS-1和CS-2合共賣出了數十部,客戶主要是一些藥廠、疾病研究機構、國家實驗室、超級運算中心等。其中,阿斯利康和葛蘭素都有使用CS-1。

關於Cerebras Systems的WSE系列晶片的性能是否已經超越Nvidia的同期產品,筆者相信,這是有可能的,因為畢竟前者面積是後者的幾十倍。但何時能夠成為主流產品,真正挑戰Nvidia就很難說。其中一個原因是,很多AI軟件公司的開發人員才剛剛習慣了Nvidia的開發環境CUDA不久,要說服他們在短時間內轉換到另一個開發平台,並不容易。

明報記者 薛偉傑

[薛偉傑 科技觀潮]