12/07/2024
AI晶片競爭升級!NVIDIA獨霸天下?8大科技巨頭組UALink聯盟,圍攻輝達NVLink護城河!
在生成式AI世代下,最搶手的硬件產品是輝達(NVIDIA)出品的圖像處理器(GPU),在全球AI加速器的市佔率高達80%至95%,讓該公司躍居為AI晶片龍頭。AMD、Intel兩大處理器生產商拼命追趕輝達,但卻難見其尾燈,於是聯同微軟、Google、Meta等合共8大科技巨頭,組建AI技術聯盟「Ultra Accelerator Link」,試圖與之抗衡。究竟這個巨大聯盟能否動搖NVIDIA的AI霸業呢?
排除NVIDIA的AI產業聯盟
2024年4月,微軟(Microsoft)、Meta、超微(AMD)、博通(Broadcom)宣布結盟,成建立一個新的AI產業小組「Ultra Accelerator Link」(UALink),以開發GPU連結技術的新標準。5月,UALink建立一個名為「UALink Promoter Group」的推廣小組,同時再有新成員加入,包括: Google、英特爾(Intel)、思科(Cisco)、惠普(HP)。但有趣的是,這個AI產業小組始終將AI晶片龍頭NVIDIA排除在外。
國際市調機構Gartner評估,2024年用於AI伺服器中的GPU市場可望達到210億美元(約1,638億港元),及至2028年將攀升至330億美元(約2,574億港元),但預計當中80%至95%的份額都會由NVIDIA獨佔。微軟、Google、Meta已購入數十億美元的NVIDIA硬件,用於自身的AI模型與雲端運算平台,但如今顯然想減少對AI晶片龍頭的過度依賴,於是決定採取合縱策略,聯合不同廠商抗衡輝達,形成8大科技巨頭圍攻輝達之勢。
GPU互連技術壁壘相對較低
事實上,NVIDIA之所以能建立有如堡壘般穩固的AI霸業,全賴有多重護城河在背後支撐。除廣為人知的GPU硬件設計和《CUDA》開發軟件平台外,輝達還有第三條護城河——GPU高速互連技術「NVLink」。相比起GPU和《CUDA》,GPU與GPU之間高速連接的技術壁壘相對較低,加上相關產業變革正處於起步階段,故此成為8大巨頭突破NVIDIA堡壘的最佳切入點。
2024年3月,NVIDIA執行長黃仁勳在GTC大會上發表的最矚目產品,當然是新一代Blackwell架構GPU,惟第五代NVLink也非常重要。它的雙向總理論頻寬從900GB/s倍增至1.8TB/s,足以讓由36組GB200(一顆Grace CPU+兩顆B200 GPU)組成的GB200 NVL72伺服器,把72顆GPU當成單一巨大GPU執行運算,令AI模型的訓練速度增加4倍,推論速度更提高30倍。
今年第三季推出UALink 1.0
衝著NVLink而來的全新互聯技術UALink,能夠提供精準而高速的低延遲通訊,不但可以讓單一伺服器內連接1,024顆GPU,而且容許GPU附加的記憶體之間進行直接載入和儲存;藉著為GPU之間的溝通建立一個通用協定,使GPU到GPU能夠更有效地進行通訊,讓AI業者可以更輕鬆地整合AI系統,並提高數據中心部署的靈活性與可擴展性。
UALink小組計劃在2024年第三季成立一個「UALink聯盟」(UALink Consortium),以監督UALink標準的開發進程。有別於NVLink只限運作於NVIDIA GPU之上,UALink屬於開放標準,規格細節公開,讓不同廠商自由讀取、使用、實作,沒有任何限制或授權問題。UALink 1.0版本將會同一時間推出,更高頻寬的後繼版本UALink 1.1則會在同年第四季推出。至於UALink的第一批產品,預估在「未來幾年」便會上市。
Cerebras研發AI專用晶片
在Computex 2024的主題演講上,AMD執行長蘇姿丰讚揚UALink開放標準協定,強調標準開放方能促進AI產業創新,與NVIDIA叫戰的意味甚濃。面對著UALink聯盟的進逼,黃仁勳顯得毫不畏懼。他老神在在地表示,該公司在7年前已著手研發NVLink,如今人們才開始意識到它的重要性:「我們的NVLink已經開發到第五代,而UALink只剛起步,等UALink第一代推出,NVLink可能到第七、八代了。」
蘇姿丰認為,以乙太網絡技術為基礎的UALink,才是擴大GPU運算規模的最佳解決之道。(圖片來源:翻攝AMD官片YouTube影片)
NVIDIA執行長黃仁勳表示,NVLink能以令人難以置信的速度,連接起AI伺服器內的GPU,形成一個巨大的GPU來執行運算。(圖片來源:NVIDIA官網)
黃仁勳指出,在NVLink架構下,可以將8台GB200 NVL72伺服器合組成「DGX SuperPOD」,把576顆B200 GPU當作是一顆超巨大GPU,提供11.5exaFLOPS的超級運算力。(圖片來源:NVIDIA官網)
除科技巨頭外,市場上也有不乏要挑戰NVIDIA的初創公司。創立於2015年的美國加州初創Cerebras,埋首於研發比GPU更適用於訓練AI模型的晶圓級晶片(WSE),被視為輝達最強挑戰者之一。踏入2024年,該公司已推出一款5奈米製程的WSE-3晶片,並開始跟戴爾(Dell)合作。Cerebras亦仿傚NVIDIA,推出自家AI開發軟件,可以搭配WSE晶片使用,惟功能暫時仍遠遜於《CUDA》。
群雄並起爭奪10%市場份額
雖然NVIDIA幾近獨佔了整個AI晶片市場,又擁有多重護城河構成的無敵競爭優勢,惟市場對尋求輝達替代方案仍是興趣滿滿。創投公司Thomvest Ventures董事總經理烏梅什·帕德瓦爾(Umesh Padval)直言:「客戶喜歡看到市場領導者,但也期待有更多供貨來源以供選擇。」
作為Cerebras 投資者之一的創投公司Eclipse Ventures認為,AI晶片市場規模日趨龐大,Cerebras等初創只要從NVIDIA手上搶到10%的市場份額,已是獲利甚豐;但要留意的是,AMD與Intel也同樣瞄準這10%份額。由是觀之,未來AI晶片市場競爭格局可能會是:各大小企業拼命爭奪這塊10%的小片蛋糕;至於90%的大片蛋糕,則會被NVIDIA牢牢握在手中,短時間內仍未看到有誰可動其分毫!
「延伸閱讀」:
AI競賽隱形贏家!NVIDIA技壓Google、Intel、AMD,穩坐AI晶片龍頭,致勝關鍵全靠軟件!
雲端AI已落伍?AI PC掀起電腦端運算新戰局!微軟、Intel英特爾惡鬥NVIDIA爭奪市場龍頭寶座!
稱霸AI晶片!NVIDIA吃掉9成AI利潤,科技巨頭尋找替代方案!未來競爭格局將面臨巨變?
【香港好去處】etnet全新頻道盛大推出!全港最齊盛事活動資訊盡在掌握!► 即睇