給我100億,我要造一個超越英偉達的國產GPU,這事你信嗎?
看似天方夜譚的事情,正在中國真實發生著。
近兩年,國產初創GPU公司累計拿下了超百億的融資,成立18個月的壁仞科技融資總額超過50億,摩爾線程一年融資30億,沐曦集成電路第五輪融資10億元,天數智芯拿下10億元C輪融資。
這樣的巨額融資,看的出資本市場堅信國產GPU光明的未來,比融資額更吸引人眼球的,是國產初創GPU的豪言壯語。
摩爾線程在不到300天的時間里,宣稱完成了首顆國產全功能GPU的研制,紙面算力相當于2016年推出的英偉達GTX 1070。
壁仞科技更為激進,不到3年時間就推出了首款通用GPU產品BR100系列,宣稱其旗艦產品的峰值算力超過了英偉達目前在售的旗艦計算產品A100 GPU的3倍。
剛剛登陸科創板的龍芯中科則在招股書中稱,募資額中的12.58億會投入先進制程芯片研發及產業化項目。
其實,這并不是中國造芯第一次讓人看到朦朧的希望。新世紀以來,中國投入大量人力與財力,試圖在消費級CPU領域取得突破,卻誕生出“漢芯”這種騙取上億元科研基金的鬧劇。后來,華為多年的臥薪嘗膽,終于讓海思芯片在智能手機領域擁有競爭力,但被封鎖后再次無以為繼。
但不管有多難,這一次,中國造芯的步點已經踩在了GPU上,為什么是GPU?這會是一場資本泡沫嗎?能成功嗎?在我們看來,中國自主研發GPU,有必要,有機會,但也難度巨大。
首先,國產GPU有必要,但不是讓你買回家打游戲用的。普通用戶對顯卡的需求無非是打游戲或者渲染視頻。
然而除此之外,在眼下的科技行業,GPU正顯得越來越重要。相較于CPU,GPU擁有更多計算單元,這讓它適合用于數字貨幣“挖礦”,也更適合用于人工智能深度學習。由于AI的深度學習都要跑海量數據,所以GPU往往比一般CPU更有效率。
像當下的大風口自動駕駛,就離不開深度學習在圖像識別領域的應用,如果說自動駕駛是智能汽車行業的基建,那GPU就是這個基建的基建。其它領域里,從普通人生活中的人臉識別、智能音箱,到下圍棋的阿爾法狗、大片里的演員換臉,也都需要AI通過GPU進行深度學習。
GPU扛把子英偉達的財報就顯示,他們增長最迅猛的業務當屬數據中心。2021全年收入67億美元,同比增長高達124%。這項業務的核心硬件基礎之一就是A系列服務器。
這個數據中心其實就是英偉達提供算力,幫助企業進行AI訓練的,從公開材料中可以看到,提高微信搜一搜的搜索效率,部署智能交通預警平臺,醫療領域的基因測序等等,都是由英偉達的GPU來提供算力支持的。
特別是自動駕駛領域,英偉達也處于領先地位。自動駕駛算法公司可以用英偉達的GPU進行研發加速,整車企業則可以直接購買內置GPU的英偉達自動駕駛芯片,老黃這次又贏麻了。
目前中國人工智能行業可以說方興未艾,如果在重要行業的基礎設施上過分依賴外國芯片公司,大概并不是一件值得過分稱道的事情。畢竟類似斷供、后門這樣的負面詞匯,我們聽過了太多。
總而言之,在未來充滿太多不確定性的情況下,中國的GPU創業潮難度雖大,但還是非常有必要的。
而跟過去20年一直在說的國產CPU相比,國產GPU除了有必要,還有可能。
其實早在1994年,當時聯想的總工倪光南提出要造國產CPU開始,方舟、龍芯、申威和飛騰等公司相繼開展研究,而他們遇到的最困難問題之一就是,拿不到x86架構的指令集授權。
大家常用的電腦程序都使用英特爾x86架構的指令集,沒有它,國產CPU就不能運行這些程序,即使能運行,效率也低。
打個簡單的比方,指令集就好比乘法口訣,英特爾有這本乘法口訣的版權,不讓其他企業使用,沒有口訣算個5×7,都要掰手指頭算半天,更何況CPU是算的是“6378×122.6”。
但事情在GPU上發生了變化。一方面,與CPU基本被x86架構統治不同,GPU初創公司可以拿到一些國外芯片設計公司的公版架構設計。
江湖傳聞,這一輪國產GPU創業潮,就與擁有中資背景的英國芯片設計公司Imagination放開授權,擁有一定聯系。這家公司手上有相當多成熟的GPU設計方案。
另一方面,做GPU對指令集的依賴稍小,而相對較為重要的API接口方面,國內公司是比較輕松可以獲取的。API接口可以起到連接應用程序和顯卡驅動的橋梁作用。
所以從拿到入場券的角度來看,GPU確實比CPU要容易一些。除了入場券,國產GPU的可能性還體現在核心結構上。
剛才說過,GPU具有大吞吐并行計算方面的優勢,但相對的,它遠不如能理解上萬指令的CPU“聰明”,通常只能理解十幾種指令種類。這也就意味著,相比有著更多控制單元、緩存單元,以及更復雜計算單元的CPU,GPU的控制和緩存單元更少,整個GPU核心大約90%都由數目巨大的計算單元組成,設計難度相對較低。
說到這,國產GPU有必要,有可能,但同時也有很大難度。
GPU是典型入門容易畢業難的行業,近期英特爾時隔24年重回獨立GPU市場,拉開架勢發布的新品,表面看疊了不少buff,實際到了最考驗功底的驅動程序方面,卻被英偉達按在地上摩擦。
所以對于新品牌的顯卡來說,參數的意義往往有限。
要知道,2021年英偉達僅在顯卡驅動測試工作上的投入就高達180萬小時。
而多年近乎壟斷的行業地位,形成了很強的生態效應,讓軟件開發商更愿意為N卡進行針對性適配。
比如游戲的“次時代”技術光線追蹤,就是英偉達率先引入游戲市場的,效果也比AMD更好;
專業領域也是如此,像Adobe等專業設計軟件使用英偉達顯卡時可以開啟CUDA加速,從而實現更快的渲染速度。
再看國產GPU,雖然目前很多廠商的紙面數據,已經可以和英偉達2016年的10系掰掰手腕,但在調試以及軟件適配方面的差距,不可能是一朝一夕就可以完成的。
曾有人拿2019年的景嘉微號稱對標GTX 1080的JM7201測試,結果卻連英特爾10代酷睿CPU的核顯都不如。
況且在消費級市場,無法有效降低成本的國產芯片,往往價格偏高,就像龍芯、兆芯等國產CPU筆記本一樣。
不過,國產公司也有突破點,那就是企業級GPU市場,以及需要自主可控產品的一些行業。國內B端客戶更看重安全性和可靠性,不存在C端那種明顯的生態壟斷,國產GPU在這方面也已經有了一些成功案例。
比如近期完成取證試飛不久的國產大飛機C919,用的就是翔騰微電子HKM9000 GPU的航電系統。壁仞科技剛發布的BR100系列GPU,與全球前三的服務器廠商浪潮簽約了AI服務器相關協議。芯動科技風華GPU第二代,則獲得了中國能建5億元金額的采購大單。
所以對國產GPU來說,更現實的是先在B端“打怪升級買裝備”,等基礎好了,口碑有了,未來挑戰老黃蘇媽,或許真的就不僅僅是一個夢想了。
當然對于國產GPU這一輪創業浪潮,也有不少懷疑的聲音。有從業者指出,目前國內企業與英偉達、AMD等大廠的技術差距在10年以上,而一塊GPU的研發周期從立項到上市至少需要3-5年,拿到巨額融資的國產GPU公司,是否能說服資本保持足夠的耐心去等待?
冷靜下來看這件事情,確實有很多魔幻的地方,有些國產GPU公司起步就要對標英偉達最先進的產品,是否步子賣的有些過大;另外大量產品將GPU的制程工藝定在7nm,而這樣的生產工藝嚴重依賴臺積電和三星,如果出現華為一樣被制裁的情況如何收場?還是要等中芯國際實現7nm的量產?
這些問題將在國產GPU成長的路上持續存在,不過從一個科技愛好者的角度出發,我們真心的希望在GPU領域,能有中國企業可以站上國際舞臺,和巨頭們掰掰手腕,希望不遠的未來,我們都能用上一塊完全來自中國的頂級顯卡。