作者丨黃澤正
編輯丨張麗娟
最近,中美的大模型廠商們都在干同一件事——卷AI芯片。
在硅谷,谷歌給最新款的Pixel手機裝上了Tensor G3芯片,讓用戶可以在手機端解鎖生成式AI應用;微軟宣布將在11月推出首款自研AI芯片,以此降低算力成本并減少對英偉達的依賴;OpenAI也表示正嘗試自研AI芯片,并已開始評估潛在的收購目標;亞馬遜以40億美金投資大模型創企Anthropic后,要求其使用亞馬遜自研AI芯片來構建、訓練和部署大模型……
總結起來就是,有AI芯片生產能力的,如谷歌、亞馬遜,想用自研芯片替換英偉達。沒有AI芯片生產能力的,如微軟、OpenAI,創造條件也要替換英偉達。
而在國內,AI芯片市場也再起波瀾。華為發布AI芯片昇騰910,配合全新架構的昇騰AI計算集群,可支持超萬億參數的大模型訓練;AI芯片廠商燧原科技宣布完成D輪融資,融資規模達到20億人民幣……
為什么大家都不約而同地將大模型,卷向了AI芯片?很顯然,AI芯片研發是一項長周期、重投入的工作,也已經有了行業巨頭英偉達,可以提供高性能的AI芯片。
細究起來,恐怕只能概括為“成也英偉達,敗也英偉達”。英偉達對AI算力的壟斷,讓全球AI公司都要不斷承擔英偉達芯片的溢價,并且由于英偉達生產能力有限,算力短缺正在制約一些AI公司的發展。
根據dealroom.co數據,在這波生成式AI的熱浪中,美國獲得了全球投融資的89%,而在AI芯片的投融資中,中國AI芯片投融資世界第一,超過美國兩倍。
也就是說,盡管在大模型發展方式、發展階段上,中美大模型企業還存在諸多差異,但在掌控算力這件事上,大家卻顯得格外一致。
實際上,無論是OpenAI還是微軟、谷歌,亦或是國產芯片廠商,與其說是要搶英偉達的生意,不如說是想讓英偉達少賺自己點錢。
比如微軟就大方承認,自己即將發布的AI芯片并不能直接替代英偉達的芯片,但隨著微軟繼續推動在Bing、Office、GitHub和其他方面推出AI驅動的功能,自研芯片可能會大幅削減運算成本。
換言之,微軟等大廠自研AI芯片,其實并非想取代英偉達,而更像是想自研一款平替產品,以緩解算力不足和算力成本過高的問題。
畢竟英偉達對AI算力的壟斷,已經到了令人瞠目結舌的地步,大模型廠商們也苦英偉達久矣。
根據公開數據,英偉達在獨立GPU市場份額達80%,在高端GPU市場份額高達90%。
2020年,全世界跑AI的云計算與數據中心,80.6%都由英偉達GPU驅動。2021年,英偉達表示,全球前500個超算中,大約七成由英偉達芯片驅動。2023年第二季度,英偉達的H100顯卡出貨量達800多噸,依然供不應求。
由于英偉達霸占了高端GPU市場,產品不可避免出現了溢價。一個典型案例是,由于英偉達AI芯片供不應求,國內有人從機房把舊A100芯片拆出來倒賣。這些舊貨非但沒有貶值,反而賣到10萬一片,比去年同期新品8萬左右的售價還要更貴。
對于算力需求巨大的大模型廠商來說,不僅短期承擔了過高的芯片溢價,長期角度更是為英偉達的發展壯大做了嫁衣。
比如英偉達第二季度財報顯示,公司第二季度收入為135.1億美元,較去年同期增長101%。其中,數據中心收入占據大頭,創下了103.2億美元的紀錄,較去年同期增長171%,遠超分析師預期。
而英偉達巨額利潤的背后,其實是各大科技巨頭的輸血支持。根據公開財報顯示,大部分數據中心的擴建費用主要由各家科技巨頭承擔,谷歌、微軟、Meta的財報中都強調了數據中心的成本支出。
在市場環境整體下行,大家日子都不好過的當口,還要將巨額利潤上供給英偉達,幫助其進一步壟斷市場份額,掌握定價權,各家科技巨頭無疑成為了冤大頭。
同時更進一步,除了錢的因素,英偉達已經數次表示,即便已經開足馬力生產,自己的GPU產能也難以滿足當前市場的需求。
按照硅谷流行的說法,英偉達就像大模型時代的賣鏟人,不論大模型之戰的勝利方是誰,笑到最后的都是賣鏟子(算力)的英偉達。
隨著大模型之戰愈演愈烈,英偉達當然可以從容生產,畢竟AI芯片賣給誰不是賣。但對于身處戰斗第一線的微軟、谷歌,以及OpenAI等一眾創業公司來說,如果在短兵相接的時候,英偉達斷供了,就等于沒了武器,企業的命運將何去何從,恐怕要打上一個大大的問號。
畢竟,連與黃仁勛私交甚密,且不差錢的OpenAI在開發GPT-4時都因為算力短缺而受阻,又有哪家公司能確保英偉達不會斷供呢?
因此,無論從經濟性還是安全性角度,大模型廠商自研AI芯片都在情理之中。
除了邏輯成立,大模型廠商卷向AI芯片的最直接原因,還在于兜里的錢變多了。
根據dealroom.co數據,過去五年全球生成式AI企業融資額超過220億美元,尤其是2023年,融資額足有150億美元。而這些巨額投資,有89%都流向了美國的初創公司,尤其是OpenAI,一家就拿到了VC將近120億美金的投資。
對創業公司來說,錢少了固然萬事皆休,但有時賬目上錢太多了,也成了幸福的煩惱,對大模型創企尤其如此。
一方面,當前大部分大模型創企,還不具備自我造血能力,其賬目上的巨額資金,都是投資人打進去的。那另一方面,投資人不光會打錢,還會盯著企業花錢。在收獲巨額融資后,如果沒有相關的業務進展,企業恐怕很難給投資人交差。
既不能不花錢,又不能亂花錢,“自研AI芯片”就順理成章提上了企業日程表。主要原因有兩個:剛需+階段性要求。
首先,大模型發展的底層是算力,AI芯片可以說是大模型創企的水和電。但這個剛性需求,長期以來被英偉達所把持。
OpenAI的CEO山姆·奧特曼就曾公開抱怨GPU短缺,他認為GPU市場完全由英偉達主導,“這家公司控制著全球80%以上最適合人工智能訓練的芯片市場?!倍ミ_對AI芯片的壟斷,也直接影響了OpenAI的發展。
山姆·奧特曼透露,其實早在GPT-4發布之初(今年3月),OpenAI就計劃將ChatGPT的上下文輸入長度提升到32k token,但直到GPT-4上線很長一段時間,這一計劃都未能達成。其中一個關鍵因素,就是英偉達的算力芯片供不應求,以及算力成本過高。
如果說以往公司規模較小,缺乏資金時,被英偉達“卡脖子”是無可奈何?,F如今,OpenAI兵強馬壯,資金充裕,恐怕很難再忍受將企業命脈交給別人,打亂自己的全盤計劃。
除了剛性需求,大模型廠商最近不約而同“圍剿”英偉達,還在于大模型發展的階段性需求。簡單來說,就是到了燒硬件的時候。
需要明確的是,大模型訓練有些類似押注,并非每次訓練都能得到滿意的結果。換言之,訓練次數增多不一定能達到優化的效果,如果盲目將錢投入訓練,大模型創企為算力支付的高昂費用只能是試錯成本。
而如果把資金花到芯片研發上,效果則完全不同。
比如OpenAI的做法,收購芯片研發公司,就等于把原本要上供給英偉達的錢,沉淀成了公司資產。不僅能在未來增強公司核心競爭力,在當前也能給投資人合理的解釋——公司正把錢用在刀刃上,構建自身技術壁壘。
對于谷歌、亞馬遜和微軟等不差錢的硅谷大廠來說,花錢搞芯片研發更是必選項。
原因很簡單,一方面,隨著生成式AI大熱,英偉達的市值突破萬億美元,即便是硅谷大廠,心頭應該也是羨慕不已,想要分一杯羹。另一方面,隨著生成式AI被各大廠擺上核心位置,算力之爭大概率將決定未來企業的生態位,大廠們自然不能讓英偉達掌握自己的核心命脈。
反觀國內市場,盡管國產大模型與硅谷大模型發展階段不同,但在追趕英偉達這件事上,大家的目標卻非常一致。
中國工程院院士、清華大學計算機系教授鄭緯民就認為:“今天國產AI芯片只要達到國外芯片60%的性能,如果生態做好了,客戶也會滿意?!?/strong>
其實從錢的流向來看,國內對AI芯片非常重視。最近5年中國AI芯片的投融資額世界第一,達到了74億美金,比美國還多兩倍。
在燒了大量的研發經費后,國內AI芯片廠商已經有了6000+家,其中主流廠商約60余家,已經大致形成了三個梯隊。
第一梯隊包括海光、華為、寒武紀等廠商,有成熟產品,且有商業化量產規模的應用;第二梯隊主要是燧原、昆侖芯、天數、壁仞、沐曦等創企,已經發布了AI產品,但應用領域還相對有限;第三梯隊則是一眾仍在埋頭AI芯片研發,尚無AI芯片量產的早期企業。
實際上,在硬件性能方面,國產第一梯隊的AI芯片已經與英偉達相差不遠。比如科大訊飛總裁劉慶峰就公開表示,“華為的AI芯片性能,已經可以對標英偉達的高端顯卡A100,尤其在顯卡的裸金屬性方面?!?/span>
當然,在硬件性能上接近英偉達,并不意味著國產AI芯片可以取代英偉達。因為英偉達真正的壁壘,并不只有GPU硬件性能,還在于其龐大的AI軟件生態CUDA。
簡單來說,決定GPU性能的不只是顯卡本身,還包括配套軟件和開發工具對應用的支持。作為一家成立30年,并且早早確定專注于生產GPU的公司,英偉達定義了GPU通用計算編程框架CUDA,開發者們早已習慣了用CUDA專有的編程語言,制作GPU驅動的應用程序。
換句話來說,如果開發者要遷移到谷歌、亞馬遜、微軟或國產的GPU芯片,他們甚至需要學習全新的軟件語言,遷移成本顯然很高。
鄭緯民教授也指出,行業搶貨國外AI芯片而不用國產芯片,這一現象本質還是國產芯片生態仍有差距。
他認為完善的GPU生態應該包括兩個方面:一方面是基于其他系統研發的軟件要能容易地遷移到國產生態中;另一方面是國產系統的開發套件要能很好地支持新軟件的開發。“如果能達到生態的成熟,哪怕芯片硬件性能只有國外的60%,執行大多數任務也不會有明顯感知?!?/span>
生態起決定作用,英偉達有先發優勢,這兩個因素疊加在一起似乎成了一道無解的命題——英偉達就是會壟斷市場。
但更多AI廠商自研芯片,卻引入了新的變量。
首先,自研芯片意味著AI公司可以根據自身需求,對軟件和硬件進行改造,確保芯片設計完全符合算法需求,提高運算效率和性能。與此同時,AI公司還可以圍繞自研芯片,建立私有的生態系統,包括軟件庫、框架、工具和支持服務,以此滿足客戶定制化需求。
對國產AI公司而言,雖然很難跟英偉達正面硬剛,但可以先成為60%的英偉達。雖然無法滿足全球AI算力需求,但至少可以先滿足自身算力需求。
而從長期角度,正如百川智能創始人王小川所言,大模型發展分為訓練、推理兩部分,雖然訓練目前只有英偉達做的最好,但推理需要有國產AI芯片?!拔磥砣绻吣P桶l展,算力儲備非常關鍵。這場‘算力仗’,中國的國產AI芯片必須要能頂上?!?/span>
AI芯片快速迭代的特性,注定了這一賽道的格局不會永遠固定。比如,就在燧原科技宣布完成D輪20億元融資,締造今年芯片最大融資金額之際。
另一條新聞也在業內刷屏,長期虧損的國產AI芯片第一股寒武紀宣布,國投基金減持完畢,基本清倉。而這種創投股東集體清倉的情形,對寒武紀來說已不是第一次。
即便在AI芯片熱潮洶涌的當下,要想真正搭上這股東風,恐怕也并不容易。