過去兩年,一提到AI,幾乎所有人都會想到一個字:GPU。英偉達也因此成為全球最受矚目的公司之一。不過現在AI不是比誰的單一GPU更強,而是看誰的系統更強。

AI系統
英偉達最新一代旗艦系統是GB200 NVL72,一個機櫃裡面塞了 72 顆高性能GPU,功耗超過 120kW,這相當於一棟小型建築;全部液冷散熱;GPU之間高速互聯。這已經不是伺服器,而是一座AI工廠。
如果把AI系統比喻為超級跑車,GPU ≈ 發動機,HBM記憶體 ≈ 燃油供應系統,封裝製程 ≈ 變速箱,供電系統 ≈ 油箱+供油管,液冷系統 ≈ 散熱器,光通訊 ≈ 高速公路。
決定這輛車能不能跑的不再是發動機,而是整套系統。
三代英偉達的不同使命
很多人把H100、H200、GB200、GB300混在一起,其實這是三代完全不同的「系統級進化」。我們用最簡單方式拆開。
1、H100 / H200是上一代主力發動機
這是大家最熟悉的一代GPU。一顆一顆賣,拼成大集群來訓練AI,它們訓練ChatGPT這類大模型、堆GPU數量、拼成力,可以理解為上一代AI時代的「主力工具」。現在依然在大量使用,但屬於上一代體系。
2、GB200 NVL72:真正的“AI工廠”
GB200已經不再是“單顆GPU”,而是一整個機櫃級別的超級電腦系統,裡麵包括72顆B200 GPU、高速互聯網(NVLink)、專用CPU協同、液冷散熱系統,本質是不再賣“零件”,而是直接賣“一整套AI工廠”。
以前是一堆H100拼成一個AI集群,現在變成一個GB200機櫃 = 一個完整AI計算單元。這意味著AI正在從“拼裝時代”,進入“工業化時代”。
3、GB300:下一步不是更強,而是更省錢
很多人以為GB300是“更強版本”,其實不是。它從“算力更強” → 變成“算力更省錢、更適合賺錢”
主要優化方向在於推理效率更高、能耗更低、單位成本更便宜。 GB300更像“AI商業化機器”,而不是“訓練機器”。
很多人以為是“新一代取代舊一代”,其實三代產品是同時存在的。目前結構是:H100 / H200還在大量訓練模型,成熟、穩定、存量最大;GB200正在大規模導入下一代主力系統;GB300更偏未來商業化和推理階段
基礎設施戰爭
過去AI的競爭核心是誰的模式更強,現在變成誰能建造更大、更穩定、更便宜的AI工廠。
這裡面真正賺錢的,不只是GPU公司,而是整個系統。
1.算力核心是GPU + 內存,
GPU負責運算、HBM負責資料餵給GPU,你可以理解為一個負責“思考”,一個負責“餵飯”
2.製造瓶頸決定能不能量產
包括先進封裝(CoWoS)、高階載板(ABF)、PCB主機板,這一層的本質不是做不做得出來,而是「能不能大規模做出來」。
3.系統運作是真正的隱形瓶頸
這部分最容易被忽略,但最關鍵。 AI工廠最先卡住的不是算力,而是有沒有足夠電力供它運作。
散熱系統功耗太高,已經從“風扇散熱”變成必須用液冷系統;數據傳輸靠光通信,當GPU越來越多後,問題變成它們怎麼互相“交流”,只能用光通信替代傳統銅線。
利潤重新分配
以前利潤集中在GPU公司,現在正是整個實體系統鏈條分錢。
包括記憶體、封裝、材料、電力設備、液冷系統、光通信,誰卡住物理瓶頸,誰拿走利潤。這是今年以來為什麼各種風口此起彼落的根本原因。
AI正在從“晶片時代”,走向“AI工廠時代”。 GPU只是入口,真正決定未來利潤的,是誰能讓這座「AI工廠」穩定運作、規模擴張、持續降成本。
今天不用研究“哪顆GPU更強”,而是要看“系統的每一條物理邊界上”誰比較稀缺。
當你理解GB200 NVL72不是伺服器,而是一座AI工廠時,你就真正看懂了這一輪AI產業的核心邏輯。