5月22日,全球資本市場的“大網紅”英偉達發布了2025財年第一財季(截至2024年4月28日)的報告。
數據顯示,本季度英偉達業績全面大超預期,尤其是在AI加速擴張的驅動下,數據中心業務更是表現亮眼。具體來看,報告期內英偉達錄得營收260.4億美元,同比增長262%,其中數據中心業務營收226億美元,同比增長427%,營收占比87%;與此同時,受益于數據中心業務的高利潤驅動,報告期內公司錄得凈利潤148.8億美元,同比增長628%。

在財報發布前,市場對英偉達本季度業績飆升已經有了較為明確的預期,受此影響,公司股價在美股盤前僅小幅上漲了0.02%;但在業績公布后,全面超預期的財務數據還是給投資者帶來了不小的驚喜,美股盤后,公司股價突破1000美元,大幅上漲6.05%。
對游戲愛好者而言,英偉達并不陌生,其是全球游戲顯卡的龍頭。事實上,在很長一段時間里,游戲GPU及相關產品也確實是英偉達的主要收入來源。2016財年,公司總營收50.1億美元,其中游戲GPU業務達到28.18億美元,數據中心業務則為3.39億元。
但近幾年,隨著云計算的逐漸興起,遠程辦公、挖礦熱潮等推動英偉達數據中心GPU業務相關的收入快速增長。2023財年(2022年2月-2023年1月),英偉達數據中心業務首度營收超過游戲,成為公司的第一大業務,當年英偉達總營收269.74億美元,數據中心產品150.05億美元。
自此,英偉達數據中心業務開啟狂飆模式。
2024財年,在大模型對GPU需求暴漲的大背景下,英偉達總營收暴漲126%至609.22億美元,而數據中心業務的營收同比則激增217%至475.25億美元,在營收結構中的占比接近80%;而在*新一季的財報中,其數據中心業務更是同比大幅增長了427%,營收占比進一步增加至87%。

圖:英偉達數據中心產品營收增長
數據中心GPU業務的持續放量,推動英偉達身份屬性從硬件廠商向AI算力龍頭轉變。新的定位為其在資本市場帶來了巨大的估值想象空間,推升公司股價創下兩年五倍的神話,總市值更是躍升到2萬億美元之上。
英偉達崛起背后:算力需求的激增
我們認為,英偉達業績的爆發主要受益于AI行業對算力需求的激增。
2022年底,ChatGPT的面世,正式將AI帶入大模型時代。海內外大語言模型的快速涌現和迭代、模型性能的提升,使得訓練和推理持續擴張,帶動算力需求呈現出指數級增長趨勢。
海通證券指出,以OpenAI為例,訓練一次1750億參數的GPT-3大約需要的算力約為3640PFlops-day,共使用了1024塊A100(GPU)訓練了34天。而GPT-4參數量達到了GPT-3的500倍,使用約2-3萬張A100,訓練1個月左右時間。
在英偉達GTC大會上,黃仁勛也講到,如果要訓練一個1.8萬億參數量的GPT模型,需要8000張H100 GPU,消耗15兆瓦的電力,連續跑上90天。
東吳證券預計,推理算力需求將是訓練的數倍,高達幾十萬張H100,隨著模型繼續迭代,算力需求只會越來越大。根據IDC預計,數據中心GPU市場預計將從2022年的103億美元增長至2027年的654億美元,CAGR達到44.55%。
算力的實現需要以AI服務器為載體,而AI服務器則是包含GPU、CPU、存儲、通信技術等在內的龐大產業鏈。
根據TrendForce數據,2022年全球AI服務器出貨量達到85.5萬臺,預計2026年全球AI服務器出貨量為236.9萬臺,2022-2026年CAGR高達29.02%,遠超全球整體服務器市場增速。
就中國市場而言,根據 IDC 和浪潮信息聯合發布的《2022-2023年中國人工智能計算力發展評估報告》,2021年中國AI服務器市場規模59.2億美元,預計到2026年將達到123.4億美元,2021-2026年CAGR達15.82%。
了解英偉達,要關注哪些產品?
根據英偉達官網披露,在每一代的GPU架構下,公司會將旗下的GPU按品牌分類進入GeForce、NVIDIA RTX/Quadro、數據中心三個品類。其中,GeForce系列主要應用于游戲行業,屬于消費級GPU;NVIDIA RTX/Quadro主要應用于工業設計、媒體開發等專業級別領域;從GPU的性能橫向對比來看,分類進入數據中心相關的GPU往往是英偉達的**產品。
前文提到,AI服務器需求的大爆發,已經使得數據中心GPU相關產品成為英偉達*大的收入來源,且相關產品收入增速驚人。基于此,本文我們討論英偉達供應鏈時,*大的增量即來自數據中心的GPU相關業務。
那么,數據中心主要需要哪些GPU芯片?
我們可以根據英偉達的命名規則,來大致推測其一款GPU芯片的主要應用方向。一般來說。名稱前綴帶GeForce的即主要應用于游戲等消費領域;名稱中沒有GeForce但有RTX、Quadro的,主要應用于專業設計領域,其中RTX表明GPU具備光追功能;名稱中沒有前述所有字樣,但直接以GPU架構開頭字母命名的,如A100(Ampere)、H100(Hopper)、L4(Ada Lovelace)、B200(Blackwell)則主要應用于數據中心。
從GPU性能對比來看,2023年底AMD發布的MI300X,在浮點運算能力方面曾短暫超過英偉達當時的*新產品H200。但在2024年英偉達Blackwell架構下的B200發布后,B200的低精度運算能力又反超AMD。在終端需求,由于大模型的訓練、推理往往以低精度運算為主,因此英偉達的*新GPU依然相較AMD有明顯優勢。此外,英偉達耗時十余年打造的CUDA軟件生態,也讓英偉達在軟件層面建立了獨特的護城河,大大提高了市場對其GPU產品的認可度。

數據來源:招銀國際、36氪整理
其中*典型的產品有兩款,一是英偉達利用多塊GPU構建的DGX系列服務器,以及多個DGX服務器組成的機架級服務器。二是可滿足客戶定制化需求的HGX服務器平臺。
英偉達映射的投資機會有哪些?
前文所述,我們提到當下大模型的快速迭代對算力支持提出了更高的要求,而英偉達在AI服務器方面的**優勢使得其對應業務呈現跨越式的擴張,同時,受益于行業前景樂觀預期疊加供不應求背景下公司業績的強確定性,2022年10月至今,英偉達股價也實現了超7倍的增長,不僅如此,與其數據中心業務相關的供應鏈公司,也同步實現了飛躍。
英偉達概念投資,主要是圍繞英偉達**產品如DGX GB200 SuperPod機架級液冷服務器等的產業鏈構成以及對應供應鏈公司展開。
從產業鏈構成上來看,我們常說的H100、A100實際上是GPU板卡,主要包括GPU芯片、HBM等電子元器件,在此基礎上,多個GPU+CPU+SSD組成AI服務器,多個AI服務器+交換機+機架,又組成服務器集群。
具體到AI服務器,根據提供的功能不同,可以分為計算、存儲、互聯接口、I/O、功率、固件和其它配套等板塊,具體又包括GPU、CPU、顯存HBM、DRAM、硬盤SSD+RAID、板內芯片互聯、服務器互聯、網卡、電源管理、BMS/BIOS、PCB、電源模塊、散熱模塊、其他元器件/線纜、代工等。
在各環節的BOM占比方面,以英偉達DGX A100系統為例,根據中金證券的數據,單環節價值量占比由高到低分別為GPU(48%)、代工(15%)、SSD(10%)、顯存HBM(9%)、DRAM(9%)、CPU(7%)、網卡(1%)、互聯接口(0.7%)、PCB(0.6%)、散熱(0.3%)、電源模塊(0.3%)、其他元器件(0.1%)、電源管理(0.09%)、BIOS/BMS(0.02%)。
考慮到DGX B200系統在內部采用了銅纜連接,并配合液冷系統,因此,相對DGX100而言,預計銅纜、散熱模塊的價值量有望提升。根據市場數據,預計銅纜在單服務器的BOM占比有望達到5-7%。
具體到各環節的公司構成上,詳細數據在下邊逐一展開:
|?GPU
GPU芯片產業鏈上中下游分別為芯片設計、芯片制造及芯片封裝與測試。
英偉達處于上游的芯片設計環節,在中下游的芯片制造環節,臺積電憑借先進的4nm、7nm工藝及CoWoS封裝技術,成為英偉達GPU芯片制造,以及GPU芯片+HBM封裝的主要廠家。
|?CPU
AI服務器中,CPU同樣是不可或缺的芯片。
如果說GPU的主要功能是運算,那么CPU就是控制GPU運算的的“大腦”。例如,英偉達DGX H100中就包括2塊CPU和8塊GPU芯片。
此前,英偉達DGX H100服務器中曾采用英特爾的CPU,但在其*新發布的GB200超級GPU上,英偉達采用了自研的Grace CPU。另外,英偉達發布的DGX B200和DGX GB200服務器中,還搭載了專用于加速計算的DPU芯片。
目前,顯存主要包括GDDR、HBM(高帶寬存儲器)兩種類型,由于HBM擁有高帶寬優勢,因此成為英偉達中高端數據中心GPU(如A100、H100、H200)的標配。
HBM是一款新型的高帶寬、高附加值DRAM產品。憑借獨特的TSV信號縱向連接技術,HBM內部將數個DRAM芯片在緩沖芯片上進行立體堆疊,其內部堆疊的DDR層數可達4層、8層以至12層,從而形成大容量、高位寬的DDR組合陣列。
除此之外,HBM堆棧不通過外部互連線的方式與GPU/CPU/Soc連接,而是通過中間介質層緊湊快速地連接信號處理器芯片。HBM通過3D堆疊多層DDR提供海量并行處理能力、通過集成型HBM提供極高的存儲器帶寬,并使得數據參數距離核心計算單元更近,從而有效降低數據搬運的延遲和功耗。在系統集成方面,HBM將原本在PCB板上的DDR內存顆粒和計算芯片一起集成到SiP,有效利用空間、縮小面積。
以英偉達A100 80GB配置4或8張GPU卡來計算,其HBM用量約為320-640GB,根據SK海力士預計,中長期內HBM需求的年增長率將達到約60%。不過,目前供給層面HBM幾乎被海力士、三星、美光三家企業壟斷,其中,SK海力士是英偉達HBM第一大供應商,而香農芯創等則通過供貨SK海力士間接綁定英偉達。
|?SSD
AI服務器中,SSD是繼顯存外的另一大儲存芯片。值得注意的是,HBM是DRAM,類似于手機俗稱的運存,適用于短期儲存,而SSD是NAND,類似于手機俗稱的內存,適用于長期儲存。
SSD上游參與者主要包括閃存芯片、主控芯片廠商,中下游則主要為模組廠商。
一般來說,IDM廠商(又稱原廠)不僅掌握核心閃存芯片的設計,還可以一體化完成SSD所有設計和生產流程,在SSD和SSD主控芯片領域都占有主導地位。模組廠商則主要做組裝,部分模組廠商也在拓展主控芯片技術。
從行業格局來看,SSD實際上與HBM類似,海力士和三星同樣占據較高的市場份額。
|?互聯接口:芯片互聯和服務器互聯
AI算力的提升方式,除了依靠單GPU性能升級外,還需要高速的芯片互聯技術、系統互聯技術作為支撐,從而提升GPU算力的可擴展性,形成強大的集群算力。
就英偉達而言,目前使用的互聯技術主要包括:PCIe Switch、NVLink、NVSwitch等。
PCIe的特點是兼容性強,主要應用于不同制造商和設備類型之間的高效通信。目前,PCIe技術已經發展至第六代,且第七代標準已于2024年公布,預計將在2025年正式推行。民生證券統計,PCIe Switch核心的芯片技術,主要被博通、微芯科技和祥碩科技三家壟斷,合計占有全球約58%的份額,國內僅邊緣智芯等上市企業擁有相關技術。
此外,為了解決PCIe總線的信號衰減問題,PCIe Retimer芯片作為為信號中繼器,需求量也越來越高。目前,全球量產PCIe 5.0 Retimer芯片的企業主要是兩家,除了瀾起之外,另一家是Astera Labs。
英偉達自研的NVLink是一種高速、低延遲的互聯技術,旨在連接多個GPU以實現高性能并行計算。與傳統的PCIe總線相比,NVLink提供了更高的帶寬和更低的延遲,使得GPU之間可以更加高效地共享數據和通信。目前*新的第五代NVLink下,單個Blackwell架構的GPU可實現1.8TB/s的傳輸帶寬,超過PCle Gen 5.0帶寬的14倍。
此外,英偉達自研的NVLink-C2C技術,還支持定制裸片與英偉達GPU、CPU、DPU、NIC和SOC之間的互聯,其GB200超級芯片中,CPU與GPU的連接即采用了該技術。
而只要提及NVLink,NVSwitch也會伴隨出現,那么二者到底是什么關系?
NVIDIA中國區工程及解決方案總監賴俊杰在官方社區中指出,NVLink可以認為是一個網線,NVSwitch認為是交換機,但NVSwitch并不是一般意義上網絡交換的設備,NVLink由一些差分的信號線所構成,然后NVSwitch可以接多個NVLink的端口,內部通過跨組完成數據在多個端口的轉發。
以GB200 NVL72為例,目前英偉達使用了定制化的銅纜實現機柜內9個NV Switch和18個計算節點的NVLink連接。英偉達介紹NVIDIA GB200 NVL72可以在一個NVLink domain內連接576個GPU,總帶寬超過1PB/S和240TB的閃存。而*大的變化是NV Switch從服務器PCB板載芯片的形式調整為機柜內的9臺交換機,連接能力提升至72個GPU,這就需要使用銅纜實現機柜內的NVLink連接。
|?網卡
服務器通過網卡與交換機互聯,將數據流通過數據幀交換方式傳輸到目的地。網絡互聯技術包括以太網、InfiniBand和Omnipath等。其中InfiniBand憑借高帶寬、低延時的優勢在AI數據中心和AI服務器中廣泛應用。
目前InfiniBand產品為英偉達旗下Mellanox生產的HDR,可以提供端到端200Gbps帶寬,英偉達相關服務器使用的網卡均為Mellanox產品。
|?PCB
PCB是顯卡以及服務器中起支撐作用的不可或缺部件,一向有“電子產品之母”的稱號。按產品類型劃分,主要分為單/雙面板、多層板、HDI、柔性板、IC 載板等,上游原材料主要包括覆銅板(CCL)、銅箔、半固化片及油墨等。
GPU中使用的PCB一般是多層數的高端PCB,主要應用于服務器CPU、主板、電源背板、硬盤背板、網卡以及Riser卡等部分。平安證券統計,隨著當前服務器平臺持續迭代,對于服務器PCB層數以及材料的要求也越來越高,PCB所需層數不僅從Purley平臺的10-12層提升至Eagle Stream的14-20層,而且用料方面也要對CCL損耗等級有著更高的要求,相應帶來單機PCB價值量的提升。
目前,我國在全球PCB市場的份額超過50%。國金證券指出,從格局上來看,大陸PCB廠商因配合國內服務器廠商研發和供應,已經在全球服務器PCB競爭中占有一席之地。
|?散熱模塊
服務器散熱系統的作用是將服務器內部產生的熱量以及外界傳遞的熱量吸收并發散到機柜之外,從而保證內部集成電路的正常溫度,防止高溫損傷。主流散熱技術包括風冷和液冷兩大類。
人工智能的快速發展帶來了大量的算力和機柜需求。但受限于數據中心建設面積及環保要求,傳統風冷越來越難以滿足散熱需求,需要液冷的不斷升級彌補。在(1)芯片單點冷卻方面:芯片功率密度的不斷提升直接影響著芯片的散熱和可靠性,逼近風冷散熱上限800W左右,而液冷能有效滿足芯片的散熱需求;(2)機柜整體冷卻方面:芯片功率的增加也導致整機柜功率的增長,采用傳統風冷的數據中心通常可以解決12kW以內的機柜制冷。隨著服務器單位功耗增大,同樣尺寸的普通服務器機柜可容納的服務器功率往往超過15kW,相對于現有的風冷數據中心,已逼近空氣對流散熱能力天花板,液冷或將成為*佳選擇。
目前英偉達DGX GB200服務器使用的就是液冷技術。
|?光模塊
目前,英偉達用第五代NVLink和第四代NVSwitch構建多層NVLink網絡,實現576個GPU的直接互聯和共同訪存。在這種互聯方案中,GPU與機柜內部NVSwitch之間采用銅纜連接,而不同層級的NVSwitch之間則仍然采用光互聯,因此光模塊的數量仍然是穩中有升的。
根據SemiAnalysis的測算,鑒于DGX GB200 NVL72擁有72個OSFP端口,每個端口對應于1個400G或800G光模塊,隨著GB200數量的增加,網絡拓撲結構發生變化,*終GB200對應于800G光模塊的數量關系將介于1:2.5到1:3.5之間。
|?交換機
如果將多臺DGX服務器組合成為一個集群,那么就需要用到交換機。
交換機是用于電光信號轉發的網絡設備,可以為接入交換機的任意兩個網絡節點提供獨享的電信號通路。例如,英偉達DGX H100 SuperPOD中就包含32臺服務器,以及12臺交換機。
2019和2020年,英偉達相繼收購交換機企業Mellanox和Cumulus,親自下場生產交換機產品。從硬件結構來看,交換機由機殼、電源、風扇、背板、管理引擎、系統控制器、交換模塊、線卡構成。
目前,在交換機板塊,英偉達主要是使用了自研的Spectrum-X800以太網交換機。
|?ODM代工
在ODM/OEM代工方面,鴻海精密目前是英偉達AI服務器*主要的代工廠商,同時也是英偉達AI服務器芯片基板*大供應商(超50%),也是英偉達*新的GH200芯片模組唯一的供應商,主要通過旗下工業富聯和鴻佰科技進行AI服務器業務,同時,緯創、超微電腦等也有合作。
|?其他合作商
除了以上核心環節的供應鏈公司外,部分A股上市公司通過其他合作方式也進入了英偉達概念名單。例如,在算力合作方面,鴻博股份、浪潮信息均有合作;在境內智算場景方面,順網科技與英偉達有合作;千方科技子公司則與英偉達聯合開發服務器;中電港則是英偉達的授權分銷商;鼎陽科技為英偉達提供電子測試測量儀器。