Nvidia Grace CPU,在數據中心的晶片之戰

在YouTube上用了兩個小時,看完Nvidia 2021年4月GTC片第二次,開始漸漸明白更多Nvidia的產品佈局。

數據中心繼續成為晶片的戰場。

Intel一直是數據中心晶片的龍頭,CPU有市佔約九成。

Nvidia會推出ARM架構CPU Grace去迎戰Intel x86 CPU。 

* * * * *

數據中心的晶片:

  • 以往Intel CPU一直成為主導。

  • 過去幾年,回應AI運算的需求,Nvidia成功令到Intel CPU + Nvidia GPU成為一個組合式配套,做到分工,讓GPU去有效處理AI Training和Inferencing,CPU繼續處理其他大部分的主要運算。
  • 2020年10月GTC上公佈Intel CPU + Nvidia GPU + Nvidia DPU成為一個新的模式,基於Data Centric(Data為中心主導)的概念,利用DPU更有效去處理底層的Infrastructure相關工作,令到CPU的運算能力的焦點回到執行Application。這個加入DPU組合是否可以很成功,暫時未有很多銷售數字,有待觀察。
  • 2021年4月Nvidia GTC,公佈新產品能提供Nvidia CPU + Nvidia GPU + Nvidia DPU成為一個新的組合,把Intel CPU踢走,提高整體效能,回應越來越大的AI運算需求。

(參考:NVIDIA 數據中心市場產品 - BLUEFIELD 2 / 2X DPU DATA PROCESSING UNIT

引致問題的樽頸

隨著AI運算的強勁增長,使用更高速的GPU和更多的Memory。

樽頸位在於Intel x86 CPU使用PCIE的Memory Bandwidth只得16GB/sec,CPU有200GB/sec,GPU有8000GB/sec。

Nvidia有NVLINK可以大幅提高Memory Bandwidth,但是Intel x86 CPU不支援NVLINK。

當市場沒有如此解決方案,Nvidia就自己去製造出來。

Nvidia Grace CPU解決方案

Nvidia推出Grace CPU(取名來自Grace Murray Hopper (1906-1992),美國海軍准將及電腦科學家,是50年代Programming的先鋒,是最早的女性Programmer之一),是ARM架構CPU,專門用作涉及大量數據的加速運算,例如AI,

NVLINK的Memory Bandwidth有500GB/sec(對比PCIE只有16GB/sec),CPU有500GB/sec,GPU有8000GB/sec,CPU和NVLINK很合適地配合起來。

把現今450 SPECint rate提高至2400 SPECint rate,提升至5.3倍。

主打目標是Data Center的AI運算,那個Data Center不需要AI運算?

瑞士Super Computer ALPS

瑞士Super National Supercomputing Center計劃建造Supercomputer ALPS,使用Nvidia Grace CPU和下一代Nvidia GPU,預計2023年完成。用途包括:天氣及氣候模擬,量子化學,量子物理學(應用在Large Hadron Collider大型強子對撞機)。

處理AI運算速度20 exaflops,比較現在最快的Supercomputer快上十倍。

CPU + GPU + DPU Roadmap路線圖

Nvidia的晶片Roadmap路線圖,CPU + GPU + DPU是三線並行,如果使用此組合,可預見未來每年有個別晶片upgrade而得益。

關於ARM架構CPU的提醒

Jensen在GTC中再次強調,ARM是現在最流行的CPU架橫,做到極度省電,IP授權的Open Licensing Model可以啓發設計者造出更創新產品,Nvidia Grace CPU是一個很好的例子。ARM正在由原本已經佔據的手機和嵌入式設備,進軍Cloud / Enterprise /Edge Data Center / Super Computing / PC,這些都是Nvidia正在有提供産品和服務的市場,相信有助加速這些市場去採用ARM架構CPU。

結語

在個人電腦和伺服器,Intel靠着x86架構CPU成為維持公司業務的引擎,x86架構CPU是Intel的資產,同時都是一種包袱,Intel在最新的計劃之中見不到任何ARM架構CPU的部處,AMD在x86架構CPU上不斷打撃Intel去搶市佔,。

Nvidia所做的,不只是加大number of cores和運算速度。

Nvidia的強大在於有能力去重新建構(Re-architecture),不是跟隨現有的運算模式去優化,從GPU由圖像處理轉型去AI運算,到DPU去解決Data Centric的困難,到Grace CPU去處理大型數據的加速運算如AI,不斷造出創新的產品解決方案。

Arm架構CPU對撼x86架構CPU,戰況必定越演越烈,相信ARM和Nvidia都是得益的公司。(Nvidia的代工訂單可能落入台積電的手中)


參考文章

NVIDIA GTC (2021/4月) 總結,未來的產品佈局

NVIDIA DGX SUPERPOD,AI 超級電腦成為一件可接觸的產品

NVIDIA DRIVE AV (AUTONOMOUS VEHICLE) 自動架駛,增長賽道就在前面

NVIDIA OMNIVERSE,一個指向 METAVERSE 元宇宙的實現

NVIDIA TAO,不只是一間晶片公司的AI 競爭優勢

NVIDIA 數據中心市場產品 - BLUEFIELD 2 / 2X DPU DATA PROCESSING UNIT

NVIDIA 收購 ARM 的跟進 - ARM DEV SUMMIT 2020

NVIDIA 收購 ARM,背後想甚麽

NVIDIA : I AM AI

半導體系列 (3) 半導體行業的改朝換代

半導體系列 (2) 半導體時代,這次不一樣,THIS TIME IS DIFFERENT ?

半導體系列 (1) 半導體產業鏈

Comments