Nvidia Grace CPU，在數據中心的晶片之戰

June 26, 2021

Nvidia Grace CPU，在數據中心的晶片之戰

在YouTube上用了兩個小時，看完Nvidia 2021年4月GTC片第二次，開始漸漸明白更多Nvidia的產品佈局。

數據中心繼續成為晶片的戰場。

Intel一直是數據中心晶片的龍頭，CPU有市佔約九成。

Nvidia會推出ARM架構CPU Grace去迎戰Intel x86 CPU。

* * * * *

數據中心的晶片：

以往Intel CPU一直成為主導。

過去幾年，回應AI運算的需求，Nvidia成功令到Intel CPU + Nvidia GPU成為一個組合式配套，做到分工，讓GPU去有效處理AI Training和Inferencing，CPU繼續處理其他大部分的主要運算。

2020年10月GTC上公佈Intel CPU + Nvidia GPU + Nvidia DPU成為一個新的模式，基於Data Centric（Data為中心主導）的概念，利用DPU更有效去處理底層的Infrastructure相關工作，令到CPU的運算能力的焦點回到執行Application。這個加入DPU組合是否可以很成功，暫時未有很多銷售數字，有待觀察。

2021年4月Nvidia GTC，公佈新產品能提供Nvidia CPU + Nvidia GPU + Nvidia DPU成為一個新的組合，把Intel CPU踢走，提高整體效能，回應越來越大的AI運算需求。

（參考：NVIDIA 數據中心市場產品 - BLUEFIELD 2 / 2X DPU DATA PROCESSING UNIT）

引致問題的樽頸

隨著AI運算的強勁增長，使用更高速的GPU和更多的Memory。

樽頸位在於Intel x86 CPU使用PCIE的Memory Bandwidth只得16GB/sec，CPU有200GB/sec，GPU有8000GB/sec。

Nvidia有NVLINK可以大幅提高Memory Bandwidth，但是Intel x86 CPU不支援NVLINK。

當市場沒有如此解決方案，Nvidia就自己去製造出來。

Nvidia Grace CPU解決方案

Nvidia推出Grace CPU（取名來自Grace Murray Hopper （1906-1992），美國海軍准將及電腦科學家，是50年代Programming的先鋒，是最早的女性Programmer之一），是ARM架構CPU，專門用作涉及大量數據的加速運算，例如AI，

NVLINK的Memory Bandwidth有500GB/sec（對比PCIE只有16GB/sec），CPU有500GB/sec，GPU有8000GB/sec，CPU和NVLINK很合適地配合起來。

把現今450 SPECint rate提高至2400 SPECint rate，提升至5.3倍。

主打目標是Data Center的AI運算，那個Data Center不需要AI運算？

瑞士Super Computer ALPS

瑞士Super National Supercomputing Center計劃建造Supercomputer ALPS，使用Nvidia Grace CPU和下一代Nvidia GPU，預計2023年完成。用途包括：天氣及氣候模擬，量子化學，量子物理學（應用在Large Hadron Collider大型強子對撞機）。

處理AI運算速度20 exaflops，比較現在最快的Supercomputer快上十倍。

CPU + GPU + DPU Roadmap路線圖

Nvidia的晶片Roadmap路線圖，CPU + GPU + DPU是三線並行，如果使用此組合，可預見未來每年有個別晶片upgrade而得益。

關於ARM架構CPU的提醒

Jensen在GTC中再次強調，ARM是現在最流行的CPU架橫，做到極度省電，IP授權的Open Licensing Model可以啓發設計者造出更創新產品，Nvidia Grace CPU是一個很好的例子。ARM正在由原本已經佔據的手機和嵌入式設備，進軍Cloud / Enterprise /Edge Data Center / Super Computing / PC，這些都是Nvidia正在有提供産品和服務的市場，相信有助加速這些市場去採用ARM架構CPU。

結語

在個人電腦和伺服器，Intel靠着x86架構CPU成為維持公司業務的引擎，x86架構CPU是Intel的資產，同時都是一種包袱，Intel在最新的計劃之中見不到任何ARM架構CPU的部處，AMD在x86架構CPU上不斷打撃Intel去搶市佔，。

Nvidia所做的，不只是加大number of cores和運算速度。

Nvidia的強大在於有能力去重新建構（Re-architecture），不是跟隨現有的運算模式去優化，從GPU由圖像處理轉型去AI運算，到DPU去解決Data Centric的困難，到Grace CPU去處理大型數據的加速運算如AI，不斷造出創新的產品解決方案。

Arm架構CPU對撼x86架構CPU，戰況必定越演越烈，相信ARM和Nvidia都是得益的公司。（Nvidia的代工訂單可能落入台積電的手中）

參考文章

NVIDIA GTC (2021/4月) 總結，未來的產品佈局

NVIDIA DGX SUPERPOD，AI 超級電腦成為一件可接觸的產品

NVIDIA DRIVE AV (AUTONOMOUS VEHICLE) 自動架駛，增長賽道就在前面

NVIDIA OMNIVERSE，一個指向 METAVERSE 元宇宙的實現

NVIDIA TAO，不只是一間晶片公司的AI 競爭優勢

NVIDIA 數據中心市場產品 - BLUEFIELD 2 / 2X DPU DATA PROCESSING UNIT