在近期舉辦的 Google Cloud Next 大會上,谷歌云服務(wù)部門 Google Cloud 宣布推出一款全新的 A5X 裸金屬實例,該實例由 NVIDIA 的 Vera Rubin 機架級系統(tǒng)提供強大動力支持。
裸金屬服務(wù)器,簡單來說就是云上的物理服務(wù)器,它具有資源獨立的特點,不存在虛擬化開銷,也不會出現(xiàn)性能損失,能夠為用戶提供更穩(wěn)定、高效的計算環(huán)境。此次推出的 A5X 裸金屬實例,在硬件配置上堪稱豪華。
它采用了英偉達的 ConnectX - 9 SuperNIC 以及谷歌最新的 Virgo Network 超大規(guī)模擴展型 AI 數(shù)據(jù)中心架構(gòu)。這種強大的硬件組合,使得 A5X 在集群擴展能力上表現(xiàn)卓越。在單站點集群中,它能夠擴展至多達 8 萬個 Rubin GPU;而在多站點集群中,更是可以支持多達 96 萬個 GPU。如此強大的擴展能力,能夠充分滿足客戶運行超大規(guī)模 AI 工作負載的需求。
Google Cloud AI 和計算基礎(chǔ)設(shè)施副總裁兼總經(jīng)理 Mark Lohmeyer 表達了對 AI 未來發(fā)展的看法。他指出,在 Google Cloud 看來,未來十年 AI 的發(fā)展走向,將取決于客戶能否在真正集成且經(jīng)過 AI 優(yōu)化的基礎(chǔ)設(shè)施堆棧上,運行那些對性能要求極高的工作負載。
他還強調(diào),此次 Google Cloud 與 NVIDIA 的合作意義重大。通過將 Google Cloud 可擴展的基礎(chǔ)設(shè)施和托管 AI 服務(wù),與 NVIDIA 先進的平臺、系統(tǒng)和軟件相結(jié)合,能夠為客戶帶來極大的靈活性。無論是訓(xùn)練前沿模型、開放模型,還是部署智能體和物理 AI 工作負載等各種場景,客戶都可以根據(jù)自身需求進行選擇,同時還能在性能、成本和可持續(xù)性方面實現(xiàn)優(yōu)化。





















