黃仁勳的深夜秀帶來超強生成式AI處理器,AIGC迎來iPhone時刻


美國西部時間8月8日早晨,北京時間8日晚間,NVIDIA(英偉達)創始人兼CEO,“皮衣教主”黃仁勳在加州洛杉磯舉辦的“2023年世界電腦圖形會議”(SIGGRAPH 2023)上,穿著自己那標誌性的皮衣,開場先回顧了英偉達歷史上的高光時刻,“20年前我們推出了RTX顯卡,5年前我們將圖形計算與AI結合,推出了《星戰》Demo。”

僅僅幾分鐘後,黃仁勳的演講,就從3D圖形過渡到AI上了。作為AI 2.0浪潮中極具存在感的人物,黃仁勳為普及生成式AI提供了一系列堪稱“生猛”的硬件,以及非常智能的應用和平台。當天的表演現場,黃仁勳又帶來了新貨:用於生成式AI的GH200 Grace Hopper超級芯片、NVIDIA AI Workbench以及通過生成式AI和OpenUSD升級的NVIDIA Omniverse。同時,黃仁勳還宣布英偉達與世界頂級AI開源社區Hugging Face展開合作,將把生成式AI必備的超級計算能力交付給全球數百萬開發者,為他們構建大模型和AI應用提供支持。

在演講的同時,黃仁勳依然堅持自己金牌銷售的本色:“還是那句話,買的越多,省的越多。”

一、最強AI超算更上一層樓,“核彈工廠”即將上線

發布會上,黃仁勳感慨“生成式AI時代的來臨,就像十幾年前的iPhone時刻一樣。”在五年前的SIGGRAPH上,英偉達通過將AI和實時光線追踪技術引入GPU,重新定義了電腦圖形學。五年後的黃仁勳表示:“當我們通過AI重新定義電腦圖形學時,我們也在為AI重新定義GPU。”結果就是二者的“雙向奔赴”催生了越來越強大的系統,例如NVIDIA HGX H100 ,利用八個GPU,總計一萬億個晶體管,提供的加速計算能力比基於CPU的系統更顯著。

五年已經過去,為了繼續推動AI的發展,英偉達這次帶來了Grace Hopper超級芯片,即NVIDIA GH200,將72核的Grace CPU與Hopper GPU相結合,提供一億次每秒浮點運算(FLOPS )的強大算力和最大144TB的高速存儲,在全球最快內存HBM3e的輔助下,內存容量高達141GB,提供每秒5TB的帶寬。其單個GPU的容量就已達到H100 GPU的1.7倍,帶寬達到H100的1.55倍,並已於年五月全面投產。

如果你以為新款芯片僅僅是性能強大那顯然是管中窺豹,以偏概全了。它真正值得稱道的是可擴展性,用“誇張到瘋狂”形容都不過分。 GH200 Grace Hopper超級芯片作為平台,同時連接多個GPU,用於處理複雜的生成式工作負載,包括大模型、推薦系統和矢量數據庫。據黃仁勳介紹,與前代相比,新產品雙配置的內存容量是之前的3.5倍,帶寬是之前的3倍,服務器配備144個Arm Neoverse核心和高達282GB的最新HBM3e內存技術,AI性能支持每秒進行八千萬億次的數學運算。同時黃仁勳也預計,明年第二季度將有客戶基於該平台推出自己的系統。

GH200 Grace Hopper超級芯片的實體圖,中間黑影即黃仁勳

黃仁勳在現場拋出一個問題:“花一億美元能買什麼?”隨後他自問自答的表示,過去一億美元能買8800塊x86 CPU組成的數據中心,功耗大約是5MW。現在一億美元能買2500塊GH200組成的Iso-Budget數據中心,功耗大約是3MW,而AI推理性能達到之前系統的12倍,能效則是20倍。如果要與x86 CPU數據中心的AI推理性能看齊,Iso-Troughput數據中心只需用到210塊GH200,功耗約0.26MW,成本約800萬美元,還不到CPU數據中心的10%。

至此就可以明白了為什麼黃仁勳一再強調“買的越多,省的越多”。

二、刀法精準,四款顯卡齊上新

與GH200 Grace Hopper超級芯片同步上新的還有桌面AI工作站GPU系列,而且是一口氣推出四款新品:RTX 4000、RTX 4500、RTX 5000和RTX 6000。與GH200那種展示英偉達GPU技術和性能天花板的產品不同,這四款就是針對桌面和數據中心推出的,特別是成本預算有限的客戶。

毋庸置疑的,作為旗艦級專業卡,RTX 6000的性能參數是四款中的最強者。憑藉著48GB的顯存,18176個CUDA核心,568個Tensor核心,142個RT核心,和高達960GB/s的帶寬,它的表現在四者裡堪稱一騎絕塵。以此為基準逐步降低的,RTX 5000配備了32GB顯存,12800個CUDA核心,400個Tensor核心,100個RT核心。 RTX 4500配備了24GB顯存,7680個CUDA核心,240個Tensor核心,60個RT核心。 RTX 4000配備了20GB顯存,6144個CUDA核心,192個Tensor核心,48個RT核心。

所有四款新品均採用4nm定制工藝,支持錯誤代碼糾正,適用於大型3D模型、渲染圖像、模擬和AI數據集的無誤差計算。同時還支持高分辨率AR和VR設備,以提供創造AR、VR和MR內容所需的高性能圖形。

同時基於此四款新品,黃仁勳還針對企業級客戶準備了一套一站式解決方案–RTX Workstation,支持最多4張RTX 6000 GPU並聯,可以在15小時內完成8.6億token的GPT3-40B的微調任務,還能讓Stable Diffusion XL每分鐘生成40張圖片,比之前的RTX 4090快五倍。該工作站系統將於秋季開始提供。

三、攜手Hugging Face,普惠AIGC與大模型

除了這些炸裂級硬件產品外,黃仁勳還公佈了三則關於英偉達與優化生成式AI的消息,這些將有助於加速行業採用基於LLM的生成式AI:1.英偉達和全球最大AI開源社區Hugging Face建立合作;2.推出NVIDIA AI Enterprise 4.0系統,把DGX Cloud中的所有功能集成到英偉達AI Enterprise軟件中;3.推出NVIDIA AI Workbench,將需要用於生成式AI工作的一切都打包在一起,只用點擊一下就能將這個項目移動到任何設備終端或云端。下面分開來說。

1、與Hugging Face合作:將全球數百萬開發人員連接到生成式AI超級計算平台上。黃仁勳宣布,英偉達和Hugging Face建立合作夥伴關係,將為構建大模型和其他AI應用程序的開發人員提供生成式AI所需的超級算力。開發者可以訪問Hugging Face平台內的NVIDIA DGX Cloud AI超級計算平台,來訓練和微調自己的大模型。 DGX Cloud的每個實例有八個NVIDIA H100或A100 80GB Tensor Core GPU,每個節點的GPU內存總計640GB。作為合作的一部分,Hugging Face將推出一項名為“訓練集群即服務”的業務支出,以簡化企業創建新的和自定義生成式大模型的流程。該服務由NVIDIA DGX Cloud提供支持,將在未來幾個月內推出。

2、NVIDIA AI Workbench:在筆記本電腦上也能輕鬆啟動生成式AI項目。這是個統一、易用的工作空間,能讓開發者隨處構建或運行自己的大模型。開發者可以很方便地將所有必要的模型、框架、數據庫和SDK等素材,從開源代碼庫和NVIDIA AI平台打包到這個統一的開發者工作空間中,然後只需點擊鼠標,就能將自己的大模型從一個位置移動到另一個位置。這樣就能在PC、筆記本或工作站上快速創建、測試和定制預訓練的大模型,並在需要時將其擴展到數據中心、公有云或NVIDIA DGX Cloud。舉個例子,你可以在NVIDIA AI Workbench頁面上導入項目,比如導入SDXL-dev文生圖模型,輸入“黃仁勳在太空”,結果因為模型似乎不認識老黃,生成的圖像跟老黃的形像不能說完全一致,起碼也是離的挺遠,皮衣倒是一脈相承。

3、NVIDIA AI enterprise 4.0:提供一系列生成式AI工具最新版的企業軟件平台。 AI enterprise 4.0可提供生產就緒型生成式AI工具,並保證可靠的生產部署所需的安全性和API穩定性。 AI Enterprise 4.0支持的軟件和工具有助於簡化生成式AI部署,其中一大亮點是引入用於構建、定制和部署大模型的雲原生框架NVIDIA NeMo。其他工具還包括NVIDIA Triton管理服務,通過模型編排實現可擴展AI高效運行;NVIDIA Base Command Manager Essentials集群管理軟件,幫助企業在數據中心、多雲和混合雲環境中最大限度提高AI服務器性能和利用率等。 AI Enterprise軟件支持用戶跨雲、數據中心和邊緣構建和運行支持NVIDIA AI的解決方案,經認證可在主流NVIDIA認證系統、NVIDIA DGX系統、所有主要雲平台和新發布的NVIDIA RTX上運行工作站。最新版本的企業軟件平台將集成到谷歌云、微軟Azure、Oracle雲基礎設施等NVIDIA合作夥伴市場。

四、從OpenUSD到ChatUSD,以及通過對話生成3D內容

本週,英偉達與蘋果、Adobe和Autodesk等企業聯手成立OpenUSD聯盟,正在努力將它推向更廣闊的世界。 OpenUSD(Universal Scene Description)提供了一個開源,通用的場景描述格式,使不同品牌與類型的3D設計軟件可以無障礙的彼此協作。因為英偉達自家的Omnivers就是建立在USD體系之上的,這次Omniverse針對OpenUSD的升級,使Omniverse能為開發者與企業推出了更多的框架和資源服務。

而將OpenUSD、AI以及Omniverse結合,開發者將能通過ChatUSD這樣的對話式界面,直接用自然語言修改和創建3D環境及物體,極大簡化3D內容的製作流程。 OpenUSD將推動標準化進程並逐步擴展,這是開源的通用場景描述框架,以及實現互操作性的3D應用程序和項目的基礎,涵蓋從視覺效果到工業數字孿生的各個領域,如連接電影和動畫流程,創建真實精確的實時數字工廠、倉庫、城市甚至是地球的數字副本。

通過OpenUSD,不同的工具可以同時使用同樣的素材和場景

在強大AI的推動下,協作式3D和工業數字化的時代正在到來。黃仁勳還表示未來的工廠將是機器人工廠,“機器人協調一大堆機器人來製造本身就是機器人的汽車”,“我們希望AI能夠進行自我編程”,“未來,整個工廠將由軟件定義。”

在剛剛過去的昨天,英偉達再次用爆炸級的產品,驚人的技術實力,高瞻遠矚的目光,讓全世界再次看到它將如何引領全球AI和圖形計算的新浪潮。在再次重複經典名言“買的越多,省的越多”後,黃仁勳緩緩走下舞台,卻把現場氣氛推向了極致。

資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載

Total
0
Shares
Related Posts