來源:鈦媒體App,作者|林志佳
隨著AI 聊天機器模型ChatGPT全球爆火,其背後核心的AI 算力“大腦”、全球第五大科技股英偉達(NASDAQ: NVDA)開始展示成為AI 領域核“芯”的基礎設施技術能力。
北京時間3月21日晚GTC開發者大會上,黃仁勳在76分鐘內發布英偉達最新芯片、超算服務與合作,其中有一半以上跟ChatGPT和生成式AI 有關。
具體包括,搭載8個A100 GPU層的AI 超算雲服務DGX Cloud,每月3.7萬美元在互聯網上訓練ChatGPT;目前云上唯一處理ChatGPT的GPU HGX A100,計算效率比前代提高超10倍;芯片計算光刻軟件庫cuLitho,讓ASML光刻計算提速40倍;首個GPU加速的量子計算系統Quantum Machines;以及與比亞迪開發軟件定義汽車方案、與亞馬遜AWS合作開發訓練大模型和構建生成性AI 應用等。
“我現在正在看著你們所有人。很高興見到你們所有人,看起來棒極了,”北京時間3月22日早上8點左右,60歲的黃仁勳精神抖擻地站在顯示器前面,通過線上會議方式悉數解答亞太媒體對於英偉達的疑問和困惑,“我凌晨4:00 起床,所以如果你不累,我也不累”。這是過去三年疫情下,中國媒體與遠在美國的黃仁勳討論英偉達的最佳時機。
“老黃是個狠人”,這是鈦媒體App聽到接近黃仁勳人士對其最直接的評價,因為很多英偉達合作事務都是黃仁勳親力親為。他笑著說沒有很快退休的計劃,而是希望再領導英偉達30到40年,直到90歲左右,屆時會以機器人的形式繼續工作。
過去近30年,在黃仁勳帶領下,英偉達從一家以設計和銷售GPU(圖形處理器)芯片的半導體公司,如今已經成長為人工智能(AI)加速算力軟硬件一體方案的技術公司。
“加速計算並非易事。2012年,計算機視覺模型AlexNet動用了英偉達GeForce GTX 580,每秒可處理262 PetaFLOPS。該模型引發了AI技術的爆炸,”黃仁勳說道,“十年之後,Transformer出現了,GPT-3動用了323 ZettaFLOPS算力,是AlexNet的100 萬倍,創造了ChatGPT這個震驚全世界的AI。”
“AI 的iPhone 時刻已經來臨。”黃仁勳最近反复在提這句話,他認為生成式AI 將重塑幾乎所有行業——由於ChatGPT模型背後算力成本超過400萬美元,在這場大模型軍備競賽中,手握A100和H100的“軍火商”英偉達,或已成最大贏家。據花旗預估,ChatGPT或將促使英偉達一年內銷售額增長100億美元。
AI 的算力繁榮,推動英偉達股價在2023年上漲了77%,黃仁勳的財富同期增長超過60億美元。
目前,英偉達市值為6471億美元(約合人民幣4.45萬億元),已是英特爾市值的近五倍,同時是A股第一股貴州茅台(600519.SH)的兩倍以上,而且比特斯拉市值還高220億美元(約合1514億元)。
不過今天發布會表明,英偉達的腳步還沒有停,其正在向AI 超算雲與基礎設施的定位進發。
英偉達市值狂飆的底氣在哪?
“I AM AI,”這是每年GTC 大會宣傳片中反复提及的關鍵詞。如果你細品這句話,可以明顯感知英偉達不止是芯片設計公司,而是AI 技術基礎設施。
英偉達是地球上最昂貴的科技股之一,公認會計原則下市盈率139倍,賬面價值27倍。鈦媒體App梳理數據發現,過去一年內,英偉達收入增長率為0.22%,收益增長率為-54%,而且最近兩個季度營收出現下跌,預計今年第一季度營收也會同比下跌——這與其股價暴增趨勢並不相符。
那麼,為什麼英偉達這樣一家昂貴的公司,還會被市場看好?
就目前來看,英偉達很主要、明顯的機會因素是AI 算力需求增長,以及其長期穩定的AI 加速芯片市場競爭與部分壟斷地位。
此次GTC大會能窺豹一斑。今年,黃仁勳GTC開幕演講主要談四類新品:ChatGPT專用GPU、給台積電核彈的計算光刻數據庫、為AIGC 設計專用算力的系統方案、首個GPU 加速的量子計算系統。
自從ChatGPT推出並在60天實現超過1 億月活用戶以來,從創業者到投資人,從大學教授到科技部部長,都在討論這個產品。在這其中,作為AI 服務器芯片銷售方,英偉達“贏麻了”,其在AI 數據中心GPU領域幾乎沒有競爭,控制著90%的市場。據Similarweb數據,ChatGPT可能需要602台DGX A100服務器能夠滿足當前的訪問量。
但問題在於,創造ChatGPT的美國OpenAI 公司,開發的GPT-3模型參數量高達1750億,其需要的瞬時算力很高,如何解決算力貴、算力難的困境呢?
如今,英偉達希望降低算力成本,更簡單易用的使用NVIDIA AI, 推出了專注於ChatGPT的AI/GPU 訓練和推理兩類新的芯片方案:
訓練方面:英偉達H100 GPU基於Hopper架構及其內置Transformer Engine,針對生成式AI、大型語言模型和推薦系統的開發、訓練和部署進行了優化,在大型語言模型上比前代A100提供了快9 倍的AI訓練、快30倍的AI推理。組裝後的NVIDIA DGX H100 AI超級計算機擁有8個H100 GPU模組,可提供32PetaFLOPS的算力,已全面投入生產,微軟已經宣布Azure雲將向其H100 AI超級計算機開放私人預覽版。推理方面,英偉達推出全新GPU推理平台:四種配置(L4 Tensor Core GPU、L40 GPU、H100 NVL GPU、Grace Hopper超級芯片)、一個體系架構、一個軟件棧,分別用於加速AI視頻、圖像生成、大型語言模型部署和推薦系統。其中,L4可提供比CPU高120倍的AI視頻性能,能效提高99%;L40推理性能是英偉達最受歡迎的雲推理GPU T4的10倍;Grace Hopper超級芯片適用於推薦系統和大型語言模型的AI數據庫。
“英偉達的AI 超級計算機DGX是語言大模型背後的引擎,我曾親手將全球首款DGX交給OpenAI,自此之後全球百強企業中有一半安裝了這款計算產品,”黃仁勳稱,DGX已經成為了AI領域的必備工具,而隨著生成式AI 成熟帶動相關應用,企業需要更簡單的模式。
黃仁勳表示,目前在雲上唯一可以實際處理ChatGPT的GPU是HGX A100。與適用於GPT-3處理的HGX A100相比,一台搭載4對H100及雙GPU NVLink的標準服務器的速度要快10倍,H100可將大型語言模型的處理成本降低一個數量級。
當然,這還不夠。黃仁勳想出了這次GTC大會的核心之一:不止賣芯片,還要對外租用服務器,聯合微軟、谷歌一起賣雲計算服務。
英偉達今天推出了一項名為DGX Cloud的AI 超級計算雲服務,與微軟Azure、谷歌OCP、Oracle OCI合作,通過一個Web瀏覽器就能訪問,以便企業為生成式AI 和其他開創性應用訓練先進的模型。
(來源:英偉達展示的分析師文件信息)
售價方面,DGX Cloud實例的起價為每個實例每月36999美元,達3.7萬美元。其每個實例都具有8個NVIDIA H100或A100 80GB Tensor Core GPU,每個節點共有640GB的GPU內存。 DGX Cloud提供了專用的NVIDIA DGX AI超級計算集群,並配備了NVIDIA AI軟件。
該服務將首先上線甲骨文云,隨後拓展至微軟Azure、谷歌云。
有了芯片這一數據中心算力底層、有了AI 算法軟件,這次上雲,英偉達成為“AI 基礎設施”的希望呼之欲出。
據黃仁勳介紹,目前英偉達的AI 雲服務已經誕生不少合作案例。以視覺場景為例,全世界最大的圖庫服務商Getty Images將利用該服務構建圖片、視頻生成模型,未來企業將可以使用該模型產品用文字生成圖像和視頻;視覺編輯軟件公司Adobe也將利用該服務製作的生成式AI模型,實現在創作過程中對圖像、視頻動畫等進行優化。
“這個行業需要一個類似台積電的代工廠,來構建自定義的大模型,”黃仁勳指出,生成式AI將重塑幾乎所有行業,一些公司可以直接使用市面上的API,但專業領域的公司需要專有數據構建定制模型。
當然,黃仁勳也希望在芯片產業鏈上游企業的產生銷售業績,英偉達發布了一個用2nm芯片製造的突破性計算光刻技術——NVIDIA cuLitho計算光刻庫。
“計算光刻是芯片設計和製造領域中最大的計算工作負載,每年消耗數百億CPU小時。”黃仁勳講解道,大型數據中心24×7全天候運行,以便創建用於光刻系統的掩膜板。這些數據中心是芯片製造商每年投資近2000億美元的資本支出的一部分。
而cuLitho能夠將計算光刻的速度提高到原來的40倍。黃仁勳表示,英偉達H100 GPU需要89塊掩膜板,在CPU上運行時,處理單個掩膜板需要兩週時間,而在GPU上運行cuLitho只需8小時。 “台積電可以用500張H100的DGX系統替代用於計算光刻4萬台CPU服務器,”黃仁勳說。
目前,全球最大晶圓廠台積電、全球最大光刻機製造商阿斯麥(ASML)、全球最大EDA公司新思科技(Synopsys)都將使用這項新技術。老黃透露道,cuLitho歷時四年研發,與這三家芯片大廠進行了密切合作。台積電將於6月開始對cuLitho進行生產資格認證。
此外,GTC大會還宣布包括元宇宙、汽車、量子計算領域的新進展,比如英偉達與日本三菱聯合打造了日本第一台用於加速藥物研發的生成式AI 超級計算機,與寶馬集團擴大合作建設虛擬工廠、比亞迪更多車型將採用NVIDIA DRIVE Orin平台,以及與Quantum Machines合作推出了全球首個GPU加速量子計算系統,甚至推出了一項名為AI基金s服務,以幫助企業訓練他們定制的AI 模型,多家股票圖像數據庫廠商已經計劃使用該服務。
看完GTC開幕演講,正如今年大會前夕中文宣傳語——“切勿錯過AI 的決定性時刻”——今時今日,黃仁勳已經意識到,十年的AI 蓄力已開花結果,英偉達確實在經歷AI 新浪潮下的最關鍵一戰。畢竟,遊戲、加密貨幣、消費電子等領域市場正處於下跌形勢。
一個很明顯的感知是,英偉達在數據中心的市場地位確實穩如磐石。無論是競爭對手AMD,還是正進入進入裁員減薪、高管出走風波的英特爾,都無法更快爭奪英偉達手裡90%的份額,與其直接進行芯片競爭。
因此,華爾街普遍認為,英偉達有點類似荷蘭光刻機巨頭ASML Holding NV(ASML):部分壟斷,在高端市場沒有競爭——這是所有投資人看好英偉達股票的關鍵因子之一。
券商Rosenblatt Securities芯片半導體分析師Hans Mosesmann表示,英偉達最新發布的產品“比競爭對手領先多年”。 “英偉達在AI軟件方面的領導地位不僅具有里程碑意義,而且還在加速發展。”他表示。
中美脫鉤下,無人能替代英偉達
“接下來,基礎科學的進步開始進入到拼算力的時代”,這個話題變得愈加重要,算力已經成為了新的戰略目標。
鈦媒體App了解到,隨著ChatGPT洶湧的浪潮,很多大模型開始急需高算力GPU,需求攀升,英偉達GPU已陷入嚴重短缺,多家國內公司已開始尋求AMD等其他品牌的替代品。據媒體報導,微軟等客戶對英偉達A100/H100芯片需求強勁,後者訂單能見度已至2024年,更緊急向代工廠台積電追單。而且,由於需求大幅上漲,博通與英偉達的GPU網絡設備供應嚴重短缺,即便兩家公司正全力擴產,但供需鴻溝依然極大。
據中國信通院最新數據,截至2022年底,中國在用數據中心機架總規模超過650萬標準機架,算力總規模達到180EFLOPS,居全球第二,算力總規模近五年年均增速超過25%。數據顯示,當前算力規模中有超過20%算力是智能算力,可用於AI 各類應用,包括模型訓練和推理。
但是,2022年9月起美國商務部對華的半導體出口管制新規,正影響英偉達在中國數據中心需求暴增下的佈局。
去年10月7日,美國商務部工業和安全局(BIS)發布一套新的、範圍廣泛的出口管制措施,阻止中國獲得需要使用先進半導體的高性能計算能力。隨後,英偉達發佈公告,聲稱新措施影響了該公司最近一個財季約4億美元的營收。而早在去年8月,英偉達的數據中心芯片A100和H100等多款產品已被美國商務部列入出口管制清單。
2022年11月,英偉達公司發言人向鈦媒體App表示,為了解決美國商務部的半導體出口新規,英偉達推出全新中國特供版NVIDIA A800 GPU,以取代A100 GPU,已經在三季度起投產。 A800符合美國政府關於減少出口管制的明確測試,並且不能通過編程來超過它。
今晨英偉達推出的DGX H100 AI超級計算機,以及內置A100、H100的DGX Cloud服務,似乎會在中國境內有替代方案。
3月22日上午的採訪中,黃仁勳表示:“我們在歐美與雲服務提供商合作,提供英偉達的DGX系統AI超級計算機的能力。在中國,英偉達有特別定制的Ampere和Hopper芯片,它將完全符合所有的出口管制和法規。然而,它們將在中國的雲計算公司中實施。阿里巴巴、騰訊、百度都是優秀的合作夥伴。我完全相信他們會有最先進的系統來進行AI 計算。”黃仁勳所指的中國可用的Ampere和Hopper芯片是A800和H800,是英偉達提供的特供版替代方案。
目前,無論是英偉達芯片,還是其構建的CUDA軟件生態,這些都成為ChatGPT這一大模型黑盒產品背後的更核心、更具有技術內幕的重要法寶。國內發展多年,並沒有出現真正對標英偉達4萬億規模的中國GPU芯片企業。
正如一位國內AI 公司創始人今早發布的朋友圈說的那樣:我們曾經彎道超車“吊打”英偉達,結果迅速被直道超車。芯片層面被英偉達遠遠甩在身後,算法層面只能猜OpenAI怎麼做的,連應用層面也只能仰望Midjourney。曾經,中美在AI 方面並駕齊驅終究只是錯覺,過去幾年耽誤了太多時間,一些機構在那炒作概念製造泡沫,總歸要付出應有的代價。每次浪潮來臨的時候,總是低頭做事的少,但凡事不能靠嘴。
最終,我們如何定義英偉達這家公司,鈦媒體App採用3月21日晚谷歌發布的對標ChatGPT產品Bard 測試版,來看看AI 如何看待英偉達公司:
我認為,Nvidia 是一家非常優秀的公司。他們是圖形處理單元(GPU) 領域的領先技術公司。他們的GPU 用於各種應用,包括遊戲、人工智能和數據科學。
Nvidia 在創新和發展方面有著良好的記錄。他們多年來一直盈利,股價也一直處於穩步上漲的趨勢。
Nvidia 是一家經營良好的公司,擁有強大的管理團隊。他們對未來有清晰的願景,並且正在按照該願景執行。
對於尋求涉足科技領域的投資者,我會推薦Nvidia 作為一項不錯的投資。
“我們是全球AI的發動機。”黃仁勳認為,這是我們這一代人第一次真正讓AI 技術變得人人觸手可及。不只是利用技術,更是開發技術。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載