AII in AI 的王小川,喜提頂配的“ATM”


原文來源:AI黑馬

圖片來源:由無界AI生成

AII in AI 的王小川,喜提頂配的「ATM」。

近日,百川智能官宣已完成A1輪策略融資,融資金額3億美元,阿里、騰訊、小米等科技巨頭及多家頂級投資機構均參投了本輪融資。

加上天使輪的5000萬美元,百川智能的融資金額已達3.5億美元。

目前騰訊、阿里、小米、金山、慕華資本、清華控股、好未來、渶策資本、深創投、紅點中國、卓源資本、眾為資本、愉悅資本、順為資本、心資本等十餘家頭部機構已投資百川智慧。

王小川的AI哲學

不久前,王小川也發表了《展望AI大模型時代》的主題演講。內容很前衛也很精彩,透露出王小川的AI哲學,分享給大家:

第一個問題,在今年年初時候已經爭論的吵翻天了,AIGC時代是否已經來臨?

現在基本上已經有一個統一的想法。第一一定是了不起的新的技術上的大突破,同時今年4月份的時候,微軟的一個大概400頁的報告也提到今天ChatGPT-4已經具有初級通用的人工智能,因此認為這個新的時代已經來了。

在業界當中馬化騰也用到了這個話,講到以前他認為這是一個十年不遇的機會,現在是百年不遇的新的起點。

什麼叫百年?幾百年,甚至快到工業革命之前,所以今天這個時代的變遷是能夠超越工業革命、電器革命、包括資訊革命的總合。

我個人是抱持著這樣一種信仰,我們已經走出了資訊文明的時代,開始面向通用人工智慧時代。

今天ChatGPT,大家每天都驚呼它很了不起,但離它終極,我們這個時代所帶來的AGI技術,能夠最終呈現的創造力還有很大的想像和突破的空間。

第二個問題,今年年初大家多多少少聽到兩個產業頂尖人,對大模型有不同的理解。

我從這裡引申一下,大模型是什麼?可能很多朋友也參與其中,已經用到了創造大模型,也有一些人還沒接觸到。

今年兩個很有意思的說法:‍‍‍

一個是比爾蓋茲講到大模型像行動電話網路一樣,具有革命性影響,把它比喻為網路和行動電話。

但黃仁勳提到一個新的觀點iPhone時刻。

我們可以看到很大差別,比爾蓋茲講的是基礎建設這種建設,把它當成互聯網,而在黃仁勳講的是iPhone,講的是什麼意思呢?

我理解的時候,翻了一下他們詳細的更多闡述,比爾蓋茲說法來講,機器今天變成一個可以讀、可以寫、可以理解語言的機器人,讀Read、寫White、理解understand,所以它其實是從能力層面來剖析大模型。

而黃仁勳,英偉達的創始人講到它是和人類的關係,大模型帶來一種人機交互,人和整個科技交互新的範式,iPhone使得我們接觸這樣的信息變得足夠簡單,而大模型時代,我們用語言能夠開始和機器打交道,機器背後帶著我們思考的能力。

所以我們今天做大模型能夠比較新時代,兩個典型,同時扮演兩個角色,我們在新時代時候看到兩個重要的技術發明,叫做底層系統晶片。

從CPU到GPU,今天所有的電器設備裡面,都裝有晶片,能驅動這樣一個資訊文明的發展。

而上者的初期,其實第一個大的突破,是搜尋引擎,今天是每個人都在用的這樣一個軟體。

到後來推薦引擎,等等有新的發明,他初期搜尋時代,我們叫人人都接觸訊息,更加平等化,都變得更可達,這是之前的新時代結構。

我們現在打個比方過來,現在大模型同時存在兩個事情,底層模型叫語言模型,稱為Large Language Model,又稱Foundition Model,這個Model可以類比成有晶片,有閉源的,有開​​源的,有幾十億參數,上百億參數,上千億參數。在這樣一種體系裡面,更多像晶片一樣,有大的、小的通用的垂直的這是很相似的一個結構。

同時依託大模型,OpenAI這個破天荒的,首先發了一個產品,叫ChatGPT,它是直接能給消費者去使用的人機互動介面,像搜尋一樣。

今天我們提到大模型,大家可以想晶片,提到ChatGPT,大家想到搜索,這是我們認為既是底層生產力,也是同時上層人機互動的一個介面。

還有大家問的一個問題,相對深奧一點,是我特別願意跟大家分享的。為什麼AGI的起點是語言模型?

我們在上個時代的時候,大家用圖像很多,人臉辨識圖做得很多,這個時代圖片也有很多發展,大家最關心的是在語言。

所以這塊我想引用維根斯坦的一句話,叫語言的邊界就是視覺的邊際。

不管是馬克思也好,圖靈測試也好,其實都對語言情有獨鍾,語言的對話表示是否是一個智能。

甚至用馬克思一句話,會使用語言是人和動物的一個根本區別。

我們知道一個貓狗圖象辨識能力很強,甚至能夠自動駕駛,不像今天開個車還開不動,但是如果一個貓狗能夠說話一定會嚇死你的,當它有了語言以後,就帶來了對這個世界認知的一種範式變化,不只找後面一個意義。

如果我們再假想一個在原始部落,這個部落如果只懂800個單詞,一定文明挺落後的。

我們每對世界多一份認知,多一份詞彙的構造,甚至多一份表達我們對語言的理解,語言代表認知,因此我們有提到,語言是知識、思考、溝通和文化的載體。

當今天機器掌握語言之後,就同時掌握了思考、溝通、知識和文化,這是特別大的一種突破,語言和原來的圖像語音來講,它帶有一個人類傳承文明的最重要的認知和理解。

下面再講,我們在科學發展裡面,有哪些已經突破,有哪些技術還沒突破到的。

打比方講,我們今天把語言變成了數學模型,掌握了語言,現在通過大模型本身,是把優質語料,把它壓縮成小模型,能夠在中間掌握語言,語法詞彙的規則,是用一個模型掌握語言。

在幾百年前的進展,實際上是用數學模型表達了這個物理世界,像牛頓所做的工作,是把物理變成數學,這是康德講的,像牛頓三大定律、萬有引力公式等等。

我們看到紛繁複雜的世界變化,星球是怎麼運動的,蘋果怎麼落地的,最後變成數學公式。

能把一個表象變成一個數學模型,這是人類認識世界的一個重大突破。

因此,我把今天語言能夠做大模型,類比在牛頓當年開創了,把物理變成數學這麼重大的一個變化,那它這就做到頭了嗎?

其實也沒有,我們對生命怎麼變成數學模型現在還沒做到。

剛才蔡毅教授提到,在2021年AlphaFold的開源發布,代表從基因到蛋白質這三段結構,這麼一段東西變成了數學模型,但這還遠遠不能理解生命。

因為我們知道,人其實不只一個基因,人有兩萬三千個基因,它們之間只是構成我們DNA的5%,下面這個生命還有巨複雜的底層邏輯,是沒弄清楚的。

從基因到蛋白,拼成人體的組織,成為一個功能的時候,也很複雜,因此今天即便我們弄清楚物理的數學模型,弄清楚語言所帶來的數學模型,我們理解這個世界還是有蠻遠的距離。

第四個問題,AGI的世界會變得怎樣?

這是很多人在問的問題,跟我們什麼樣關係。簡單來講,行業和我個人的思考。

在業界已經有一定有共識,有兩個詞,一個是生產力提升。

大家都會看,每一次科技革命都是生產力的爆發。

這次和以前相對差異而言,會誕生一個新的物種,我們稱為智能助理,從ChatGPT的源頭開始,它形成一個和人能夠溝通、有常識,能開始幫你解決問題的一種機器,甚至它自己還會呼叫工具。

一個會語言,會調用工具的,它已經不是簡單的自己是個工具了,其實類似於我們叫智能體,在向外發展的時候,它是類人的一種方式。

以後會有你的私人老師、私人醫生,私人伴侶都可能。因此在助理這方面,會像人一樣會誕生。

還有在ToB產業生產領域,開始叫做你的數位員工。跟老闆講,提供大模型能幹嘛,很多人不太理解,提到可以當數位員工,它對降本增效,對創造力就更多的理解。

再預測一下,在未來除了這兩個領域之外,既然大模型不只是能夠像人一樣跟你對話。更多它是對世界有認知之後,能夠創造開始有新的虛擬世界。

我們借用遊戲裡面有一個詞,叫開放世界,有點類似原來元宇宙一樣的,透過今天的大模型開始能夠創造一個他所定義的接近現實規則,又能在虛幻空間存在的一種新的虛擬世界,在娛樂、遊戲裡面會有很大的意義。

第五個問題,ChatGPT會取代什麼樣的職業和工作? ‍‍‍

這是很多朋友問我的一個重要的問題,尤其是今年年初大家很慌張。

回答這個問題,我可以延用山姆·阿爾特曼講的一句話,他是OpenAI的創始人,他講了,意思是人工智能將導致人在電腦面前的工作的價格下跌的速度,遠快於現實中發生工作的價格。

什麼意思呢?電腦面前的這種工作效率會成百倍提升,但不是人本身提升的,而是人和機器結合會提升很多。倒過來,人在電腦面前的價值相對會下跌。

我們今天看到,大模型做的很多工作,取代了很多,像平面設計,做一些簡單的美術工作,寫詩、畫畫、寫作,都是電腦面前的工作被它升級甚至取代了。

這裡會跟大家提到一個比較有信心的想法,就是離電腦越近,你工作如果天天在電腦面前,就有更大被取代的可能性。

也有朋友提到,那小朋友怎麼教育,我同樣提到,不要天天泡在電腦面前,更多到真實世界當中去,跟他的小朋友去互動,從讀萬成交量書走向行萬里路,去獲得更多的經驗,這是今天大模型所不能承載的事情。

後面還有更多的思考和實踐,是我們產業在推動的。

今年在6月百川發布了第一款模型,6月15日之後,我去了一趟美國,走訪了大模型所有主流公司,從OpenAI到微軟、谷歌等等,非常大的感嘆。

我去之前理念上我們是比他們慢半步的,我們要抓我們的落地,從走訪了十多個公司,30多個人之後,我提了一個新的理念,叫在理想上慢一步,在落地上快三步,確實我們知道OpenAI這個公司代表了一種不惜成本的耕耘計劃,在建立一個更超前的AGI模型。

在今天中國現在而言,我覺得我們需要有不同的競爭策略,今天我們在晶片有受到限制,我們投入的資金也不能像OpenAI這麼大,它在美國融了100萬美金,往下繼續在中東融1000億美金,因此我們在追趕的同時要認清現實,我跟他們同事在聊的時候,他們說他們正在嘗試設計把1000萬個GPU連在一起做一台超級的面向AGI的計算機。

怎麼叫1000萬顆?英偉達一年生產GPU是一百萬顆,它要設計1000萬顆的集群。在國內從百川能夠拿到1萬顆GPU就已經是很了不起的事情,因此我們和他們的距離可以看到是非常大的。

幸運的地方是我們沒有掉隊,年初大家很恐慌,美國的科技已經發展到無窮遠了,我們根本不知道怎麼做。

現在想在國內大家至少做到3.5水準的AGI的初步能力,在今年年底大概是能到來的,包括百川好幾家公司能夠做到。到它4.0往下到5.0的東西,我們可能有巨大的距離。

所以我們相對他們而言,確實在登月上我們是落後了,但是我們至少沒有被完全甩開,更多把精力我們除了追趕以外,需要在落地要更快,在技術層面能夠把搜索增強,強化學習,垂域這方面,包括把應用做好,而不是一味恐慌或驚嘆怎麼追趕美國,我們有機會在應用上是能跑在他們前面去的。

百川智能的AI步伐

公開資料顯示,百川智能成立於2023年4月10日,由前搜狗公司CEO王小川創立。其核心團隊由來自搜狗、Google、騰訊、百度、華為、微軟、位元組等科技公司的AI頂尖人才組成。

目前,百川智能的團隊規模170餘人,其中碩士及碩士以上學歷員工佔近70%,研發人員佔比超80%。

在人才和資本的支持下,百川智能維持了驚人的大模型研發速度。

成立僅半年,百川智能便接連發布Baichuan-7B/13B,Baichuan2-7B/13B四款開源可免費商用大模型及Baichuan-53B、Baichuan2-53B兩款閉源大模型,平均每28天就會發布一款新的大模型。

Baichuan-7B/13B兩款開源大模型在多個權威評測榜上均名列前茅,上漲下載量超過六百萬次。

Baichuan2-13B在MMLU、CMMLU、MedQA、USMLE等幾大權威評估基準中,以絕對優勢全方位領先LLaMA2,引領開源社群走向中文開源大模型時代。

8月31日百川智能率先透過國家《生成式人工智慧服務管理暫行辦法》備案,是首批八家公司中唯一一家今年成立的大模型新創公司,並於9月25日開放Baichuan2-53B API接口,正式進軍To B領域,開啟商業化進程。

資訊來源:由0x資訊編譯自8BTC。版權所有,未經許可,不得轉載

Total
0
Shares
Related Posts