來源:矽星人(ID:guixingren123)
作者:Juny
編輯丨VickyXiao
圖片來源:由無界AI工俱生成
最近幾個月來,似乎每個人都在日常生活中跟ChatGPT、Bard等AI機器人聊得熱火朝天,讓它們來幫忙寫郵件、寫總結、做計劃。但有個普遍的現像是,一旦當人們切換到工作模式時,這些生成式AI工具便很少出現在大家的工作流程中,甚至被一些公司明令禁止。
AI能力如此強大,為什麼企業們不用?
這背後的核心原因其實很簡單——每個企業的數據安全和隱私問題都太重要。沒有企業敢把自己的“命脈”完完全全地交在還並未發展成熟、並由其他大型公司掌控的AI手上。
那麼,是否有辦法解決這個棘手的問題,進而在企業端最大化地發掘生成式AI的潛力呢?其實從2019年開始,就有一家名為Cohere的AI創業公司在密切關注這個問題並不斷提出解決方案。
長期以來,企業級的生成式AI都是一個相對小眾且壁壘較高的市場,但Cohere憑藉著成熟的技術和敏銳的嗅覺得到了一眾大佬和巨頭的支持。目前Cohere的投資者不僅包括英偉達、甲骨文、Salesforce等巨頭,同時還有圖靈獎得主Geoffrey Hinton、斯坦福AI教授李飛飛等一眾圈內大佬。不久前,YouTube 的前首席財務官Martin Kon 也選擇加入Cohere擔任總裁和首席運營官。
英偉達、甲骨文和Salesforce都在押注Cohere
圖源:Crunchbase
乘著ChatGPT爆火的東風,今年以來,Cohere的潛力開始被越來越多的人的看到並進入了估值飆升的快車道,目前已成為全球AIGC賽道僅次於OpenAI和Antropic的第三大獨角獸。
從谷歌“脫胎”,來自加拿大頂級AI圈
Cohere成立於加拿大多倫多,於2019年由Aidan Gomez、Ivan Zhang和Nick Frosst共同創立。三人本科都就讀於多倫多大學計算機科學專業,按照入學時間推算,三人目前應該都未超過30歲。
Cohere的創始團隊
圖源:Cohere官網
其中,Aidan Gomez在2017年本科期間就參與了由谷歌大腦團隊研究並作為署名者之一發表了名為《Attention is All You Need》的論文,而這篇論文就是日後大名鼎鼎的Transformer機器學習架構的開端,也是發展谷歌BERT、OpenAI的GPT 等未來革命性架構的基石。
在同一年,Aidan Gomez和同系的同學Ivan Zhang創立了一個非營利人工智能研究社區For.ai,用以支持和鏈接世界各地的人工智能獨立研究者。
本科畢業後,Aidan Gomez前往牛津大學攻讀計算機科學的博士學位,同時也加入了由“深度學習之父”、圖靈獎獲得者Geoffrey Hinton領導的谷歌AI團隊,基於Transformer架構進行進一步研究。在谷歌大腦的Hinton團隊之中,Aidan Gomez結識了一直從事機器學習和認知科學研究的Nick Frosst。
在之後兩年中,通過研究的深入,大家了解到Transformer可以擴展為性能出色的大型神經網絡,並在語言相關的任務上表現十分出色。包括Aidan Gomez在內的一些Transformer論文撰寫者們都開始思考這背後所蘊藏的商業化機會,目前除了Llion Jones仍在谷歌工作,其他七位作者都紛紛“下海”創業。
其中,Aidan Comez則與Nick Frosst和Ivan Zhang共同創立了Cohere。跟谷歌、微軟等實力雄厚公司去重金訓練大模型不同,在2019年Cohere成立開始,他們就專注於企業用例,試圖根據不同企業的專有數據去創建定制化的大語言模型。
不靠雲,要做企業定制生成式AI服務
簡單來說,Cohere的目標是要成為各類開發人員的默認NLP 工具包,讓各類開發人員都可以使用大型神經網絡和最先進AI來解決任何語言相關問題,但卻不依託於任何公共雲,讓模型能在私有云或本地部署中運行。
目前,Cohere的主要產品主要圍繞著企業日常運營中的三個關鍵領域:文本生成、文本分類和文本檢索,幾乎覆蓋了企業生產中所有跟文字有關的領域。
文本生成部分主要有Summarize、Generate、Command Model三個產品。 Summarize是一個由大型語言模型驅動的文本摘要生成器,能快速概述和總結文檔的關鍵點,可以支持輸入10萬個字符和文本格式選項。 Generate則是一個內容生成器,可以為各種目生成獨特的內容,比如電子郵件和產品描述等。
下面,再重點介紹一下Command Model。 Command是Cohere推出的一個能夠接受用戶個性化命令訓練的文本生成模型。也就是說,企業用戶在將自己的數據和Command結合之後,就可以產生一個自己獨有的語言模型,能夠在企業的實際業務中立即發揮作用。
Command Model
圖源:Cohere
值得注意的是,作為一個只有520 億個參數的模型,Command的準確性表現此前卻超過了其他更大規模訓練的模型,在不久前被斯坦福大學的語言模型全面評估(HELM)評為世界上最有能力的大型語言模型。
圖源:斯坦福大學的語言模型全面評估(HELM)官網
文本檢索部分,包括Embed、Semantic Search、Rerank三個產品。
對於希望構建自己的文本分析應用程序的機器學習團隊,Embed可以幫助他們快速發現趨勢,並支持100多種語言。 Semantic Search是一個強大的搜索工具,用戶只需要簡單使用API,就可以使用該搜索功能,能夠支持基於查詢的含義而不僅僅是關鍵詞來返回多種信息,並且不受語言的限制。 Rerank可以基於語義相關性分析現有工具的搜索結果並進行排名,從而提供更豐富、更相關的結果,且對用戶的干預或編程經驗要求很小。
文本分類部分主要產品為Classify,該功能使用戶能夠個性化的組織信息來幫助內容審核、用戶分析和進行聊天機器人體驗。比如它能夠通過快速標記不同類別的客戶來進行高效的客戶服務,也可以識別正面和負面的社交媒體評測來更好地了解客戶的反饋等。
圖源:Cohere
Cohere 的商業模式是先承擔創建大型的Transformer神經網絡的成本,然後再將有需求公司連接到這些網絡,公司則按使用情況進行付費。 Cohere的主要特點是為客戶提供了包括私有云、本地部署、Cohere託管雲和其他雲夥伴AWS、谷歌等多種數據託管選項,讓用戶根據自身需要進行選擇,讓客戶對數據擁有控制權。
對於希望學習原型設計並成為社區一部分的開發者,Cohere提供了免費的、限制使用率的使用。然而,如果希望進入生產、訓練自定義模型、訪問所有端點並接收增強的客戶支持,將需要支付費用。目前Cohere的客戶包括Spotify、Jasper、HyperWrite等。
從價格來看,嵌入功能下,默認模型每100 萬個Token 40 美分,企業自定義的模型80 美分,生成功能下,默認模型每100 萬個Token 15 美元,自定義模型30 美元,總結功能下,每100萬個Token15美元等。
Cohere不同功能的價格情況
圖源:Cohere
不過,此前Cohere的這個定價還算很有優勢,但在昨天OpenAI大降價之後,預計也會給Cohere帶來不小的衝擊。比如OpenAI的嵌入模型價格直接跳水75%,每千token只需0.0001美金,也就是1美元一千萬token,遠遠低於Cohere。
大佬和巨頭力挺,Cohere駛入AIGC第一陣營
瞄準企業級AI數據安全痛點的Cohere,在當前的AI用戶端廝殺中脫穎而出,包括VC、科技巨頭和人工智能領域的大佬們都給它投去了支持票。 2021年正式邁入商業化以來,Cohere的估值也節節攀升,目前已達到約22億美元,在AIGC賽道僅次於微軟支持的OpenAI和谷歌支持的Anthropic。
在Cohere成立之初,它的人工智能學術色彩似乎更為濃郁。在2021年和2022年的Cohere A輪和B輪融資中,當時的AIGC賽道的投資還在寒冬中,有誰給Cohere投去了支持資金呢?在這兩輪的投資列表中,我們都看到了以下幾位AI大佬的身影。
圖源:Crunchbase
除了幾個創始人在多倫多直接跟隨學習過的“深度學習之父”、圖靈獎得主Geoffrey Hinton之外,還包括斯坦福大學教授、視覺實驗室負責人李飛飛,加州大學伯克利分校教授、伯克利人工智能實驗室主任Pieter Abbeel,多倫多大學教授、前Uber人駕駛汽車技術研究中心主任Raquel Urtasun,個個都是人工智能領域的學術大咖。
而在本月初宣布的最新一輪融資中,在AIGC的熱潮中,Cohere也得到了更多領域內科技公司的關注。其中包括人工智能最強“軍火商”英偉達以及雲巨頭Salesforce和甲骨文。目前的融資總額已經達到4.39億美元。
Cohere的迅速發展離不開深厚的技術背景和賽道選擇。從大模型的角度來說,Cohere 目前可能並不是市場上最領先的,但他們敏銳地抓到了AIGC企業端應用的痛點,能夠在首先滿足企業安全性需求的前提下,再進一步的提供內容生成、摘要、搜索等領域的服務。
他們的商業模式使得大量公司能夠在無需斥重金構建自己模型的情況下自定義地接入大型神經網絡,並通過細分業務模塊,讓公司能根據使用情況來進行付費,從而達到一種雙贏的狀態。
從目前Cohere 越來越高的熱度和OpenAI最近大規模的降價和API升級來看,AIGC的戰火在用戶端正在一路蔓延到企業戰場。而屆時,或許一場真正的AI生產力革命才會真正開始。
資訊來源:由0x資訊編譯自8BTC。版權歸作者所有,未經許可,不得轉載