科大訊飛背上抄襲OpenAI 的罵名，冤嗎？

作者| 程怡小船楊知潮

編輯| 秦安娜

來源：略大參考

圖片來源：由無界AI工俱生成

當科技圈討論AI 大模型，他們在思考什麼？

阿里巴巴董事局主席張勇說，所有產品都值得用AI 重做一遍。李彥宏說，百度同學要有意識的培養AI 原生應用的思維方式和理念，用新理念重構現在的每個產品，每個業務。周鴻禕說360 鼓勵每一位員工、每個產品和業務都要全面擁抱人工智能，適應人機協作，著手產品重塑。

凡此種種的表態，無一不在透露一種思考：AI 大模型是技術浪潮，也會是產品思維方式的浪潮，它會推動人工智能時代出行跟互聯網、移動互聯網時代，不同的思考模式和產品形式。

處於巨變前夜，科大訊飛表態在10 月底，新發布的星火大模型會追上ChatGPT 的發言，就沒有那麼激動人心。一方面，說今年能追趕上的人太多了。另一方面ChatGPT 的價值不僅僅是OpenAI 基於GPT 大模型，打造出來的一款成功產品。借用周鴻禕的話說，ChatGPT 讓人工智能變成了一項云服務。

百度的文心大模型發布之後，飽受非議，並不耽誤百度宣傳“百度雲是國內第一個訓練出大模型的雲”。前陣子，阿里雲毫不留情，啟動史上最大規模降價搶占市場，存儲業務最高降幅50%。因為投資OpenAI 成為生成式AI 贏家的微軟，多筆對OpenAI 的投資，都是以雲服務消費券的方式提供現金+ 雲服務的投資形式。

在人工智能同各行業、多應用場景結合帶來的大數據爆發階段，科技企業們一邊走在探索AI 重構產品形態的道路，一邊用雲技術作為底層技術基礎，存儲和分析海量，挖礦服務收入，對沖探索成本。即便是作為“AI 後輩”的商湯，也搭建出來算力中心的商業模型，想做人工智能行業的“水電煤”。

在告別營收連續10 年增長的業績之後，科大訊飛借用生成式AI 的新“舊瓶”，卻裝進一個客戶、一個應用場景的技術落地之路的“舊模式”，辛苦當搬水工，商業模式看起來就沒有那麼性感了。

科大訊飛要去追趕ChatGPT，但對押注AI 的互聯網企業來說，它們想追趕的是微軟。

重新定義自研

自從大洋彼岸的OpenAI 於2022 年11 月推出ChatGPT 後，一場波及全球科技的“海嘯”就此爆發。在國內大模型扎堆的上半年，中國幾乎所有的知名的科技企業，都發布了類ChatGPT 的“AI 大模型”。

科大訊飛並非沖在第一陣線的排頭兵。儘管有十餘年對於認知智能相關的研究和計劃，擁有“人工智能國家隊”的美名，訊飛的認知大模型成果發布會直到5 月6 日才姍姍來遲。而在其4 月17 日對於發布會的官宣公告中，有一句頗為保守的補充說明——“公司尚不能預測相關技術及應用對2023 年度銷售收入和經營業績的提升影響”。

但5 月6 日的發布會上基調定得很高，圍繞訊飛星火認知大模型，科大訊飛董事長劉慶峰和訊飛研究院院長劉聰，一同在現場進行了1 個小時左右的實時演示，展示星火在語言理解、知識問答、邏輯推理，數學、代碼及多模態等方面的能力。

科大訊飛方面表示，訊飛星火在長文本生成、數學能力和泛領域開放式知識問答三大能力已超ChatGPT。在2023 年內預計還會進行三次升級，分批次增強數學能力、補足代碼能力，希望最終將在10 月24 日全球開發者大會期間，能夠全面對標ChatGPT，在中文上要超越ChatGPT。

官方的“王婆賣瓜”是一碼事，星火大模型在用戶端的實際使用情況如何呢？

5 月9 日晚，一段關於訊飛星火的群聊記錄在各個群廣為流傳，一張截圖顯示，得到內測資格的提問者問道星火提供的API 接口是OpenAI 的？星火大模型回答道，“是的，我是由OpenAI 開發的”。緊跟截圖後面，是群內的議論，指向星火大模型疑似套殼OpenAI？

當然，孩童也會說自己是奧特曼。今天的AI 還處在幼儿期，星火大模型說自己來自OpenAI，就一定來自OpenAI 嗎？

答案是不一定。西安交通大學AI 學院的浩儒博士告訴“略大參考”，大模型還是靠函數擬合，沒有真正的自我認知，他們不知道自己是誰，很可能在哪個網站上學習過這句話就說了出來。

但是他認為，星火大模型也有可能是“借鑒”了GPT。浩儒博士表示：“模型都是經過預訓練的，相當於硬盤出廠的時候裡面就有資料，如果你把GPT 開源的模型直接拿過來用，就可能會一塊學習到GPT 的語料，造成這種烏龍事件。”

類似的事件在國內AI 行業不是第一次發生，早在星火大模型推出之前，也有用戶發現百度的文心一言的繪圖疑似為漢譯英後再繪製，有使用國外框架的嫌疑。

浩儒博士透露，把別人開源的模型拿過來直接用，在自然語言處理科研領域是很常見的的做法：“高校不可能都從頭開始訓練”。對企業來說也是如此，目前互聯網公司和AI 公司都在大模型上較勁，晚推出一個月，都有可能影響自己的股價。既然GPT1 和GPT2 和已經開源，那麼在已有的模型基礎之上來建立自己的大模型產品，是既合法也經濟的選擇。

市場端的及時反應則是，科大訊飛成為5 月10 日北向資金淨賣出7 只個股中金額最多的一隻，收盤價65.45 元，淨賣出4.377 億元。

增長神話終結

如果“借鑒”了GPT，那還算是原創的大模型嗎？這可能是個哲學問題。浩儒博士表示。語言大模型是混沌系統，運行原理都是未知的，構成更是根本說不清楚：“就像忒休斯的船，即使你用了別人的骨幹，也很難說不斷學習後的大模型還是不是之前的大模型。”

一個月前，商湯在交易所日上也曾因為號稱完全自研的文生圖創作平台“秒畫SenseMirage”在精選模型中出現AI 模型站civitai 的圖片引發廣泛質疑。商湯方面的解釋是：秒畫SenseMirage 包含商湯自研AIGC 大模型，也提供第三方社區開源模型。

就像此前的發布會慣例一樣，國內的AI 大模型發布會不單是為了炫技，主要是用來“賣”的。訊飛星火將在教育、辦公、汽車、數字員工四個領域的尋找應用方向，與訊飛旗下教育產品AI 學習機以及辦公產品訊飛聽見相結合，尋找落地場景。處於審慎考慮，稍晚時刻，科大訊飛會推出面向醫療場景的服務。

近兩年，人工智能技術發生了方向性的改變，用李彥宏的話說：從辨別式的人工智能走向生成式的人工智能，AIGC 成為新方向。

科大訊飛是“辨別式”人工智能時代，很早一批從事人工智能研究的企業，幾乎跟BAT 是同一時期創立的，2008 年已在深交所上市。前身歷史甚至更悠久，是80 年代中國科技大學的電子工程係人機語音通信實驗室。

不過，很長時間科大訊飛以to B 端服務商的身份，蟄居在客戶身後。 2016 年，羅永浩在錘子M1 手機新品發布會上的一番“胡說八道”帶火了科大訊飛。

羅永浩在發布會現場，展示一段沒有經過編排，只是一些生活瑣事，且語速較快的“口水話”，結果訊飛輸入法在羅永浩結束語音輸入的瞬間，幾乎是秒將語音轉換成文字，而且完全正確。現場響起了哇的驚呼，和長達23 秒的掌聲。

錘子的新品發布會，結果訊飛輸入法“炸”了，一炮而紅，市值和產品下載量雙雙暴增。

在人工智能時代以檢測和識別為主要應用的階段，科大訊飛在語音識別領域，將業務伸向眾多應用場景，形成了ToB + ToC + ToG 的三駕馬車。收入也水漲船高，從過連續10 年業績增長的神話，增長幅度較少的年份，增速都接近30%。

然而，AI 技術不斷更迭，在深度神經網絡及雲計算、大模型的演進過程中，理解、推理邏輯為基礎的生成式AI，成為新趨勢，AI 技術的迭代路徑，已不在科大訊飛的優勢區域了。

反映在財報上，便是連續10 年的業績增長神話終結。財報顯示，2022 年科大訊飛實現營收188.2 億元，同比僅增長2.77%；歸母淨利潤5.61 億元，同比下滑63.94%。

這是近五年來科大訊飛淨利潤的首次下滑。

商業模式之戰

最近幾個月大半個科技圈為AI 大模型沸騰。

2 月份出門問問的創始人李志飛到矽谷轉了一圈，想搞懂什麼是大模型。見了幾位谷歌科學家，了解一圈信息後，回國在源碼資本的分享會上跟王興、王慧文等創業者分享，結果分享出一位競爭對手：王慧文雖然不懂，但大受震撼，激動的要自帶資金，肉身入股，加入到AI 大模型的科技浪潮。

其他人也沒閒著，紛紛從功成名就的幕後，走向台前，李開復、王小川要組建團隊。退休後的張一鳴，沒有公開表態，也在悄咪咪的準備，挑燈夜讀學習OpenAI 的論文。

今年以來市場隔三差五有一款大模型產品問世，華為盤古，崑崙萬維天工。市場湧向大模型的熱烈氛圍被形容為蹭熱點的多，技術能打的少。

國內人工智能企業，似乎形成一種共識，構建起關鍵性門檻的並不是技術和算法環節，比拼的關鍵在於吸引客戶的能力。李志飛對此有過形象表述：“90% 以上的技術都沒有獨門武器，更多是一個門票。”

劉慶峰相信人工智能拼場景的商業模式，他曾說。 “人工智能改變世界，需要在一個又一個的領域進行應用的創新”。星火大模型發布後，他亦說道“誰能夠在具備社會剛需的應用場景落地，誰就最先能形成自我造血的良性循環。”

在應用落地上，國內AI 公司的發展速度比矽谷快10 倍。科大訊飛自去年12 月15 日正式啟動“1+N”認知大模型專項攻關，其中“1”就是指通用認知智能大模型，“N”就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。

只是，國內無論哪家企業發布AI 大模型產品，幾乎都是成交量進相同的應用場景。但一家技術型公司要一下子摸透各種細分行業的門道，並不現實。

技術不行，有時候就得靠技巧來湊。科大訊飛曾被爆出了人工翻譯冒充AI 的造假醜聞。在2018 創新與新興產業發展國際會議（IEID）的高端裝備技術與產業分會上，科大訊飛稱為現場提供了AI 同聲傳譯。

但事後，那場會議的同聲傳譯員卻在知乎上曝光，整場會議的翻譯都是由人員提供的，他甚至還提供了視頻證據，視頻顯示，AI 同傳的語音幾乎都是在復讀一位女翻譯員的翻譯。科大訊飛事後回應，“個別同傳譯員對於科大訊飛存在誤解，我們認為僅僅是對會議服務方面的分工溝通了解不清。”科大訊飛只是將同傳的“語音”轉成“文字”。

科大訊飛的短板在於，面向C 端它沒有一款國民級的應用，同樣是辦公場景，釘釘接入阿里的通義千問，通過輸入斜杠“/”，可喚起10 餘項AI 能力；字節跳動旗下的飛書也將上線AI 助手“My AI”，它們的人工智能技術可以跟現有的產品做結合。

面向B 端，結合客戶的需求，做應用場景的數據、算法。服務用戶的成本，難以分攤的。傳統的語音識別賽道，增速放緩，做toG 業務，需要考慮漫長的回款週期，現金流承壓。

好在，科大訊飛能得到政府支持，2022 年計入當期損益的政府補助金額甚至升到了10 億元，它一年淨利潤也不過才5.61 億元。

但拿到這些支持的科大訊飛老實發展技術了嗎？由於是高科技企業，科大訊飛能夠獲得許多政策上的支持，2018 年，央視曝光了科大訊飛的投機套路：以建設培訓基地為名換取園區類土地，再通過買賣地皮套現。

2021 年，科大訊飛董事長劉慶峰曾豪言，提出“2025 年千億營收目標，構建萬億生態”的承諾。按照現在目標進度，還沒有完成20%。它試圖通過擁抱多元化，發展橫跨機器人、教育、醫療、城市運營、房地產、消費、汽車、金融等多個條線的“一攬子”應用場景落地計劃，更像是為了達到營收目標的“飢不擇食”。

科大訊飛喊出追趕ChatGPT，但對押注AI 的互聯網企業來說，他們想追趕的是微軟。雲計算是生成式AI 時代的肥肉，就像無論誰做大模型，贏家都是英偉達，誰也繞不過被英偉達A100 芯片缺貨支配的命運。

ChatGPT 是人工智能產業中被廣為討論的顯性因素，就像飄在冰面上的一小塊兒浮冰，而掩藏在水下的冰山成交量，才是更為龐大的部分，算力是AI 的商業想像力。

資訊來源：由0x資訊編譯自8BTC。版權歸作者所有，未經許可，不得轉載

科大訊飛背上抄襲OpenAI 的罵名，冤嗎？

山寨幣盛宴，火幣HTX 12週年重磅福利：槓桿與合約雙重刺激，$80,000等你來拿

Coinbase 在與0x 項目的“交換器” 合約交互中損失約30 萬美元

BitMEX Research：加密貨幣持倉公司費用高昂，股東回報將長期受損

山寨季雖遲但會到？機構資金或成輪動新突破口

ChainLink整合冰定價數據並推出Link Reserve作為代幣聚集平台

機構：美聯儲9月會議必將出現反對意見

比特幣將新的歷史最高高點為$123,637

矮人企鵝CEO專訪：我們目標超越凱蒂和神奇寶貝

科大訊飛背上抄襲OpenAI 的罵名，冤嗎？

Related Posts