首批DeepSeek 開發者已開始陸續離開

DeepSeek自從火爆以來，穩定性的問題逐漸凸顯。初期吸引了大量開發者，如林森等，但隨著用戶量大幅上漲，API接口頻繁遭遇無法調用的情況，導致開發者程序癱瘓，憤怒和失望愈發明顯。儘管DeepSeek曾憑藉其較低的調用成本和穩定性贏得了市場，但一系列服務異常讓開發者們不得不轉向其他大模型，如ChatGPT。為了提供穩定服務，開發者們在切換模型時不僅需要時間，還要面臨調整成本的問題。

在競爭日益激烈的環境中，其他大模型廠商也開始逐步提升服務穩定性和降價，同時加強對開發者的支持，進一步施壓DeepSeek。儘管目前DeepSeek仍保持一定熱度，但開發者對其的忠誠度正受到考驗，許多開發者開始尋找更穩定的替代品。未來，DeepSeek將面臨更大的挑戰，包括降價競爭以及對開發者服務的不足。

爆火之後，穩定成了剛需。

圖片來源：由無界AI生成

在DeepSeek服務繁忙的回复背後，不只是普通用戶的焦急等待，當API接口響應突破臨界閾值，DeepSeek開發者的世界，也出現了持續震蕩的蝴蝶效應。

1月30日，接入DeepSeek的base北京的AI開發者林森，突然收到程序後台報警，還沒來得及為DeepSeek的出圈高興幾天，林森的程序便因為無法調用DeepSeek，後台被迫癱瘓了3天。

一開始，林森以為這是因為在DeepSeek的賬戶餘額不足導致的。直到2月3日春節假期過後返工，他終於接到了DeepSeek暫停API充值的通知。此時，儘管賬戶內餘額充足，他也無法再調用DeepSeek了。

林森接到後台通知的第三天，DeepSeek官方於2月6日正式對外發佈公告，宣布暫停API服務充值。近半個月過去，截至2月19日，DeepSeek開放平台的API充值服務仍未恢復正常。

圖注：DeepSeek開發者平台仍未恢復充值圖源：字母榜截圖

在意識到後台癱瘓是由於DeepSeek服務器過載，而自己作為開發者，長達數天，卻沒有收到任何提前告知，更沒有任何售後維護服務時，林森有種“被拋棄”的感覺。

“就像家門口有一家小店，你是老顧客，辦了卡，一直和老闆相處很好。突然有一天，小店被評為米其林餐廳，老闆把老顧客拋在一邊，之前辦的卡也不認了。”林森形容道。

作為2023年7月開始部署DeepSeek的第一批開發者，林森為DeepSeek的出圈感到振奮，但如今，為了維持運轉，他只能切換至ChatGPT，畢竟“ChatGPT雖然貴一點，但至少穩定。 ”

當DeepSeek從口口相傳的小店變成網紅打卡的米其林餐廳，更多和林森一樣調用無門的開發者們，紛紛開始逃離DeepSeek。

2024年6月，小窗AI問答機在產品早期階段就接入了DeepSeek V2，讓小窗合夥人婁礦池頗為驚豔的是，那個時間點，DeepSeek是唯一能全文背誦《岳陽樓記》不會出錯的大模型。因此，團隊用DeepSeek承擔了產品最核心的功能角色之一。

但對於開發者而言，DeepSeek雖好，穩定性卻始終有所欠缺。

婁礦池告訴字母榜（ID：wujicaijing），春節期間，不僅是C端用戶訪問繁忙，開發者們也時常無法調用DeepSeek，團隊決定選擇幾個已經接入DeepSeek的大模型平台同時調用。

畢竟，“現在已經有幾十個平台有滿血版DeepSeek R1了。”用這些大模型平台的R1，配合Agent和Prompt，也能滿足用戶的需求。

為了爭搶DeepSeek外溢而出的開發者群體，有頭部雲廠商開始面向開發者頻頻舉辦活動，“參與活動就免費送算力，如果不大批量調用，小開發者幾乎能免費使用。”易標AI技術總監楊惠超表示。

不過，DeepSeek熱度當前，在第一批開發者們出逃之際，更多開發者仍在蜂擁而至，希望蹭到前者的流量紅利。

郗鑒創業的項目，是通過調用DeepSeek的API來進行角色扮演的AI陪伴APP，2月2日上線首周就獲得了約3000名的活躍用戶。

儘管有用戶反饋DeepSeek的API調用時有報錯，但已經有60%的用戶希望郗鑒盡快推出安卓版。在郗鑒的社交媒體後台，每天都有至少幾十個用戶私信要下載鏈接，“搭建在DeepSeek上的AI陪伴平台”，無疑成了APP出圈的新標籤。

經字母榜統計，在DeepSeek官網內收錄的接入DeepSeek的各類APP名單，2025年前APP名單僅有182行，如今已經擴展到了488行。

一面是DeepSeek成為“國產之光”爆火出圈，7天湧入1億用戶，另一面，則是第一批部署在DeepSeek上的開發者，正因為過載人流導致的服務繁忙，而紛紛轉投其他大模型。

對開發者而言，長時間的服務異常不再是簡單的故障，而演變成為代碼世界和商業邏輯間的裂縫，他們被迫在遷移成本下進行生存演算，無論是湧入，還是逃出，開發者們都需要面對DeepSeek爆火帶來的餘震。

一

春節期間小程序後台被迫癱瘓三天后，至大年初六，為了保證程序正常運轉的林森，離開已經部署一年多的DeepSeek，轉回了ChatGPT。

即使API調用價格高了近10倍，但此時保證服務的穩定，成了優先級更高的選項。

值得注意的是，開發者離開DeepSeek轉向其他大模型，並不如用戶在APP內切換調用模型一般輕鬆。 “不同的大語言模型，甚至是同一個語言模型的不同版本，對於提示詞的反饋結果都有細微的差別。”即便林森仍在持續調用ChatGPT，將所有關鍵節點從DeepSeek遷移ChatGPT，並保證穩定且高質量的內容反饋，仍然花了他半天多的時間。

切換這個動作本身也許只需要兩秒鐘，但“更多開發者，換一個新模型要花上一個星期反複調整提示詞，並重複測試。”林森告訴字母榜，

在林森這樣的小開發者們看來，DeepSeek服務器不足可以理解，只是如果能提前通知，能避免許多損失，無論是時間成本，還是APP維護成本。

畢竟，“登錄DeepSeek開發者後台需要手機號註冊，只需要一個短信，就可以提前告知開發者。”如今，這些損失將由曾在DeepSeek默默無名時就開始支持他們的開發者自己承擔。

當開發者和某個大模型平台深度耦合，穩定性無疑成了不必宣之於口的契約，一個頻繁波動的服務接口，足以讓開發者重新審視對平台的忠誠度。

就在去年，林森在調用Mistral大模型（法國頭部大模型公司）時，因為Mistral賬單系統錯誤而重複付費，在他發出郵件後，Mistral不到1小時就糾正了問題，並附上了100歐元的代金券作為賠償。這樣的應對，也讓林森產生了更多信任。如今，他也將一部分服務遷回到了Mistral。

易標AI技術總監楊惠超則在DeepSeek V3 版本發布之後，就開始醞釀一場逃離。

不用DeepSeek來寫詩或者吐槽，如果用DeepSeek來寫標書呢？負責公司內AI標書項目的楊惠超，在DeepSeek推出V3版本後已經著手尋找替代方案。對他來說，在標書這樣的專業領域，“DeepSeek穩定性越來越不足。”

DeepSeek R1版本火出圈的推理能力，並不吸引楊惠超。畢竟，“作為開發者，軟件主要的推理能力是靠程序和算法，並不是太依靠模型的基礎能力。底層即便用最老的GPT 3.5，依靠算法糾正都可以產出一個很好的結果，模型只要回复答案穩定就可以。”

在實際調用過程中，DeepSeek在楊惠超眼中，似乎更像是一個聰明卻會偷懶的“好學生”。

升級V3版本後，楊惠超發現，DeepSeek對一些複雜問題有了更高的回答成功率，但穩定性卻也攀升到了難以接受的程度，“現在問10條問題，至少有一條輸出不穩定，在要求生成的內容之外，DeepSeek往往喜歡自由發揮，額外生成和問題無關的內容。”

比如，標書內不允許出現錯誤字符，同時，大模型返回的結果，開發者們往往指定用Json 結構（用指令每次調用大模型使得穩定返回固定字段）去輸出數據，便於後續函數調用，但出現錯誤或者不准確，都會導致後續調用失敗。

“DeepSeek R1，或許相對此前的V3版本，推理能力提升了很多，但是穩定性達不到商業化的水準。”在@生產力Mark賬號內，楊惠超提到。

圖注：DeepSeek V3生成過程中出現亂碼圖源：@生產力Mark賬號

作為2024年初，DeepSeek-coder時期就加入的第一批用戶，楊惠超並不否認DeepSeek是一個好學生，只是如今，為了保證生成標書的質量和穩定性，楊惠超只能將目光轉向國內其他更偏B端用戶的大模型企業。

畢竟，曾經被稱為AI界拼多多的DeepSeek，正是憑藉著性價比的標籤，迅速聚集起一批中小AI開發者。但現在想直接穩定地調用DeepSeek，就必須進行本地部署。 “部署一個DeepSeek R1，需要30萬~ 40 萬元的成本，如果用線上的API計算，30萬元我一輩子都用不完。”

既不夠便宜，又不夠穩定，調用無門的楊惠超們，正在批量離開DeepSeek。

二

曾經，林森們是第一批堅定選擇DeepSeek的人。

2024年6月份，林森在開發自己的AI 小程序少年聽世界時，曾經對比了當時國內外幾十家大模型平台。他需要用大模型每天處理數千條新聞，並且篩選、排序，找出適合青少年聽的科技、自然新聞，並且對新聞文字進行處理。

這不僅要求大模型聰明，還得便宜。

涉及到每天數千條的新聞處理，對token的消耗極大，對獨立開發者的林森來說，ChatGPT模型很貴，只適合處理核心環節，對大量文本的快速篩选和分析，還要靠別的價格更低的大模型做支持。

同時，無論是國外的Mistral、Gemini ，還是ChatGPT，調用都很繁瑣：你需要在國外有一個具體的服務器，還要做中繼站，同時需要用國外的信用卡購買token。

林森便是通過英國朋友的信用卡，才能在ChatGPT賬戶完成充值。而一旦服務器在海外，API 響應速度也會有所延遲，這都讓林森將目光投向國內，尋找一款ChatGPT平替。

DeepSeek讓林森頗為驚艷。 “當時DeepSeek並不是最有名的，但卻是反饋最穩定的。”以每10秒請求一次API調用為例，其他國內大模型100次內可能有30%的時候，不返回任何內容，但DeepSeek次次返回，並都能維持不遜色ChatGPT和BAT們大模型平台的回复質量。

而相比起ChatGPT和BAT們的大模型API調用價格來說，DeepSeek真的太便宜了。

林森將大量新聞閱讀和初步分析的工作交給DeepSeek後，發現DeepSeek的調用成本10倍低於ChatGPT。經過指令優化後，每天調用DeepSeek的成本低到2-3元，“可能跟ChatGPT相比，它不是最好的，但DeepSeek的價格是極低的，對於我的項目來講，它的性價比非常高。”

圖注：林森用大模型收錄新聞並分析（左）最終呈現在少年聽世界小程序（右）圖源：林森提供

性價比，成了開發者們選擇DeepSeek的首要原因。 2023年，楊惠超一開始將公司的AI項目從ChatGPT 切換到了Mistral，主要便是為了控製成本。隨後2024 年5月份DeepSeek推出V2版本，將API打到了2元每百萬token，這無疑是對其他大模型廠商的降維打擊，這也成了楊惠超將公司做AI標書工具的項目切換到DeepSeek的緣起。

同時，經過測試後，楊惠超發現，國內早已靠雲服務在B端吃下市場的BAT們，“平台太重了”。

對於易標AI這樣的初創公司來說，如果選擇BAT，會面臨雲服務的捆綁消費。對於只是簡單調用大模型服務的楊惠超來說，無疑DeepSeek的API 調用更加省事。

在遷移成本上，DeepSeek也勝了一籌。

無論是林森還是楊惠超，初始的APP開發都是基於OpenAI 的接口形式，如果切換到BAT們的大模型平台，都要把底層重新開發一遍。但DeepSeek兼容OpenAI like接口，切換大模型只需要修改平台地址，“1分鐘無痛切換。”

小窗AI問答機正式銷售的第一天就搭載了DeepSeek，並將5個核心角色中語文和作文指導的角色交給了DeepSeek進行構建。

作為合夥人，婁礦池也在去年6月就被DeepSeek驚艷到。 “DeepSeek在中文理解上能力很棒，是那個時間點唯一全文背誦《岳陽樓記》不會出錯的大模型。”婁礦池告訴字母榜，相比起其他大模型中規中矩、班味十足的文檔式輸出，用DeepSeek教孩子寫作文，往往贏在了寫作的想像力上。

在社交媒體風靡用DeepSeek寫詩、寫科幻小說之前，DeepSeek的華麗文風，就讓小窗AI團隊眼前一亮。

對於開發者們來說，他們仍在期待DeepSeek恢復調用，眼下無論是遷移到BAT們部署了滿血版DeepSeek R1的平台，還是轉向其他大模型廠商，都似乎是“菀菀類卿”。

三

但競爭對手正在努力追平DeepSeek深度推理的出圈特長。

國內，近期百度、騰訊都陸續在自研大模型中加入深度思考能力；國外，OpenAI也在2月緊急上新“Deep Research”，把推理大模型的思考能力用於聯網搜索，並將對Pro 、Plus和Team用戶開放。谷歌人工智能實驗室（Google DeepMind）也在2月發布了Gemini 2.0模型系列，其中2.0 Flash Thinking實驗版本則是一款增強推理能力的模型。

值得關注的是，DeepSeek仍然以文本閱讀為主，但不管是ChatGPT還是Gemini 2.0，在支持深度思考之餘，都已經將推理能力引入多模態，支持視頻、語音、文檔、圖片等多種輸入模態。

對DeepSeek來說，在追趕多模態之餘，更大的挑戰還來自競爭對手在價格上的逼近。

在雲平台部署側，一眾頭部雲廠商都選擇接入DeepSeek，一邊分食流量，一邊靠雲服務綁定客戶。對DeepSeek大模型的調用，某種程度上甚至成了綁定企業雲服務的“贈品”。

百度創始人李彥宏近期提出，在大語言模型領域，“每12個月，推理成本就可以降低90%以上。”

在推理成本下跌的趨勢下，BAT們的API調用價格持續走低已成必然，DeepSeek的性價比優勢，正在迎來大廠新一輪價格戰的壓力。

不過，大模型API價格戰只是起步，面向開發者，大模型廠商們還拼起了服務。

林森接觸過大大小小眾多的大模型平台，讓他印象深刻的是，某科技大廠會有專門的客戶經理進行對接，無論是不穩定還是出現技術問題，都會主動和開發者聯繫。

而儘管作為一個開源的大模型平台，目標是為開發者提供更普惠的AI支持，DeepSeek甚至在官網沒有面向開發者出具發票的入口。

“每次API充值完，不像其他大模型平台一樣可以直接在後台開發票，DeepSeek需要繞到官網外，添加客服企業微信開具發票。”楊惠超告訴字母榜，無論是價格還是服務，DeepSeek“性價比”的標籤，似乎都有點立不穩了。

某頭部大廠AI產品經理告訴字母榜，有的互聯網公司leader堅持用DeepSeek替換原有大模型，完全不管替換模型重新調整Prompt所耗費的時間。同時，即便滿血版的DeepSeek R1，也有不少通用能力如‌Function calling等並不支持。

相比起用雲服務跑通了B端服務場景的BAT們，在便捷度上，DeepSeek仍然差著AI大廠一截。

只是DeepSeek的流量效應暫未褪去，趕潮人依然眾多。

有部分公司宣稱接入DeepSeek，只是開始調用API，充值了幾百塊。有的公司公告部署了DeepSeek模型，但其實只是讓員工看了看B站教程，下載了一鍵安裝包。在這波DeepSeek熱潮裡，泥沙俱下，魚龍混雜。

潮水終將褪去，但DeepSeek要做的功課顯然更多了。

首批DeepSeek 開發者已開始陸續離開

一

二

三

ALT5 Sigma計劃籌集高達15億美元設立WLFI儲備，Eric Trump加入董事會

冷錢包吸引關注，戰略交易者增長3,423％XRP下跌時ENA逆勢上漲

Stripe與Paradigm合作開發L1區塊鏈Tempo

分析師稱Cardano重現2021年高模式，注意關鍵阻力位

Goiânia將在8月23日至24日與Renato“Trezoitão”開展比特幣接收任務

WLFI推出USD1穩定幣生態，構建數字美元全球支付新基礎設施

這就是您早售賣XRP可能是最大錯誤的原因

美官員稱英偉達和AMD同意向美政府上繳15%收入換出口許可

首批DeepSeek 開發者已開始陸續離開

一

二

三

Related Posts