Deepseek 是什麼? 讓輝達股價暴跌的 AI 模型

本來想說已經過了時效性就不寫這個主題了，不過因為近期剛好工作上也在如火如荼的研究 AI，趁假日有空，靜下心來看完了現在 Deepseek 的資訊，決定用這篇文章來做個 summary 並分享我的看法!

沒錯，大約過年前後，中國 AI 新創 Deepseek 宣稱自己已經成功開發出效能與體驗直追 ChatGPT 的 AI 模型，並在短短幾天內超越 ChatGPT 成為 App store 下載次數第一的應用程式。

更令人震驚的是，Deepseek 宣稱這套最新模型 Deepseek-V3 的訓練成本僅花費約 600 萬美元，顛覆了市場上對 AI 模型訓練的認知，原來訓練出一個厲害的 AI 模型，其實不用這麼多高階晶片?

這也讓 AI 晶片龍頭 NVIDIA 的股票下跌了 16.86%，市值蒸發了 6000 億美元。究竟 Deepseek 事件有哪些值得我們注意的地方，對未來又有哪些影響?

快速導覽

3 個重點讓你快速了解 Deepseek

相信很多人在點開這篇文章之前，對於 Deepseek 的了解就是:

喔~~就是中國出了一個很厲害的 AI 模型，實力堪比 ChatGPT…然後呢?

不要害羞，因為在我認真 Study 之前，對它的了解也沒有好到哪裡去。

可是既然我們身處在 AI 的時代，對於這樣一個足以改變市場局勢的模型，不去了解它的話也太可惜了，因此我幫大家 Summary 了 Deepseek 的 3 個重點，讓你快速進入狀況!

重點一、中國 AI 技術突破美國壓制

沒錯，Deepseek 的第一個重點就是它是由中國 AI 新創公司所推出的模型，性能直追 ChatGPT 的最新模型，引起轟動。

近年來美國積極的透過出口限制來阻止中國獲得最新的高階晶片和技術，為的就是想保持自己的技術領先地位。

然而即便是這樣的條件下，中國還是打造出了堪比 ChatGPT 的 AI 模型，迎頭趕上美國的幾大科技巨頭，無疑證明了中國的技術已經足以突破美國的壓制。

重點二、超級低的 AI 模型訓練成本

除了性能強大之外，Deepseek 最讓人感到震驚的是他的訓練成本。

相較於 ChatGPT、Gemini 和 Claude 等 AI 模型動輒都需要上億美元的訓練成本，Deepseek 宣稱它的 Deepseek-V3 模型只需不到 600 萬美元，不僅成本大幅降低，性能也直追市場上的主流模型。

這也讓大家開始擔心 Deepseek 的橫空出世是否代表了訓練 AI 模型並不需要這麼多的高階晶片，同時存在著更有效率的訓練方式，整個 AI 產業的發展都會因此受到影響。

關於那 600 萬美元的訓練成本是怎麼來的，網路上已經有很多專家提供了詳細的解釋，這裡就不班門弄斧，有興趣的朋友可以看下面的文章多多了解。

重點三、實力堪比市面主流 AI 模型

在 Deepseek 推出最新模型之後，國外有許多專家拿它和 OpenAI 的 o1模型進行比較，其中也不乏分析了一些像是「混和專家模型(MoE)」、「多頭注意力(MLA)」的技術…

直接說結論: 無論是算數學、寫程式等任務，它的表現都跟 OpenAI 的 o1 正式版不相上下。

這也是為何它能引起各路專家注意，就是因為在經過測試之後，中國的確以較低的訓練成本，成功打造出了能和現在市場主流對比的 AI 模型。

關於 Deepseek 模型能力的細節，推薦大家可以參考下方的文章，裡面很詳盡的分析了 Deepseek 的兩種模型和 OpenAI ChatGPT-o1 模型的比較。

【推薦閱讀】DeepSeek是什麼？對目前的AI有什麼影響？

Deepseek 對市場帶來的 3 大影響

Deepseek 這次可謂是引發轟動，除了讓 NVIDIA 股價單日蒸發將近 6000 億美元以外，也讓 OpenAI、Google 和 Meta 等科技巨頭受到威脅。

我將在這段快速和大家分享 Deepseek 對市場帶來的 3 大影響，感受一下事情的嚴重性。

影響一、NVIDIA 股價單日蒸發 6000 億美元

這個前面就有提到，因為 Deepseek 證明了自己即便不靠那些科技巨頭動輒上億美金的基礎建設，也能訓練出厲害的 AI 模型，那麼將來大家對高階晶片還有這麼大的需求嗎? 沒有人說得準。

也正因如此，本來靠著幾乎獨佔高階晶片市場而獲取暴利的 NVIDIA，自然在這一波質疑中受到嚴重影響，單日股價暴跌 16.86%，市值蒸發約 6000 億美元。

應該有很多美股投資人在這一次受到打擊XD 過年前來這一下還真不好受~

影響二、OpenAI 緊急推出 ChatGPT-Deep Research 模型

第二個影響就是各大科技巨頭為了應對 Deepseek 這次推出的新模型展開內部研究，並推出新的模型來證明自己能力仍舊凌駕於 Deepseek 之上。

其中最值得關注的莫過於龍頭 ChatGPT 在 2 月初立刻推出的 Deep Research 模型（連演都不演了，明顯是拿來和 Deepseek 對比的模型）

這個模型到底有多厲害，簡單來說就是一個能夠根據主題自己做功課，整理完所有資訊後提供「研究報告」給你的模型。

做研究的能力甚至比許多碩士/博士生還要強，這也讓許多專家讚嘆這真的太扯，一個月只要花大約 6000 台幣的訂閱費，就能請到一位碩博士生來幫你整理資料…

細節推薦大家可以去看瓦基的文章，裡面有很詳細的測試和使用心得，搞得我都有點心動了XD

影響三、AI Agent 時代即將來臨

這兩年我們陸續看到手機、平板和一些設備上陸續導入 AI，但說真的，大部分都是一些自動化、簡易問答和一些嚴格來說根本不 AI 的功能。

即使我身處手機品牌廠，也時常覺得很多 AI 功能一點也不智能，只是個噱頭而已。

但隨著這次 Deepseek-V3、R1 模型的出現，推理模型的進度被提前拉到世人面前，在接收到人類的複雜指令後，能利用蒐集到的資訊，自行做出計畫，將指令拆解成不同步驟，一一實現。

沒錯，AI Agent 就像人類一樣，擁有思考和推理能力，能根據收到的問題 or 指令規劃該如何解決，真正實現 AI 替你解決問題並做出行動的理想。

這真的很厲害也很值得期待，其實從這次在 S25 上推出的 Gemini Live AI 助手就已經能初見端倪。

用戶只需提出問題，甚至不用很具體，AI 就能根據你當下的手機設定和疑問，建議你可以如何解決，甚至自動幫你調整設定，這才是我們一般用戶想像中的 AI!

【推薦閱讀】AI Agent來了，但它是什麼？AI代理介紹、趨勢全解讀

我的觀點: Deepseek 橫空出世將加速 AI 技術進展

Deepseek 除了訓練成本和建置成本低以外，另一個關鍵是它是個「開源」模型。

也就是說，各家廠商可以拿著 Deepseek 模型的原始碼在自家的運算建設上使用，不再需要透過科技公司的雲端服務使用這些模型。

加上開源的特性，讓全世界的開發者都能基於 Deepseek 現在的程式碼基礎，延伸開發出更強、優化更多的模型，加速整個 AI 技術的進展。

至於「低成本+開源」模型對西方科技巨頭帶來的影響，以及未來的 AI 技術發展是否能從原先科技巨頭壟斷的局勢變成全民皆可擁有自己的 AI 模型?

推薦大家可以去看下面的兩篇文章，個人覺得寫得相當精闢與到位!