中國人工智能初創公司 DeepSeek 於週五發佈了其備受期待的 DeepSeek V4 大語言模型預覽版,讓用戶得以測試其新功能和特點。此發佈距離該公司推出 R1 推理模型已超過一年,R1 模型曾因其驚人的性能和成本效益而震驚全球科技市場。

重點文章
V4 模型延續開放源碼優勢
DeepSeek 的最新升級與其過往模型發佈一樣,採取開放源碼策略,允許開發者下載、本地運行並修改其程式碼。DeepSeek V4 模型提供 Pro 和 Flash 兩種版本,DeepSeek 聲稱其在國內競爭中表現強勁,尤其在基於代理的任務、知識處理和推理方面。DeepSeek 也表示,V4 已針對 Anthropic 的 Claude Code 和 OpenClaw 等常用代理工具進行了優化。
震撼性價格極具競爭力
這兩款模型均採用混合專家架構(MoE),支援 100 萬 token 的超長上下文。DeepSeek-V4-Pro 的總參數高達 1.6T,啟動參數為 49B;Flash 版本總參數則為 284B,啟動參數為 13B。兩款模型均遵循標準的 MIT 許可證開源。
DeepSeek-V4-Pro 已成為目前全球規模最大的開源權重模型。其參數規模超越了 Kimi K2.6(1.1T)與 GLM-5.1(754B),更是前代 DeepSeek V3.2(685B)的兩倍以上。
在容量方面,Pro 模型在 Hugging Face 上的容量為 865GB,Flash 模型則為 160GB。這意味著經過輕量量化的 Flash 模型有望在具備 128GB 的 M5 MacBook Pro 上運行;
測試顯示,該系列模型在生成複雜圖形(如 SVG 格式)上表現出色,但其最顯著的競爭優勢在於極致的成本控制。DeepSeek V4 的定價極具破壞性:Flash 模型每百萬 token 輸入僅需 0.14 美元,輸出 0.28 美元;Pro 模型輸入為 1.74 美元,輸出 3.48 美元。


| Model | Input ($/M) | Output ($/M) |
|---|---|---|
| DeepSeek V4 Flash | $0.14 | $0.28 |
| GPT-5.4 Nano | $0.20 | $1.25 |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 |
| Gemini 3 Flash Preview | $0.50 | $3 |
| GPT-5.4 Mini | $0.75 | $4.50 |
| Claude Haiku 4.5 | $1 | $5 |
| DeepSeek V4 Pro | $1.74 | $3.48 |
| Gemini 3.1 Pro | $2 | $12 |
| GPT-5.4 | $2.50 | $15 |
| Claude Sonnet 4.6 | $3 | $15 |
| Claude Opus 4.7 | $5 | $25 |
| GPT-5.5 | $5 | $30 |
R1 模型曾震驚市場
DeepSeek 成立於 2023 年,於 2024 年底因其免費且開放源碼的 V3 模型而廣受關注。該公司聲稱 V3 模型使用效能較低的晶片進行訓練,成本僅為 OpenAI 和 Google 等公司模型的零頭。數週後,在 2025 年 1 月,DeepSeek 發佈了 R1 推理模型,其表現達到甚至超越了許多全球頂尖的大語言模型。
R1 模型發佈時,DeepSeek 揭露其僅用兩個月、不到 600 萬美元的成本,便利用低容量 Nvidia 晶片建成該模型,這讓投資者感到震驚。此舉挑戰了美國在 AI 領域的領先地位,以及科技巨頭在 AI 基礎設施上的龐大開支。雖然 DeepSeek 此後發佈了一系列模型升級,但都沒有達到 R1 的影響力。
Morningstar 高級股票分析師 Ivan Su 表示,V4 的首次亮相不太可能產生與 R1 相同的市場影響,因為交易者已充分考慮到中國 AI 具有競爭力且使用成本更低的現實。然而,Su 指出,DeepSeek 的最新定位將其他中國開放源碼模型列為直接競爭對手。他補充說:「這是 R1 時期所沒有的框架,單憑這一點就足以說明國內競爭已變得多麼激烈。」自 R1 發佈以來,DeepSeek 在中國蓬勃發展的 AI 領域面臨日益激烈的競爭,阿里巴巴和字節跳動等公司也在 2026 年發佈了新模型。
華為晶片支援 Deepseek V4
圍繞 DeepSeek V4 模型發佈的一個關鍵問題是,其訓練和支援使用了哪些晶片。中國公司華為週五證實,其搭載昇騰 AI 處理器的最新 AI 計算叢集可支援 DeepSeek 的 V4 模型。然而,目前尚不清楚相較於美國 AI 晶片領導者 Nvidia 的晶片,華為晶片在訓練中的使用程度如何。由於華盛頓不斷變化的出口管制,中國開發者一直無法直接採購 Nvidia 最先進的 AI 晶片。
與此同時,中國加大了發展國內晶片產業的力度,據報導還推動中國科技公司採用來自華為等晶片製造商的國內替代方案。Counterpoint 的 Wei Sun 表示,V4 能夠在本機晶片上原生運行的能力可能產生重大影響,有助於中國實現更高的 AI 主權,並進一步減少對 Nvidia 的依賴。