DeepSeek V4 Pro 永久降价75%:AI API价格战的终局还是开始?

上周刷Hacker News,看到DeepSeek V4 Pro那条帖子挂在热榜上大半天——260个赞,150多条评论,讨论的热度不亚于OpenAI发新模型。点进去一看,好家伙,V4 Pro那个75%的折扣从临时促销直接变成永久定价了。

说实话,第一时间我是不信的。V4 Pro原始价格是 $1.74/M input tokens(cache miss)、$3.48/M output tokens,打折后一路降到 $0.435 和 $0.87。促销本来5月31号到期,结果DeepSeek直接说:不恢复了,以后就这个价。

这已经不是降价了,这是掀桌子。

## 价格差有多大?拉个表看看

拿output token价格(每百万token)来比:

| 模型 | 价格($/1M output) |
|—|—|
| GPT-5.5 | $30.00 |
| Claude Opus 4.7 | $25.00 |
| Qwen 3.7 Max | $7.50 |
| GLM 1.5 | $3.08 |
| Grok 4.3 | $2.50 |
| **DeepSeek V4 Pro** | **$0.87** |
| DeepSeek V4 Flash | $0.28 |

V4 Pro比GPT-5.5便宜了**34倍**,比Opus 4.7便宜了**28倍**。而它本身是个正经的旗舰模型——1M上下文、384K max output、支持thinking mode和tool calls。不是阉割版,不是蒸馏版。

V4 Flash更夸张,output只要$0.28,cache hit更是低到$0.0028。这是什么概念?我的Cline和opencode现在基本全天挂在V4 Flash上写代码,一天下来花不到两美元。

## 价格怎么压下来的?

HN评论区有个哥们点到了关键:**MLA架构**。Multi-head Latent Attention把KV cache压缩了5到13倍。这意味着同样的硬件跑推理,DeepSeek的边际成本天然就比标准Transformer架构低。这不是烧钱补贴抢市场,是工程能力上确实有东西。

还有一点容易被忽略——DeepSeek的cache hit策略很激进。V4 Pro cache hit价格是$0.003625,cache miss是$0.435。差了120倍。如果你做RAG或者多轮对话,大部分请求都会命中缓存,实际成本比标价还要低一个数量级。

## 中国厂商在打什么牌?

有人说这是”中国公司玩长线,想靠价格战耗死美国对手”。我觉得没那么阴谋论。更合理的解释是:

1. **芯片限制逼出了效率**。Huawei Ascend上跑出来的推理优化,功耗比和成本控制可能确实比A100/H100方案更有优势。
2. **开源策略的反哺**。DeepSeek一直开源模型权重,社区反馈和优化加速了工程迭代。
3. **国内市场够大**。中国开发者社群对价格极度敏感,低价策略能快速吃掉市场份额。

而且别忘了,这是API定价。如果你用量大到订阅费不划算的程度(每天几百万token进出),per-token计费反而更便宜。好几个HN用户说他们用Claude/Codex订阅碰到session limit就卡住,切到DeepSeek API之后反而更流畅。

## 实际体验怎么样?

我自己用V4 Pro和V4 Flash大概三周了,说几个真实感受:

**代码能力**:V4 Pro在复杂重构任务上非常稳。有次重构一个800行的Python service,用Opus出方案、V4 Pro落地实现,来回几轮就搞定了。单独用Opus也能做,但想想token消耗……

**Thinking mode**:这是个容易被低估的功能。DeepSeek的Chain of Thought读起来很有意思——它不是那种套话式的”让我分析一下”,而是真的在内部推演不同方案。有时候看它的”思考过程”比看最终答案还有收获。

**不足**:V4 Flash偶尔会在长上下文中”跳脱”,比如100K之后注意力开始漂移。Pro版好很多,但消耗token的速度也明显更快(有个HN用户吐槽说token烧得飞快)。

**数据安全**:HN上不少人担心用中国厂商API的数据风险。说实话这个问题没有完美答案。如果是公司内部敏感代码,建议走gateway脱敏。个人项目的话,我倾向于”别把鸡蛋放一个篮子”——关键逻辑用本地模型跑一遍,日常辅助调API。

## 价格战的下一步?

DeepSeek这波操作给我的感觉是:**API推理正在变成和水电煤一样的基础设施**。价格趋近于边际成本,差异化会从”谁的模型更强”转向”谁的生态更好”。

接下来几件事值得关注:

– **DeepSeek自家的coding agent**。HN上有人提到他们似乎在做一个类似Cline/Codex的产品。如果定价和API一样激进,Copilot那种$10/月的模式可能会很难受。
– **Context caching的军备竞赛**。DeepSeek 1/10的cache hit定价已经很低了,其他家跟不跟?
– **开源模型的本地部署**。V4级别的模型虽然还不能在个人电脑上跑,但量化版本已经在路上了。

**最后**:如果你还没试过DeepSeek V4系列,现在是个好时机。API注册送额度,文档也写得清楚,OpenAI兼容格式一行代码就能切过去。我自己的open-code配置现在是Opus 4.7做planning + V4 Flash做implementation,体验远好于单模型方案,成本直接降到原来的零头。

价格战打到最后,受益的是我们这些写代码的。趁现在,多薅点。

*评论区聊聊:你现在主力用哪个模型的API?有没有被token账单吓到过?*