DeepSeek V4 Pro 永久降价75%：AI API价格战的终局还是开始？

发表于2026年5月23日作者 zoran

上周刷Hacker News，看到DeepSeek V4 Pro那条帖子挂在热榜上大半天——260个赞，150多条评论，讨论的热度不亚于OpenAI发新模型。点进去一看，好家伙，V4 Pro那个75%的折扣从临时促销直接变成永久定价了。

说实话，第一时间我是不信的。V4 Pro原始价格是 $1.74/M input tokens（cache miss）、$3.48/M output tokens，打折后一路降到 $0.435 和 $0.87。促销本来5月31号到期，结果DeepSeek直接说：不恢复了，以后就这个价。

这已经不是降价了，这是掀桌子。

## 价格差有多大？拉个表看看

拿output token价格（每百万token）来比：

| 模型 | 价格（$/1M output） |
|—|—|
| GPT-5.5 | $30.00 |
| Claude Opus 4.7 | $25.00 |
| Qwen 3.7 Max | $7.50 |
| GLM 1.5 | $3.08 |
| Grok 4.3 | $2.50 |
| **DeepSeek V4 Pro** | **$0.87** |
| DeepSeek V4 Flash | $0.28 |

V4 Pro比GPT-5.5便宜了**34倍**，比Opus 4.7便宜了**28倍**。而它本身是个正经的旗舰模型——1M上下文、384K max output、支持thinking mode和tool calls。不是阉割版，不是蒸馏版。

V4 Flash更夸张，output只要$0.28，cache hit更是低到$0.0028。这是什么概念？我的Cline和opencode现在基本全天挂在V4 Flash上写代码，一天下来花不到两美元。

## 价格怎么压下来的？

HN评论区有个哥们点到了关键：**MLA架构**。Multi-head Latent Attention把KV cache压缩了5到13倍。这意味着同样的硬件跑推理，DeepSeek的边际成本天然就比标准Transformer架构低。这不是烧钱补贴抢市场，是工程能力上确实有东西。

还有一点容易被忽略——DeepSeek的cache hit策略很激进。V4 Pro cache hit价格是$0.003625，cache miss是$0.435。差了120倍。如果你做RAG或者多轮对话，大部分请求都会命中缓存，实际成本比标价还要低一个数量级。

## 中国厂商在打什么牌？

有人说这是”中国公司玩长线，想靠价格战耗死美国对手”。我觉得没那么阴谋论。更合理的解释是：

1. **芯片限制逼出了效率**。Huawei Ascend上跑出来的推理优化，功耗比和成本控制可能确实比A100/H100方案更有优势。
2. **开源策略的反哺**。DeepSeek一直开源模型权重，社区反馈和优化加速了工程迭代。
3. **国内市场够大**。中国开发者社群对价格极度敏感，低价策略能快速吃掉市场份额。

而且别忘了，这是API定价。如果你用量大到订阅费不划算的程度（每天几百万token进出），per-token计费反而更便宜。好几个HN用户说他们用Claude/Codex订阅碰到session limit就卡住，切到DeepSeek API之后反而更流畅。

## 实际体验怎么样？

我自己用V4 Pro和V4 Flash大概三周了，说几个真实感受：

**代码能力**：V4 Pro在复杂重构任务上非常稳。有次重构一个800行的Python service，用Opus出方案、V4 Pro落地实现，来回几轮就搞定了。单独用Opus也能做，但想想token消耗……

**Thinking mode**：这是个容易被低估的功能。DeepSeek的Chain of Thought读起来很有意思——它不是那种套话式的”让我分析一下”，而是真的在内部推演不同方案。有时候看它的”思考过程”比看最终答案还有收获。

**不足**：V4 Flash偶尔会在长上下文中”跳脱”，比如100K之后注意力开始漂移。Pro版好很多，但消耗token的速度也明显更快（有个HN用户吐槽说token烧得飞快）。

**数据安全**：HN上不少人担心用中国厂商API的数据风险。说实话这个问题没有完美答案。如果是公司内部敏感代码，建议走gateway脱敏。个人项目的话，我倾向于”别把鸡蛋放一个篮子”——关键逻辑用本地模型跑一遍，日常辅助调API。

## 价格战的下一步？

DeepSeek这波操作给我的感觉是：**API推理正在变成和水电煤一样的基础设施**。价格趋近于边际成本，差异化会从”谁的模型更强”转向”谁的生态更好”。

接下来几件事值得关注：

– **DeepSeek自家的coding agent**。HN上有人提到他们似乎在做一个类似Cline/Codex的产品。如果定价和API一样激进，Copilot那种$10/月的模式可能会很难受。
– **Context caching的军备竞赛**。DeepSeek 1/10的cache hit定价已经很低了，其他家跟不跟？
– **开源模型的本地部署**。V4级别的模型虽然还不能在个人电脑上跑，但量化版本已经在路上了。

—

**最后**：如果你还没试过DeepSeek V4系列，现在是个好时机。API注册送额度，文档也写得清楚，OpenAI兼容格式一行代码就能切过去。我自己的open-code配置现在是Opus 4.7做planning + V4 Flash做implementation，体验远好于单模型方案，成本直接降到原来的零头。

价格战打到最后，受益的是我们这些写代码的。趁现在，多薅点。

—

*评论区聊聊：你现在主力用哪个模型的API？有没有被token账单吓到过？*