DeepSeek V4夺回全球AI定价权

　　2026年4月24日，DeepSeek发布了V4系列模型的预览版。

　　V4-Pro有1.6万亿参数，原生支持100万token上下文。在编程竞赛基准Codeforces上得分3206，超过了GPT-5.4的3168。在真实软件工程任务SWE-bench Verified上得分80.6%，跟Claude Opus 4.6的80.8%只差0.2个百分点。

　　然后DeepSeek再次宣布特惠降价75%，特价有效期为5月31日。

　　这个价格，等于直接把大模型从奢侈品打成了日用品。

　　有意思的是，就在V4发布的同一周，某些国家的外交部门急得向全球发加密电报，点名DeepSeek等中国AI公司，让盟友警惕。一个AI模型发布能惊动外交系统，这件事本身就说明了很多问题。

　　毕竟如果能靠技术封锁和商业竞争搞垮DeepSeek，没人会用外交手段来对付一家创业公司。

　　一、14倍的差距，30万的真金白银

　　先算一笔简单的账。

　　DeepSeek V4-Pro的API定价，打折前输入每百万token 0.145美元，输出1.74美元。GPT-5.5和Claude Opus 4.7呢？以Opus 4.7为例，输出价格每百万token 25美元，输入5美元。输出价格差了14倍。

　　我自己差不多每天消耗1000万输出tokens，强度不算高，主要是平时会议多，还要带孩子。用Opus 4.7的话，中转站没有缓存命中，每天光API就要花250美元，一个月7500美元，折合人民币5万多。用GPT-5.5也差不离。

　　用DeepSeek V4-Pro呢？按现在的打折价，加上缓存命中，每天只要10块钱左右，一个月300元，折合不到50美元。这还要啥自行车？

　　一个人，用DSv4和Opus 4.7，每年成本相差30多万人民币，你说你会用谁？对于企业来说，省下的tokens费用可以多雇一倍的工程师。

　　对于一个企业的CIO来说，两个大模型智能差不多，一个比另一个贵几十倍，你觉得他会选哪个？他一定会两个都要，但平时鼓励大家用便宜的。比如我现在要求团队使用Opus 4.7，每天超过100块要报备自己当天用Opus干什么。结果呢？大家就都不用了，懒得报备。

　　二、定价权才是核心

　　这不仅仅是价格战争，这是定价权战争。

　　全球AI产业的估值，完全建立在少数几家公司垄断最高智能AI定价权的基础上。以前，想要最好的AI能力，只能捏着鼻子付高价，开每月200美元的订阅，还要被动接受涨价。

　　如果我没有qwen 3.6、Kimi 2.6、GLM5.1、Deepseek V4可以用，我肯定也只能在海外服务器上开Claude订阅，花200美元一个月。

　　可是DeepSeek、阿里云、KIMI、Minimax、华为、天数、摩尔线程这些中国AI公司，正在打破这个垄断。而且中国企业不但没有跟着搞垄断，还在玩命内卷价格，这才叫世界大同的共产主义精神。

　　今天，海外AI公司已经不可能赚到我每个月哪怕20美元的订阅费了。我现在用的是阿里云百炼200块一个月的coding plan。如果有1亿人转向中国大模型，每月就是20亿美元的AI营收换了方向。海外企业的铁杆庄稼，被中国创新企业给刨了。

　　事实上，老外早就在社交平台上打听怎么订阅中国的Coding Plan了。都是日子人，谁不想省钱呢？

　　三、技术创新是降价的底气

　　DeepSeek V4能把价格打到这么低，靠的是真创新，不是靠什么花招。

　　大模型最大的成本瓶颈是长文本处理。文本越长，算力消耗越大，平方级增长。100万token的上下文，注意力计算量是天文数字。

　　DeepSeek V4搞了一套混合注意力架构，同时用两种方法读长文本。一种叫CSA，每4个token压缩成一张摘要卡，快速扫描后只仔细读最相关的几张；一种叫HCA，每128个token压成一张卡，全读一遍也不费劲。

　　结果是什么？100万token的上下文下，V4的计算量只有上一代V3.2的27%，内存占用只有10%。V4-Flash更低，10%和7%。

　　这种量级的效率提升，直接转化成成本优势。同样的推理任务，V4用的算力不到上代的三分之一，价格自然能打下来。

　　还有一件事，V4支持华为昇腾。你说V4完全用昇腾训练，我不信；但V4能在昇腾上跑推理且成本可控，我信。

　　因为我自己有一台八卡华为910C，折腾一个多月才把GLM5推理跑起来。华为官方推理框架还不行，得用社区开源的vllm-ascend，32路并发每路只能跑40 tokens/s。只能说华为信创算力勉强当推理机，生态还得完善。

　　但如果DeepSeek拿昇腾950超节点跑出最佳实践，让中国企业私有化部署时，生成100万tokens成本在20块以下，那国产信创算力就有竞争力了。对英伟达显卡的需求，也会迅速减少。

　　芯片封锁这么多年，结果逼出了一套完全不依赖Nvidia的前沿模型体系。这可能就是封锁的意外后果吧。

　　四、幻方量化的双重收割

　　这里还有个更妙的点。

　　DeepSeek的出资方是幻方量化，中国头部量化对冲基金，管理规模一度超千亿。量化交易的核心能力是模型、算力、数据。DeepSeek做大模型，用的就是幻方的算力基础设施和工程团队。两家一个老板。

　　现在我们想想这个场景。

　　2025年初，幻方就见识了DeepSeek R1的市场冲击力。R1发布当天，英伟达单日市值蒸发近6000亿美元，相关科技板块蒸发约9690亿美元。将近一万亿美元，一夜之间。

　　到了2026年，幻方对比V4和Opus 4.6等头部模型，智力差距不大，成本差距极大。他们比任何分析师都清楚，V4的架构创新和成本优势会对AI产业造成多大冲击。V4在编程、推理上直接对标甚至超越GPT和Claude，成本只有人家的几十分之一。

　　这时候幻方能做什么？完全可以提前布局做空海外科技股。等到4月24日V4发布、市场恐慌的时候，做空利润滚滚而来。这才是真正的割韭菜。

　　左手发布世界领先的AI模型，右手做空海外科技股。一边证明技术实力，一边赚对手崩溃的钱。这波操作，很量化，很幻方，很优秀，再来几次。

　　五、一万亿美元的估值还能撑多久

　　2025年1月R1发布那天，市场用真金白银投了一次票。结果是AI相关公司市值蒸发将近一万亿美元。

　　为什么蒸发？因为市场突然意识到：头部AI公司的高估值，建立在拥有不可逾越的AI领先优势这个假设上。DeepSeek用事实证明，这假设站不住脚。GLM、Qwen、Kimi、Minimax都很优秀，但创飞市场的只有Deepseek，而且创飞了两次。

　　OpenAI估值3000亿美元，Anthropic接近2000亿，Nvidia市值一度突破3万亿。这些数字的支撑是什么？是市场相信未来几年这些公司会垄断全球AI市场，收取高额溢价。

　　DeepSeek的打法完全相反。开源、免费释放模型权重、API定价打到对手的零头。头部闭源企业，100万tokens卖25美元，Deepseek卖10块人民币就够了。

　　这不是价格战争，这是定价权战争。

　　DeepSeek每一代模型都在瓦解一个估值支柱。R1证明不需要天价算力也能达到前沿推理能力。V3证明开源能追平闭源。V4证明架构创新可以让成本层级式下降。

　　三次证明之后，一万亿美元的估值假设还剩下多少？

　　六、为什么是DeepSeek

　　为什么一家中国创业公司，芯片受限，资金远不如硅谷，却能做成这些？

　　DeepSeek的组织哲学很有意思。总部不在中关村，不在深圳科技园，就在杭州。团队扁平化、去KPI、不设短期业绩目标。

　　背靠幻方量化这个大爹，不缺研发资金，不用为季度融资焦虑，不用为了估值发PR稿，不用为了投资者预期做面子工程。工程师只需要做一件事：把模型做好。

　　对比一下。OpenAI得不断融资支付天价工资和GPU账单，Anthropic得证明商业变现能力，Google和Microsoft每个季度得向华尔街展示AI收入增长。每一家AI巨头都在融资—烧钱—再融资的循环里打转，前提是市场永远相信它们未来能卖出更高的价。

　　DeepSeek打破了这个幻觉。它证明了真正的AI护城河不是砸钱买卡，而是在一个能让工程师安心做技术的环境里长出来的工程能力。

　　结语

　　一家中国创业公司，用开源模型和极致性价比，正在夺回全球AI的定价权。

　　对中国的工程师和创业者来说，DeepSeek传递的信号很清楚：不需要成为烧钱的巨兽，不需要复制硅谷的融资游戏。精耕细作、极致工程、长期积累，加上不受干扰的长期主义，这条路走通了。

　　对那些还在用传统估值框架判断AI投资的金融界人士来说，DeepSeek V4之后，是时候重新算账了。

　　另外别忘了，幻方这个量化基金的底子，让他们可以通过发布一个震撼世界的AI模型，然后在对手股价崩溃时做空一波。这大概是AI时代最优雅的降维打击了。

　　Oh my deepseek, pls take my data!