2026年4月24日,DeepSeek发布了V4系列模型的预览版。

  V4-Pro有1.6万亿参数,原生支持100万token上下文。在编程竞赛基准Codeforces上得分3206,超过了GPT-5.4的3168。在真实软件工程任务SWE-bench Verified上得分80.6%,跟Claude Opus 4.6的80.8%只差0.2个百分点。

  然后DeepSeek再次宣布特惠降价75%,特价有效期为5月31日。

  这个价格,等于直接把大模型从奢侈品打成了日用品。

  有意思的是,就在V4发布的同一周,某些国家的外交部门急得向全球发加密电报,点名DeepSeek等中国AI公司,让盟友警惕。一个AI模型发布能惊动外交系统,这件事本身就说明了很多问题。

  毕竟如果能靠技术封锁和商业竞争搞垮DeepSeek,没人会用外交手段来对付一家创业公司。

  一、14倍的差距,30万的真金白银

  先算一笔简单的账。

  DeepSeek V4-Pro的API定价,打折前输入每百万token 0.145美元,输出1.74美元。GPT-5.5和Claude Opus 4.7呢?以Opus 4.7为例,输出价格每百万token 25美元,输入5美元。输出价格差了14倍。

  我自己差不多每天消耗1000万输出tokens,强度不算高,主要是平时会议多,还要带孩子。用Opus 4.7的话,中转站没有缓存命中,每天光API就要花250美元,一个月7500美元,折合人民币5万多。用GPT-5.5也差不离。

  用DeepSeek V4-Pro呢?按现在的打折价,加上缓存命中,每天只要10块钱左右,一个月300元,折合不到50美元。这还要啥自行车?

  一个人,用DSv4和Opus 4.7,每年成本相差30多万人民币,你说你会用谁?对于企业来说,省下的tokens费用可以多雇一倍的工程师。

  对于一个企业的CIO来说,两个大模型智能差不多,一个比另一个贵几十倍,你觉得他会选哪个?他一定会两个都要,但平时鼓励大家用便宜的。比如我现在要求团队使用Opus 4.7,每天超过100块要报备自己当天用Opus干什么。结果呢?大家就都不用了,懒得报备。

  二、定价权才是核心

  这不仅仅是价格战争,这是定价权战争。

  全球AI产业的估值,完全建立在少数几家公司垄断最高智能AI定价权的基础上。以前,想要最好的AI能力,只能捏着鼻子付高价,开每月200美元的订阅,还要被动接受涨价。

  如果我没有qwen 3.6、Kimi 2.6、GLM5.1、Deepseek V4可以用,我肯定也只能在海外服务器上开Claude订阅,花200美元一个月。

  可是DeepSeek、阿里云、KIMI、Minimax、华为、天数、摩尔线程这些中国AI公司,正在打破这个垄断。而且中国企业不但没有跟着搞垄断,还在玩命内卷价格,这才叫世界大同的共产主义精神。

  今天,海外AI公司已经不可能赚到我每个月哪怕20美元的订阅费了。我现在用的是阿里云百炼200块一个月的coding plan。如果有1亿人转向中国大模型,每月就是20亿美元的AI营收换了方向。海外企业的铁杆庄稼,被中国创新企业给刨了。

  事实上,老外早就在社交平台上打听怎么订阅中国的Coding Plan了。都是日子人,谁不想省钱呢?

  三、技术创新是降价的底气

  DeepSeek V4能把价格打到这么低,靠的是真创新,不是靠什么花招。

  大模型最大的成本瓶颈是长文本处理。文本越长,算力消耗越大,平方级增长。100万token的上下文,注意力计算量是天文数字。

  DeepSeek V4搞了一套混合注意力架构,同时用两种方法读长文本。一种叫CSA,每4个token压缩成一张摘要卡,快速扫描后只仔细读最相关的几张;一种叫HCA,每128个token压成一张卡,全读一遍也不费劲。

  结果是什么?100万token的上下文下,V4的计算量只有上一代V3.2的27%,内存占用只有10%。V4-Flash更低,10%和7%。

  这种量级的效率提升,直接转化成成本优势。同样的推理任务,V4用的算力不到上代的三分之一,价格自然能打下来。

  还有一件事,V4支持华为昇腾。你说V4完全用昇腾训练,我不信;但V4能在昇腾上跑推理且成本可控,我信。

  因为我自己有一台八卡华为910C,折腾一个多月才把GLM5推理跑起来。华为官方推理框架还不行,得用社区开源的vllm-ascend,32路并发每路只能跑40 tokens/s。只能说华为信创算力勉强当推理机,生态还得完善。

  但如果DeepSeek拿昇腾950超节点跑出最佳实践,让中国企业私有化部署时,生成100万tokens成本在20块以下,那国产信创算力就有竞争力了。对英伟达显卡的需求,也会迅速减少。

  芯片封锁这么多年,结果逼出了一套完全不依赖Nvidia的前沿模型体系。这可能就是封锁的意外后果吧。

  四、幻方量化的双重收割

  这里还有个更妙的点。

  DeepSeek的出资方是幻方量化,中国头部量化对冲基金,管理规模一度超千亿。量化交易的核心能力是模型、算力、数据。DeepSeek做大模型,用的就是幻方的算力基础设施和工程团队。两家一个老板。

  现在我们想想这个场景。

  2025年初,幻方就见识了DeepSeek R1的市场冲击力。R1发布当天,英伟达单日市值蒸发近6000亿美元,相关科技板块蒸发约9690亿美元。将近一万亿美元,一夜之间。

  到了2026年,幻方对比V4和Opus 4.6等头部模型,智力差距不大,成本差距极大。他们比任何分析师都清楚,V4的架构创新和成本优势会对AI产业造成多大冲击。V4在编程、推理上直接对标甚至超越GPT和Claude,成本只有人家的几十分之一。

  这时候幻方能做什么?完全可以提前布局做空海外科技股。等到4月24日V4发布、市场恐慌的时候,做空利润滚滚而来。这才是真正的割韭菜。

  左手发布世界领先的AI模型,右手做空海外科技股。一边证明技术实力,一边赚对手崩溃的钱。这波操作,很量化,很幻方,很优秀,再来几次。

  五、一万亿美元的估值还能撑多久

  2025年1月R1发布那天,市场用真金白银投了一次票。结果是AI相关公司市值蒸发将近一万亿美元。

  为什么蒸发?因为市场突然意识到:头部AI公司的高估值,建立在拥有不可逾越的AI领先优势这个假设上。DeepSeek用事实证明,这假设站不住脚。GLM、Qwen、Kimi、Minimax都很优秀,但创飞市场的只有Deepseek,而且创飞了两次。

  OpenAI估值3000亿美元,Anthropic接近2000亿,Nvidia市值一度突破3万亿。这些数字的支撑是什么?是市场相信未来几年这些公司会垄断全球AI市场,收取高额溢价。

  DeepSeek的打法完全相反。开源、免费释放模型权重、API定价打到对手的零头。头部闭源企业,100万tokens卖25美元,Deepseek卖10块人民币就够了。

  这不是价格战争,这是定价权战争。

  DeepSeek每一代模型都在瓦解一个估值支柱。R1证明不需要天价算力也能达到前沿推理能力。V3证明开源能追平闭源。V4证明架构创新可以让成本层级式下降。

  三次证明之后,一万亿美元的估值假设还剩下多少?

  六、为什么是DeepSeek

  为什么一家中国创业公司,芯片受限,资金远不如硅谷,却能做成这些?

  DeepSeek的组织哲学很有意思。总部不在中关村,不在深圳科技园,就在杭州。团队扁平化、去KPI、不设短期业绩目标。

  背靠幻方量化这个大爹,不缺研发资金,不用为季度融资焦虑,不用为了估值发PR稿,不用为了投资者预期做面子工程。工程师只需要做一件事:把模型做好。

  对比一下。OpenAI得不断融资支付天价工资和GPU账单,Anthropic得证明商业变现能力,Google和Microsoft每个季度得向华尔街展示AI收入增长。每一家AI巨头都在融资—烧钱—再融资的循环里打转,前提是市场永远相信它们未来能卖出更高的价。

  DeepSeek打破了这个幻觉。它证明了真正的AI护城河不是砸钱买卡,而是在一个能让工程师安心做技术的环境里长出来的工程能力。

  结语

  一家中国创业公司,用开源模型和极致性价比,正在夺回全球AI的定价权。

  对中国的工程师和创业者来说,DeepSeek传递的信号很清楚:不需要成为烧钱的巨兽,不需要复制硅谷的融资游戏。精耕细作、极致工程、长期积累,加上不受干扰的长期主义,这条路走通了。

  对那些还在用传统估值框架判断AI投资的金融界人士来说,DeepSeek V4之后,是时候重新算账了。

  另外别忘了,幻方这个量化基金的底子,让他们可以通过发布一个震撼世界的AI模型,然后在对手股价崩溃时做空一波。这大概是AI时代最优雅的降维打击了。

  Oh my deepseek, pls take my data!