
出品 | 智械岛
作者 | 沈怀铮(上海)
昨天上午,DeepSeek官微推送了一条消息,没有预热,没有倒计时海报,没有发布会。
V4预览版上线,同步开源。
技术报告里有一句话,被很多人划了重点:能力水平仍落后于GPT-5.4和Gemini-3.1-Pro,发展轨迹大约滞后前沿闭源模型3至6个月。
放在国内AI圈,这句话的格格不入程度,相当于一个人走进了所有人都穿着同样制服的房间,唯独他穿着便装,还告诉你制服上的勋章他没来得及申请。
这种反常让人不舒服,因为它让人没法用既有框架去判断他到底强还是弱。
期待第二个R1时刻的人很难受。
2025年1月,DeepSeek用十分之一的价格做出逼近全球最强的模型,英伟达单日蒸发6000亿美元,硅谷彻夜研读技术报告,那是一种摧枯拉朽的爽文叙事。
15个月后,V4来了。爽文没有续集,取而代之的是一份冷静到你甚至觉得有意的克制。
如果把参数表、技术报告和那句主动披露的差距放在一起看,DeepSeek并没有变弱。它只是把战场从谁更强,换成了谁能被更多人用得起。
这比榜单上的第一名,更难打。
一、承认差距,但差距不是全部
V4-Pro在100万token的极限场景里,单次推理算力只有上一代V3.2的27%,显存占用压到10%。上下文长度翻了近8倍,算力反而降了七成。
这个数字为什么重要?因为百万上下文不是新概念,Gemini一年前就做到了。
但它从来没成为行业标配,原因就一个字:贵。以前你不敢把整本小说、整份年报、整个代码库丢给AI,因为你知道它会烧掉一顿火锅钱。
V4做的,是把这件事从高端功能打成了标配。不是宣布我做到了,而是让你真正负担得起反复用。
所以那句落后3到6个月的表述,不应该被孤立地读。
DeepSeek真正想说的是:在最极致的性能上,我承认我还在追。但在把极致性能变成可用基础设施这件事上,我已经换了一条赛道。
这是两种完全不同的战略。前者是冲刺,后者是铺路。
二、便宜是一种能力
有人把DeepSeek的低价理解成营销。压价格、抢市场、把对手拖入消耗战。
这种解读把梁文锋看得太简单了。
V4的降价,不是砍利润,是砍成本。
用架构创新把计算量和显存需求压到前代的四分之一以下,价格自然就下来了。不是少赚一点,是成本结构真的变了。
全球开发者聚合平台OpenRouter有一组容易被忽略的数据:V3.2在发布五个月后,综合排名已经掉到十几名,但调用量依然稳居平台前五,市场份额在5%到10%之间。
这说明什么?说明真实的开发者市场里,便宜和稳定,跑在了性能前面。
V4把这张牌打得更明确了。Pro版对标旗舰,Flash版输出每百万token两块钱,能力大约有顶级闭源模型的八五成。
对一家创业公司来说,这意味着以前不敢上的Agent调度、长文档分析、代码库级审查,现在可以纳入日常开发流了。不是先用着看看,是真的用得起。
而且V4留了一手。官方在价格说明的末尾用小字写了一句:受限于高端算力,Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后价格会大幅下调。
不是画饼,是提前写给竞争对手的警告信。
三、人走了,钱才不得不来
技术路线选效率,定价策略选低价,这些梁文锋都可以拍板。但他拍不了板的,是人。
过去15个月,DeepSeek四条核心技术主线,各走了一位骨干。
郭达雅去字节Seed主导Agent方向,罗福莉被雷军千万年薪挖到小米做MiMo负责人,王炳宣加入腾讯混元,阮翀出任元戎启行首席科学家。
把这些名字和时间轴铺开,你会发现一个规律:每一家挖人的公司,给出的都不只是钱。
字节有豆包的C端场景,小米有手机到汽车的完整硬件生态,腾讯有微信和元宝的超级入口,元戎启行有自动驾驶的轰鸣赛道。
他们买的,是这些年轻人自己相信的方向。
当外部世界在用数倍于你的资源、数倍于你的决心,去押注那些你的核心骨干自己也看好,但你在内部暂时无法优先保证的方向时,理想主义本身就成了最容易松动的锚。
这就解释了梁文锋为什么要融资。
阿里和腾讯都在洽谈入局。这笔钱不是为了买卡,是为了给留下的人一个答案:你们的期权值什么价。
不是变节,而是修正。在用过去最不习惯的方式,守住过去最想守住的东西。
四、藏在所有叙事背后的暗线
V4的技术报告里有一个首次出现的细节:将华为昇腾NPU与英伟达GPU并列为核心验证平台。
这不是多平台适配的常规操作。
为了一行这样的表述,DeepSeek花了大半年时间,把底层算子从英伟达的PTX语言迁移到跨平台的领域专用语言上。
不是优化模型,是在重建工程底座。
代价是V4至少推迟了两次发布。在一个更新速度即实力的行业里,这种取舍本身就是一种战略选择。
黄仁勋今年4月说过,如果DeepSeek在华为芯片上首发,对我们国家来说是一个可怕的后果。
他担心的不是一家中国公司的模型能力,而是一个不依赖CUDA生态的完整技术栈正在成型。
V4发布当天,华为昇腾宣布超节点全系列产品支持DeepSeek V4。等于说,DeepSeek用一次模型升级,帮国产算力完成了一次压力测试。
对整个中国AI产业来说,这是从在别人的水管上排队接水到自己打井的质变。
梁文锋没有选择先发一个跑在英伟达上的版本抢市场、再慢慢适配国产芯片。
他选了一条更难、更慢、但更安全的路。
五、结语
V4上线推文的末尾,DeepSeek放了16个字。没有加粗,没有单独成段,像是随手写上去的。
不诱于誉,不恐于诽,率道而行,端然正己。
出自《荀子·非十二子》,荀子当时在骂那些追逐名声、随波逐流的人。他认为真正的羞耻,是不把事情做好,而不是不被看见。
放在今天这个场景里,这16个字比任何技术报告都更能说明问题。
R1爆火的时候,DeepSeek处于誉的顶点。全球最热的AI公司,中国科技的象征,硅谷的朝圣对象。
在这个位置上,最容易犯的错误就是为了维持热度而急着交一份平庸的卷子。
此后15个月,是诽的阶段。用户流失、落后论、神坛跌落的标题,每一条都在暗示它需要回应,需要反驳,需要解释。
但他们什么都没说。直到4月24日,把V4放出来,同步开源,同步上线,顺便在技术报告里坦白自己还差3到6个月。
R1证明了DeepSeek能爆。V4要证明的是,DeepSeek能跑。这不是一个技术故事。
是一个男人带着一支不到200人的团队,在全员加速的时代里,主动选择慢下来修路。然后告诉所有人,你们先跑,我把路修好,你们还会回来的。
在一个用发布会和榜单定义存在的行业里,沉默15个月然后交卷的人,要么最笨,要么最可怕。
梁文锋显然不是前者。
智械岛版权所有,未经授权,禁止转载
