• 发文
  • 评论
  • 微博
  • 空间
  • 微信

梁文锋,不恐于诽

智械岛 2026-04-27 14:26 发文

出品 | 智械岛

作者 | 沈怀铮(上海)

昨天上午,DeepSeek官微推送了一条消息,没有预热,没有倒计时海报,没有发布会。

V4预览版上线,同步开源。

技术报告里有一句话,被很多人划了重点:能力水平仍落后于GPT-5.4和Gemini-3.1-Pro,发展轨迹大约滞后前沿闭源模型3至6个月。

放在国内AI圈,这句话的格格不入程度,相当于一个人走进了所有人都穿着同样制服的房间,唯独他穿着便装,还告诉你制服上的勋章他没来得及申请。

这种反常让人不舒服,因为它让人没法用既有框架去判断他到底强还是弱。

期待第二个R1时刻的人很难受。

2025年1月,DeepSeek用十分之一的价格做出逼近全球最强的模型,英伟达单日蒸发6000亿美元,硅谷彻夜研读技术报告,那是一种摧枯拉朽的爽文叙事。

15个月后,V4来了。爽文没有续集,取而代之的是一份冷静到你甚至觉得有意的克制。

如果把参数表、技术报告和那句主动披露的差距放在一起看,DeepSeek并没有变弱。它只是把战场从谁更强,换成了谁能被更多人用得起。

这比榜单上的第一名,更难打。

一、承认差距,但差距不是全部

V4-Pro在100万token的极限场景里,单次推理算力只有上一代V3.2的27%,显存占用压到10%。上下文长度翻了近8倍,算力反而降了七成。

这个数字为什么重要?因为百万上下文不是新概念,Gemini一年前就做到了。

但它从来没成为行业标配,原因就一个字:贵。以前你不敢把整本小说、整份年报、整个代码库丢给AI,因为你知道它会烧掉一顿火锅钱。

V4做的,是把这件事从高端功能打成了标配。不是宣布我做到了,而是让你真正负担得起反复用。

所以那句落后3到6个月的表述,不应该被孤立地读。

DeepSeek真正想说的是:在最极致的性能上,我承认我还在追。但在把极致性能变成可用基础设施这件事上,我已经换了一条赛道。

这是两种完全不同的战略。前者是冲刺,后者是铺路。

二、便宜是一种能力

有人把DeepSeek的低价理解成营销。压价格、抢市场、把对手拖入消耗战。

这种解读把梁文锋看得太简单了。

V4的降价,不是砍利润,是砍成本。

用架构创新把计算量和显存需求压到前代的四分之一以下,价格自然就下来了。不是少赚一点,是成本结构真的变了。

全球开发者聚合平台OpenRouter有一组容易被忽略的数据:V3.2在发布五个月后,综合排名已经掉到十几名,但调用量依然稳居平台前五,市场份额在5%到10%之间。

这说明什么?说明真实的开发者市场里,便宜和稳定,跑在了性能前面。

V4把这张牌打得更明确了。Pro版对标旗舰,Flash版输出每百万token两块钱,能力大约有顶级闭源模型的八五成。

对一家创业公司来说,这意味着以前不敢上的Agent调度、长文档分析、代码库级审查,现在可以纳入日常开发流了。不是先用着看看,是真的用得起。

而且V4留了一手。官方在价格说明的末尾用小字写了一句:受限于高端算力,Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后价格会大幅下调。

不是画饼,是提前写给竞争对手的警告信。

三、人走了,钱才不得不来

技术路线选效率,定价策略选低价,这些梁文锋都可以拍板。但他拍不了板的,是人。

过去15个月,DeepSeek四条核心技术主线,各走了一位骨干。

郭达雅去字节Seed主导Agent方向,罗福莉被雷军千万年薪挖到小米做MiMo负责人,王炳宣加入腾讯混元,阮翀出任元戎启行首席科学家。

把这些名字和时间轴铺开,你会发现一个规律:每一家挖人的公司,给出的都不只是钱。

字节有豆包的C端场景,小米有手机到汽车的完整硬件生态,腾讯有微信和元宝的超级入口,元戎启行有自动驾驶的轰鸣赛道。

他们买的,是这些年轻人自己相信的方向。

当外部世界在用数倍于你的资源、数倍于你的决心,去押注那些你的核心骨干自己也看好,但你在内部暂时无法优先保证的方向时,理想主义本身就成了最容易松动的锚。

这就解释了梁文锋为什么要融资。

阿里和腾讯都在洽谈入局。这笔钱不是为了买卡,是为了给留下的人一个答案:你们的期权值什么价。

不是变节,而是修正。在用过去最不习惯的方式,守住过去最想守住的东西。

四、藏在所有叙事背后的暗线

V4的技术报告里有一个首次出现的细节:将华为昇腾NPU与英伟达GPU并列为核心验证平台。

这不是多平台适配的常规操作。

为了一行这样的表述,DeepSeek花了大半年时间,把底层算子从英伟达的PTX语言迁移到跨平台的领域专用语言上。

不是优化模型,是在重建工程底座。

代价是V4至少推迟了两次发布。在一个更新速度即实力的行业里,这种取舍本身就是一种战略选择。

黄仁勋今年4月说过,如果DeepSeek在华为芯片上首发,对我们国家来说是一个可怕的后果。

他担心的不是一家中国公司的模型能力,而是一个不依赖CUDA生态的完整技术栈正在成型。

V4发布当天,华为昇腾宣布超节点全系列产品支持DeepSeek V4。等于说,DeepSeek用一次模型升级,帮国产算力完成了一次压力测试。

对整个中国AI产业来说,这是从在别人的水管上排队接水到自己打井的质变。

梁文锋没有选择先发一个跑在英伟达上的版本抢市场、再慢慢适配国产芯片。

他选了一条更难、更慢、但更安全的路。

五、结语

V4上线推文的末尾,DeepSeek放了16个字。没有加粗,没有单独成段,像是随手写上去的。

不诱于誉,不恐于诽,率道而行,端然正己。

出自《荀子·非十二子》,荀子当时在骂那些追逐名声、随波逐流的人。他认为真正的羞耻,是不把事情做好,而不是不被看见。

放在今天这个场景里,这16个字比任何技术报告都更能说明问题。

R1爆火的时候,DeepSeek处于誉的顶点。全球最热的AI公司,中国科技的象征,硅谷的朝圣对象。

在这个位置上,最容易犯的错误就是为了维持热度而急着交一份平庸的卷子。

此后15个月,是诽的阶段。用户流失、落后论、神坛跌落的标题,每一条都在暗示它需要回应,需要反驳,需要解释。

但他们什么都没说。直到4月24日,把V4放出来,同步开源,同步上线,顺便在技术报告里坦白自己还差3到6个月。

R1证明了DeepSeek能爆。V4要证明的是,DeepSeek能跑。这不是一个技术故事。

是一个男人带着一支不到200人的团队,在全员加速的时代里,主动选择慢下来修路。然后告诉所有人,你们先跑,我把路修好,你们还会回来的。

在一个用发布会和榜单定义存在的行业里,沉默15个月然后交卷的人,要么最笨,要么最可怕。

梁文锋显然不是前者。

智械岛版权所有,未经授权,禁止转载

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    智械岛

    在这里,人类和AI是岛民。

    推荐商品

      举报文章问题

      ×
      • 营销广告
      • 重复、旧闻
      • 格式问题
      • 低俗
      • 标题夸张
      • 与事实不符
      • 疑似抄袭
      • 我有话要说
      确定 取消

      举报评论问题

      ×
      • 淫秽色情
      • 营销广告
      • 恶意攻击谩骂
      • 我要吐槽
      确定 取消

      用户登录×

      请输入用户名/手机/邮箱

      请输入密码