2025年4月,美国一纸禁令,封杀了英伟达对华出口H20芯片。
四个月后,禁令解除了。
2025年8月,美国政府开始发放H20对华出口许可证。英伟达CEO黄仁勋兴冲冲地跑到北京宣布这个消息,说“我非常高兴,这真是个非常、非常好的消息”。
但现实很快给了他一盆冷水。
禁令解除后,中国市场对H20的热情远低于预期。一方面,美国政府要求销售收入的15%上交;另一方面,据报道中国企业高层对“沉迷美国技术栈”的态度越来越敏感,即“不能将核心算力长期建立在美国芯片上”,部分企业在采购H20时面临更大的不确定性。
最终结果印证了一切:有报道称H20重新开售后,中国市场的收入远低于预期。到2026年初,英伟达已经停止了H20的生产,转而准备推出B30芯片来替代它。
更讽刺的是,尽管英伟达随后推出了性能更强的H200,想借此重新敲开中国市场的大门,但据报道中国对此兴趣寥寥。原因同样简单,“他们想要实现半导体独立。”
这个故事告诉我们:禁令解除不等于市场回归。真正的变化是,中国市场已经有了别的选择。
① 在说算力擂台之前,先把几个名字说清楚
这场仗的主角是两家公司的芯片,先简单介绍一下它们。
英伟达(NVIDIA)——很多人知道它做显卡,但它的真正厉害之处,是把显卡变成了AI时代的“大脑”。
显卡的核心是GPU(图形处理器),天生擅长并行计算。2012年深度学习火起来之后,人们发现GPU特别适合跑AI模型,因为速度比CPU快几十倍。英伟达嗅觉灵敏,从游戏显卡转向AI计算,闷声发了大财。
现在英伟达市值约4.4万亿美元,是全球最值钱的公司。它的AI芯片H100、H200,是训练大模型的“标配”。几乎所有你能叫出名字的大模型,OpenAI的GPT、Google的Gemini,背后都是英伟达的算力。
华为昇腾。在中国能跟英伟达正面比的,只有华为。
昇腾是华为海思旗下的AI芯片品牌,最早做AI推理(用已经训练好的模型去做预测),后来延伸到AI训练。昇腾最牛的地方在于“全栈自研”——芯片自己设计,代工找中芯国际,主推自研MindSpore框架,同时兼容PyTorch等主流框架,软件栈有CANN。这在全球范围内都是少数玩家才能做到的事。
我们还需要特别提一下H20,这是英伟达的“中国特供版”。
H100被美国禁止出口中国之后,英伟达专门为中国市场定制了H20。如果把它比喻成H100的“残血版”,可能就更好理解了。不同来源估算它的算力大概是H100的15%-33%,性能被大幅阉割。但因为当时这是中国公司能买到的、最接近顶尖水平的选择,所以H20一度卖到断货。
② 为什么大模型竞争本质上是芯片竞争?
因为大模型太大了。
GPT-4、DeepSeek-V3、华为盘古……这些千亿参数级别的模型,训练一次要消耗天文数字的算力。芯片性能不够,模型就训不完,或者训出来的质量就是差一截。
AI芯片的核心任务是两件事:训练和推理。
训练,就是让AI从零开始学习——喂给它海量数据,让它自己找出规律。这个过程需要超强的算力,就像让一个人做几十万道数学题来“顿悟”解题方法。
推理,就是用已经训练好的AI去做判断。比如你问ChatGPT一个问题,它在几毫秒内给你回答。
过去,这个逻辑是铁律:芯片性能决定模型上限。
但一个值得关注的变化是:芯片的差距确实还在,但已经不是决定性因素了。
③ 昇腾910B vs H100,差距到底有多大?
先说硬件。
昇腾910B是华为目前的主力训练芯片,对标的是英伟达的A100/H100系列。直观对比如下:
|
指标 |
昇腾910B |
H100 |
|
FP16算力 |
约320 TFLOPS |
约989 TFLOPS(典型峰值) |
|
显存 |
64GB |
80GB |
|
价格 |
约10-15万/片 |
H100约25-30万/片 |
从数字看,H100算力是910B的数倍。
但用大白话讲:同样训练一个千亿参数大模型,H100可能需要100张卡跑一个月;昇腾910B可能需要200张卡跑一个半月。
差距的确存在,但不至于“不能用”。
更关键的是,在美国芯片管制的背景下,H100/A100想买也买不到。能稳定供货的国产方案,当然就成了首选。
昇腾新一代产品已经拿出来了更有说服力的数据。2026年3月,华为Atlas 950超节点在MWC 2026上首次海外亮相,搭载昇腾950PR芯片(2026年Q1已发布)和昇腾950DT芯片(Q4待发布),用自研的“灵衢”互联技术连接最多8192张芯片组成超级集群。
这是什么意思?
单卡性能暂时打不过H100,华为就换个思路,用超大规模集群来弥补。Atlas 950 SuperPoD的FP8算力据报道达到8 ExaFLOPS,目标是支撑万亿参数大模型的训练和推理。
单个芯片打不过你,那就用大规模集群来对抗。
④ 生态才是真正的护城河
硬件的差距在缩小,但另一个差距,才是真正的“深坑”。
英伟达之所以称霸AI芯片市场,靠的不只是GPU的性能,而是CUDA生态。
你可以把CUDA理解为英伟达为自家芯片开发的一套“操作系统”和“工具箱”。全球数百万AI开发者用它写代码、训练模型、优化算法。PyTorch、TensorFlow这些主流框架,默认都支持CUDA。
打个比方:CUDA就像英语——全球AI开发者的通用语言。
华为的昇腾用的是CANN架构,对标CUDA。但CANN起步晚,框架适配、工具链、开发者社区都还在追赶阶段。
现在很多AI研究者在论文里做实验,用的代码默认都是为CUDA写的。换成昇腾,光是环境适配就要花上好几天。
这不是芯片性能的问题,是整个产业链积累的差距。
不过,2025年8月,华为宣布全面开源CANN架构。这个动作的战略意义不容低估——开源意味着更多开发者可以参与进来,一起建生态。从“封闭”到“开放”,这是华为在生态战上的一次重要转向。
⑤ 禁令解除了,擂台赛也已经变了
2025年4月,美国禁了H20;四个月后,又放回来了。这看起来真的好像是一个“美国卡脖子”然后“松手”的故事。
但真实的剧本要复杂得多。
首先,禁令本身就是个“意外”。当时特朗普政府本来已经打算放过H20,结果4月9日突然变卦,要求H20必须获得出口许可才能销往中国。英伟达措手不及,直接计提了约55亿美元的库存损失,最终实际确认45亿美元。
然后是“稀土换芯片”的博弈。有分析认为,美国突然解除H20禁令,与中国在稀土出口管制上的让步有关——这是大国博弈的一部分,不是单方面的“仁慈”。
更重要的是:中国已经不那么需要H20了。
在禁令颁布的四个月里,华为昇腾910B、910C快速上量,价格便宜,供货稳定。虽然性能与H100仍有差距,但比被阉割过的H20已经强不了多少。
想象一个场景:你是国内一家云厂商的采购负责人,以前买英伟达的芯片是因为没有替代品。现在昇腾成熟了,价格只有H20的一半,供货稳定,还不用担心美国随时断供——你还会大规模采购H20吗?
答案是:不会。
所以,禁令解除后故事的真正走向是:中国市场对H20的需求远低于预期,英伟达停止了H20的生产,转而押注B30。
不是昇腾“逼回”了H20,而是中国市场已经不再那么需要它了。
这场擂台赛里,真正的胜负手不是禁令什么时候解除,而是谁先把产品做好、把供应链做稳。
⑥ 那些正在填补空白的人
昇腾之外,还有一批国产AI芯片公司在快速崛起。
2025年被称为“国产AI芯片元年”,多家企业进入IPO冲刺阶段:
摩尔线程:2025年12月5日登陆科创板,当前市值约3000亿,定位更偏向通用GPU
寒武纪:老牌选手,推理芯片已批量出货,2025年8月市值曾破6600亿
燧原科技:科创板IPO申请已获受理
沐曦、瀚博:各有专长,IPO在推进中
这个赛道的逻辑是:昇腾做“全能选手”,其他玩家各有专长——寒武纪、燧原、瀚博在训练和推理两端都有布局。
当中国市场开始“嫌弃”H20的那一刻,说明国产替代不只是口号了。
更有意思的是,英伟达自己也承认了这一点。在2026财年Q4财报会议上,英伟达CFO柯莱特·克雷斯表示,中国AI竞争实力正在提升,可能对全球AI行业格局造成长期冲击。
从曾经的“求着你卖”,到现在的“你爱卖不卖”,英伟达自己大概也没想到,局面会变化得这么快。
⑦ 这场比赛的本质是什么?
说了这么多,昇腾 vs 英伟达,真正的胜负手是什么?
当然不是谁的芯片跑分更高,而是谁能先建起自己的生态。
芯片性能追上来需要时间,生态建起来更需要时间。但换个角度看,这场竞争,中国还有足够的时间去追赶。
中国有全球最大的AI应用市场,有海量的数据,有大量愿意用国产芯片做开发的工程师。市场足够大,生态自然会生长。
就像安卓在中国靠的不是“官方推广”,而是几亿用户的需求倒逼出了生态。昇腾的CANN也一样。
这场擂台赛的结局,或许不会是在某一天,某一款芯片突然赢了。更有可能的是:两条平行线同时延伸,一边是英伟达的CUDA生态,一边是昇腾+国产芯片的替代生态,在各自的市场里各自运转。
