• 发文
  • 评论
  • 微博
  • 空间
  • 微信

被禁售的NVIDIA GPU加速卡惊现中国!从未见过的96GB内存

快科技 2024-04-17 11:22 发文

A100是最早被禁售给中国的NVIDIA GPU加速卡,近日国内某“海鲜市场”上出现了一块特殊的A100开发样品,规格和正式版截然不同。

作为工程样品,它的设计就很不一样,布满了非标准的电压测量点,以及大量的跳线,还有两个8针供电接口(以及一个空焊位)。

它采用了A100 20BF核心,理论上是升级版A100B,但从未出现。

神奇的是,它可以刷入A100 SXM版本的固件,能正常使用,只是功耗不正常,会一直跑在最高的750W。

规格方面,CUDA核心数为7936个,比零售版的6912个多了15%,但依然不是满血,还是屏蔽了256个。

HBM2E高带宽内存容量达到了96GB,比零售版的40/80GB多了不少,位宽也解锁了完整的6144-bit。

作为样品,核心和内存频率反而更高,核心基准就有1260MHz,加速被隐藏,而内存达到了1404MHz。

这位卖家还顺便晒出了他收藏的各种版本A100:

另外,Intel在其Gaudi 3 AI芯片白皮书中披露,正准备向中国市场推出“特供版”Gaudi 3。

中国特供Gaudi 3包括名为HL-328的OAM兼容夹层卡(Mezzanine Card),和名为HL-388的PCle加速卡两种,其中HL-328将于6月24日推出,HL-388将于9月24日推出。

与原版相比,中国特供版Gaudi 3拥有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为3.7TB/s,拥有PCIe 5.0 x16接口和解码标准。

但是由于美国对于AI芯片的出口管制,其综合运算性能(TPP)需要低于4800才能出口到中国, 这也意味中国特供版Gaudi 3的16bit性能不能超过150 TFLOPS。

而原版Gaudi 3在FP16/BF16上的性能可以达到1835 TFLOPS,因此中国特供版Gaudi 3最终可能需要将其AI性能降低约92%,才能符合美国的出口管制要求。

不过性能的降低也使得其功耗大幅降低,根据曝光的资料,中国特供版Gaudi 3的PCIe卡和OAM卡的TDP均为450瓦,而原版的性能分别为600瓦和900瓦。

那么多强大的芯片与我们无缘,不过相信这只是暂时的。

阿里巴巴集团董事会主席蔡崇信在接受采访时谈及芯片短缺和限制就提出,中国有能力自己制造高端GPU,并不一定要用NVIDIA。

对于美国收紧向中国出口芯片和相关技术,蔡崇信直言这会影响云计算和高阶运算业务,并在中短期内持续产生影响,但长远来看,中国将能够制造高端GPU。

他表示,目前中国企业的芯片存货可以支持AI大模型未来18个月的训练需求,并指出AI大模型的建立非常需要高运算能力,但在下一阶段的应用,即业界所称的“推论(Inference)”阶段,市场上有很多选择,并不一定要使用NVIDIA最顶级的高端芯片。

在被问及近年来投资界最热门的人工智能发展时,蔡崇信认为,中国目前落后于最顶尖的人工智能大模型约两年,并坦言“中国可能在较长时期内维持这种落后状态,因为其他人都在快速发展。”

蔡崇信相信,中国未来仍是世界制造业强国,即使人口相对下降,但人口总量依然庞大。

中国有8亿既勤奋又受过教育的劳动者,部分公司可能将供应链转移到越南或墨西哥,但这些地方的人口和面积都无法与中国相比,不能取代中国作为世界制造中心的地位。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    快科技

    快科技是中国具影响力的泛科技领域...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码