• 发文
  • 评论
  • 微博
  • 空间
  • 微信

Broadcom Thor Ultra发布,800G AI以太网时代

芝能智芯 2025-10-17 13:47 发文

芝能智芯出品

Broadcom正式推出了业界首款符合超级以太网联盟(UEC)标准的800GbE AI以太网网络接口卡——Thor Ultra。

以太网技术在AI集群互联领域实现了又一次重大跨越,在带宽、延迟和拥塞控制等关键性能上实现突破,还通过可编程RDMA、PCIe Gen6接口以及与Tomahawk 6系列交换芯片的深度协同,为AI基础设施提供了开放、高效、可扩展的解决方案,以太网正在逐步取代InfiniBand,成为新一代AI计算网络的核心架构。

Part 1Broadcom Thor Ultra技术架构 

Broadcom Thor Ultra 800GbE NIC的设计完全围绕AI数据中心的极致性能需求展开。

与上一代产品相比,Thor Ultra采用了全新的BCM57708控制器芯片,支持高达800Gbps的吞吐能力。

这意味着每张网卡可以同时处理多达200G或100G的PAM4 SerDes信号,实现长距离无源铜缆连接,同时维持业界最低误码率(BER),高精度信号处理能力在保证链路稳定的同时,有效降低了数据传输抖动,提高了作业完成时间(Job Completion Time, JCT)的效率。

在物理接口上,Thor Ultra提供了符合OCP 3.0规范的外形设计,并采用OSFP112接口形式。

这一接口支持112G PAM4 SerDes信号速率,为AI训练服务器、加速器(XPU)和高速交换机之间的互联提供了可扩展的硬件基础。

此外,Thor Ultra通过PCI Express Gen6 x16主机接口,实现了高达128GB/s的主机通信带宽,为未来AI集群中的GPU、TPU和自研XPU提供了更充裕的数据通道。

为了满足AI集群中高强度的数据安全需求,Thor Ultra集成了PSP(Packet Security Processor)加速模块,可在网络层面实现线速加密与解密操作。

这种硬件级卸载机制大幅减轻了主机CPU或XPU的计算负载,提升整体计算效率。

在安全性方面,Thor Ultra还支持签名固件和设备级证明(Device Attestation),确保启动过程和固件加载的完整性,从而防范潜在的安全攻击。

Part 2RDMA创新与AI网络生态

Thor Ultra的核心技术突破体现在对远程直接内存访问(RDMA)协议的重构上。

传统RDMA在AI大规模集群环境中存在多路径利用不足、数据包顺序依赖、重传效率低和拥塞控制滞后等问题。

而Thor Ultra通过遵循UEC(Ultra Ethernet Consortium)标准,引入了一系列突破性的RDMA增强机制。

● 首先是数据包级多路径传输(Packet-Level Multipathing)。这一机制允许数据包在网络中动态分流到不同路径上,实现负载的实时平衡。

相比传统的流级多路径,数据包级机制能够在更细粒度上调度带宽资源,有效降低网络热点和瓶颈出现的概率,从而提高整体网络利用率。

● 其次,无序数据包传送(Out-of-Order Packet Delivery)使接收端能够直接将数据写入XPU内存,而无需等待数据包顺序的完整恢复。这一改进显著减少了延迟,并提升了AI训练过程中参数同步的实时性。

● 再者,选择性重传(Selective Retransmission)机制优化了错误恢复策略,仅对丢失或损坏的数据包执行重传,而非整体会话级别的恢复。这样不仅提升了带宽利用效率,还减少了延迟抖动,尤其在高并发AI训练任务中表现尤为突出。

在拥塞管理方面,Thor Ultra具备可编程拥塞控制管道(Programmable Congestion Control Pipeline),支持基于接收方和发送方的双向算法优化。

这意味着用户或系统软件可以针对不同AI负载特征,自定义拥塞响应策略,从而在训练或推理阶段实现带宽与延迟的最佳平衡。

Thor Ultra与Broadcom Tomahawk 6、Tomahawk Ultra以及Jericho 4系列交换芯片形成完整的AI网络生态。

在这一开放架构下,Thor Ultra支持UEC标准的数据包修剪与拥塞信令(CSIG)功能,可在检测到网络拥塞时主动协调交换机端限速或路由重分配。这种端到端联动机制构建了一个具备自适应流控能力的AI网络结构。

在此架构中,以太网正逐渐取代传统的InfiniBand方案。

与InfiniBand相比,Thor Ultra所在的超级以太网体系在兼容性、可扩展性和生态开放性上具有明显优势。

它不仅可以与不同厂商的光模块、XPU和交换机协同工作,也便于云计算平台进行弹性扩展和多租户管理。这种开放互通的特性正是推动AI网络标准化和规模化部署的关键。

小结

AI以太网技术迈入800GbE时代,体现在带宽翻倍,更在于架构开放与标准统一。

通过遵循UEC规范,Broadcom让以太网在AI训练、推理和高性能计算中具备了类似InfiniBand的延迟控制能力,却保留了开放生态和通用硬件的灵活性。

Thor Ultra与Tomahawk系列交换机的协同,使Broadcom在AI数据中心网络栈中形成了从交换到终端的完整布局。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    芝能智芯

    深入了解半导体行业以及中国芯片产...

    推荐商品

      举报文章问题

      ×
      • 营销广告
      • 重复、旧闻
      • 格式问题
      • 低俗
      • 标题夸张
      • 与事实不符
      • 疑似抄袭
      • 我有话要说
      确定 取消

      举报评论问题

      ×
      • 淫秽色情
      • 营销广告
      • 恶意攻击谩骂
      • 我要吐槽
      确定 取消

      用户登录×

      请输入用户名/手机/邮箱

      请输入密码