芝能智芯出品
Broadcom正式推出了业界首款符合超级以太网联盟(UEC)标准的800GbE AI以太网网络接口卡——Thor Ultra。
以太网技术在AI集群互联领域实现了又一次重大跨越,在带宽、延迟和拥塞控制等关键性能上实现突破,还通过可编程RDMA、PCIe Gen6接口以及与Tomahawk 6系列交换芯片的深度协同,为AI基础设施提供了开放、高效、可扩展的解决方案,以太网正在逐步取代InfiniBand,成为新一代AI计算网络的核心架构。

Part 1Broadcom Thor Ultra技术架构
Broadcom Thor Ultra 800GbE NIC的设计完全围绕AI数据中心的极致性能需求展开。
与上一代产品相比,Thor Ultra采用了全新的BCM57708控制器芯片,支持高达800Gbps的吞吐能力。
这意味着每张网卡可以同时处理多达200G或100G的PAM4 SerDes信号,实现长距离无源铜缆连接,同时维持业界最低误码率(BER),高精度信号处理能力在保证链路稳定的同时,有效降低了数据传输抖动,提高了作业完成时间(Job Completion Time, JCT)的效率。

在物理接口上,Thor Ultra提供了符合OCP 3.0规范的外形设计,并采用OSFP112接口形式。
这一接口支持112G PAM4 SerDes信号速率,为AI训练服务器、加速器(XPU)和高速交换机之间的互联提供了可扩展的硬件基础。
此外,Thor Ultra通过PCI Express Gen6 x16主机接口,实现了高达128GB/s的主机通信带宽,为未来AI集群中的GPU、TPU和自研XPU提供了更充裕的数据通道。

为了满足AI集群中高强度的数据安全需求,Thor Ultra集成了PSP(Packet Security Processor)加速模块,可在网络层面实现线速加密与解密操作。
这种硬件级卸载机制大幅减轻了主机CPU或XPU的计算负载,提升整体计算效率。
在安全性方面,Thor Ultra还支持签名固件和设备级证明(Device Attestation),确保启动过程和固件加载的完整性,从而防范潜在的安全攻击。

Part 2RDMA创新与AI网络生态
Thor Ultra的核心技术突破体现在对远程直接内存访问(RDMA)协议的重构上。
传统RDMA在AI大规模集群环境中存在多路径利用不足、数据包顺序依赖、重传效率低和拥塞控制滞后等问题。
而Thor Ultra通过遵循UEC(Ultra Ethernet Consortium)标准,引入了一系列突破性的RDMA增强机制。

● 首先是数据包级多路径传输(Packet-Level Multipathing)。这一机制允许数据包在网络中动态分流到不同路径上,实现负载的实时平衡。
相比传统的流级多路径,数据包级机制能够在更细粒度上调度带宽资源,有效降低网络热点和瓶颈出现的概率,从而提高整体网络利用率。
● 其次,无序数据包传送(Out-of-Order Packet Delivery)使接收端能够直接将数据写入XPU内存,而无需等待数据包顺序的完整恢复。这一改进显著减少了延迟,并提升了AI训练过程中参数同步的实时性。
● 再者,选择性重传(Selective Retransmission)机制优化了错误恢复策略,仅对丢失或损坏的数据包执行重传,而非整体会话级别的恢复。这样不仅提升了带宽利用效率,还减少了延迟抖动,尤其在高并发AI训练任务中表现尤为突出。

在拥塞管理方面,Thor Ultra具备可编程拥塞控制管道(Programmable Congestion Control Pipeline),支持基于接收方和发送方的双向算法优化。
这意味着用户或系统软件可以针对不同AI负载特征,自定义拥塞响应策略,从而在训练或推理阶段实现带宽与延迟的最佳平衡。

Thor Ultra与Broadcom Tomahawk 6、Tomahawk Ultra以及Jericho 4系列交换芯片形成完整的AI网络生态。
在这一开放架构下,Thor Ultra支持UEC标准的数据包修剪与拥塞信令(CSIG)功能,可在检测到网络拥塞时主动协调交换机端限速或路由重分配。这种端到端联动机制构建了一个具备自适应流控能力的AI网络结构。
在此架构中,以太网正逐渐取代传统的InfiniBand方案。
与InfiniBand相比,Thor Ultra所在的超级以太网体系在兼容性、可扩展性和生态开放性上具有明显优势。
它不仅可以与不同厂商的光模块、XPU和交换机协同工作,也便于云计算平台进行弹性扩展和多租户管理。这种开放互通的特性正是推动AI网络标准化和规模化部署的关键。
小结
AI以太网技术迈入800GbE时代,体现在带宽翻倍,更在于架构开放与标准统一。
通过遵循UEC规范,Broadcom让以太网在AI训练、推理和高性能计算中具备了类似InfiniBand的延迟控制能力,却保留了开放生态和通用硬件的灵活性。
Thor Ultra与Tomahawk系列交换机的协同,使Broadcom在AI数据中心网络栈中形成了从交换到终端的完整布局。
