通信行业点评:超以太网联盟成立 剑指INFINIBAND

2023-07-24 08:30:04 和讯  国盛证券宋嘉吉/黄瀚
  超以太网联盟(Ultra Ethernet Consort ium, UEC)日前成立,旨在推广一种升级版以太网协议,与InfiniBand 在AI 和HPC 领域同台竞争。
  UEC 集结了AMD、Arista、博通、思科等设备商和Meta、微软等云厂商,我们认为这是各大厂商在算力急剧攀升的背景下,进一步提高对于网络架构的重视。而此前较适配于AI/HPC 的Infiniband 架构相对封闭,基于以太网的UEC 在RoCE 的基础上更多考虑了结合以太网的优势,在开放的生态下做非无损网络以满足AI 和HPC 的要求。
  UEC 寻求在RDMA 基础上进一步升级。目前,基于远程直接数据存取(RDMA)的RoCE 能够在以太网协议下实现远程内存访问,绕过CPU 控制,实现数据的“0 拷贝”,同时,数据包的封装和解封都由网卡完成,从而极大节省CPU 资源。但目前RoCE 暴露出一个问题:必须运行在无损网络中。
  RDMA 协议下,如果出现丢包或乱包,会导致回退N 帧(Go-back-N,GBN)问题,必须重新传输丢失/乱序的这N 个包。RDMA 引入优先流量控制(PFC)协议,从接收方向发送方发送PAUSE 帧,从而实现无损网络,但这也带来队头堵塞问题,导致通信网络性能下降。
  超以太网传输(Ultra Ethernet Transport,UET)是下一代应用于AI超算和HPC 的网络协议。对于AI 超算和HPC,通信网络必须又快又准地将数据包传送到对应节点,UET 提出在有损网络下的针对队头堵塞和堵塞扩散的解决方案:保留IP 协议,因此UET 本质还是开放协议;多路径+数据包喷洒(packet-spraying)技术,充分利用高带宽通信网络,无需负载平衡算法;播送管理机制,减少掉线;支持对API 进行无序数据包发送,提升网络并发性能;支持百万数量级端口,满足AI 超算和HPC 集群所需的交换规模。
  UET 特别考虑了AI计算的安全工程问题。UET 利用IPSec 和PSP 等现代加密方法,实现高效的API 会话管理、身份验证和数据保密。UET 支持数万个计算节点共享密钥,符合AI 超算多节点训练和推理的安全工程需求,从而实现保护用户隐私、便于内容监管。
  投资建议:UEC 成立进一步增强网络侧对于AI/HPC 重要性的共识,建议关注网络侧核心方向:
  1)光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁等。
  2)交换机:中兴通讯、紫光股份、锐捷网络、菲菱科思、恒为科技等。
  未来的混合传输协议下,网络运维的复杂程度将变高,需要更高效和具备保障能力的可视化运维系统。建议关注:恒为科技、浩瀚深度、中新赛克等。
  风险提示:AI 发展不及预期,算力需求不及预期。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读