- 经验
- 46
- 分贝
- 0
- 家园分
- 331
- 在线时间:
- 329 小时
- 最后登录:
- 2025-8-26
- 帖子:
- 31
- 精华:
- 0
- 注册时间:
- 2017-9-28
- UID:
- 1352367
注册:2017-9-28
|
本帖最后由 abelhsu 于 2025-8-26 13:49 编辑
https://ultraethernet.org/Ultra Ethernet Consortium (UEC) 規格的核心特點:
UEC 規格旨在提供一個高效能、可擴展且可互操作的解決方案,涵蓋網路堆疊的所有層面,包括網卡 (NIC)、交換器、光纖和電纜,從而實現無縫的多供應商整合並加速整個生態系統的創新。
以下是其主要特點和組成部分:
- 專為 AI 和 HPC 工作負載設計:UEC 的核心目標是解決 AI 和 HPC 應用對網路帶寬、低延遲和大規模連接的嚴苛要求。
- 開放標準和互操作性:透過推廣開放、可互操作的標準,UEC 旨在避免供應商鎖定,並鼓勵整個生態系統的創新。
- 端到端可擴展性:從路由和配置到操作和測試,UEC 可以擴展到數百萬個端點。
- 基於現有乙太網標準:UEC 1.0 建立在全球廣泛採用的乙太網標準之上,簡化了從硬體到應用的整個技術堆疊的部署。
UEC 規格的關鍵層面:
UEC 規格涵蓋了網路堆疊的各個層面,並引入了新的增強功能:
- Ultra Ethernet Transport (UET):
- 現代化 RDMA (Remote Direct Memory Access):支援智能、低延遲的傳輸,適用於高吞吐量環境。UET 在其 RDMA 傳輸協議中採用了全新的方法,以滿足不斷發展的 AI 和 HPC 工作負載的需求,消除了連接建立延遲並最大限度地減少了持久連接狀態。
- 精細的擁塞控制:採用了新的發送方擁塞控制方案,並針對 AI 和 HPC 工作負載進行了優化,能夠在面對擁塞時快速響應。
- 多路徑和封包噴射 (Packet Spraying):UET 支援多路徑封包傳輸和細粒度的負載平衡,透過封包噴射使每個流可以同時使用到目的地的所有路徑,從而實現所有網路路徑的平衡使用。
- 多種封包傳輸模式:
- RUD (Reliable Unordered Delivery):可靠的無序傳輸。
- ROD (Reliable Ordered Delivery):可靠的有序傳輸。
- RUDI (Reliable Unordered Delivery Idempotent):可靠的無序冪等傳輸。
- UUD (Unreliable Unordered Delivery):不可靠的無序傳輸。
- 分層結構:UET 傳輸層分為四個子層:
- 封包傳輸子層 (Packet Delivery Sub-layer, PDS)
- 語義子層 (Semantic Sub-layer, SES)
- 擁塞管理子層 (Congestion Management Sub-layer, CMS)
- 傳輸安全子層 (Transport Security Sub-layer, TSS)
- UDP 封裝:UET 標頭堆疊被封裝在 IP/UDP 封包中。
- 軟體層 (Software Layer):
- 支援 libfabric API,這是行業採用的北向網路 API。
- 為 AI 和 HPC 工作負載優化了消息和發起者/目標型通訊。
- 網路層 (Network Layer):
- 保持標準 IP 協議不變,但在其基礎上進行了創新。
- 連結層 (Link Layer):
- 引入了 連結層重試 (Link Layer Retry, LLR) 的標準,以提高高帶寬密度鏈路的可靠性。
- 與 IEEE 802.3 標準乙太網完全兼容,支援每通道 100Gbps 和 200Gbps,並可擴展到 800Gbps 及更高的端口速度。
- 安全性 (Security):
- 將安全性作為一個基本原則,利用可擴展的金鑰加密。傳輸安全層提供選擇性加密和認證所有資料負載和大部分傳輸標頭的選項。
- 網路內集合運算 (In-Network Collectives, INCs):
- UEC 定義了將集合運算 (例如 AllReduce) 卸載到網路的機制,從而提高帶寬利用率並縮短某些集合運算的執行時間。
UEC 的目標性能指標:
- 支援高達 100 萬個 GPU/TPU 的 AI 訓練/推論叢集。
- 往返時間 (Round-trip time) 低於 10 微秒。
- 單介面帶寬達到 800Gbps 及更高。
總之,Ultra Ethernet Consortium 的規格旨在透過對乙太網進行關鍵增強,特別是在傳輸層和鏈路層,以滿足 AI 和 HPC 應用對極高性能和可擴展網路的需求,同時保持與現有乙太網基礎設施的兼容性。
|
|