英偉達NVLink技術深度分析

NVIDIA NVLink已成為高性能計算(HPC)和人工智能領域的關鍵技術。本文深入探討瞭NVLink的復雜性,並介紹NVSwitch芯片、NVLink服務器和NVLink交換機,以揭示其在不斷演進的先進計算領域中的重要性。

關於CPU、服務器和存儲詳細技術,請參考“服務器基礎知識全解(終極版)”,“2023年服務器計算機CPU行業報告”、“2023年機架式服務器行業洞察”、“2023~2025服務器CPU路綫圖”、“2023服務器産業鏈及市場競爭格局”、“存儲係統關鍵技術全解(終極版)”、“更新下載:存儲係統基礎知識全解(終極版)”、“存儲芯片技術基礎知識介紹(2023)”等等。

什麼是NVIDIA NVLink

NVLink是一種解決服務器內GPU之間通信限製的協議。與傳統的PCIe交換機不同,NVLink帶寬有限,可以在服務器內的GPU之間實現高速直接互連。第四代NVLink提供更高的帶寬,每條通道達到112Gbps,比PCIe Gen5通道速率快三倍。

NVLink旨在為GPU直接互連提供簡化、高速、點對點的網絡,相比傳統網絡減少瞭開銷。通過在不同層次提供CUDA加速,NVLink減少瞭與通信相關的網絡開銷。NVLink隨著GPU架構的演進不斷發展,從P100的NVLink1到H100的NVLink4,如圖所示。NVLink 1.0、NVLink 2.0、NVLink 3.0和NVLink 4.0之間的關鍵區彆在於連接方式、帶寬和性能。

NVSwitch芯片

NVSwitch芯片是一種物理芯片,類似於交換機ASIC,可通過高速的NVLink接口連接多個GPU,提高服務器內的通信和帶寬。第三代NVIDIA NVSwitch可支持以900 GB/s的速率互連每對GPU。

NVSwitch3芯片具有64個NVLink4端口,提供總共12.8 Tbps的單嚮帶寬或3.2 TB/s的雙嚮帶寬。NVSwitch3芯片的獨特之處在於其集成瞭SHARP功能,對多個GPU單元的計算結果進行聚閤和更新,減少網絡數據包並提高計算性能。

NVLink服務器

NVLink服務器采用NVLink和NVSwitch技術連接GPU,通常可在英偉達(NVIDIA)的DGX係列服務器或具有類似架構的OEM HGX服務器中找到。這些服務器利用NVLink技術,提供齣色的GPU互聯性、可擴展性和高性能計算能力。2022年,英偉達(NVIDIA)宣布推齣第四代NVIDIA® DGX™係統,這是世界上首個采用新的NVIDIA DGX H100服務器構建的AI平颱。

因此,NVLink服務器在科學計算、人工智能、大數據處理和數據中心等關鍵領域已經變得不可或缺。通過提供強大的計算能力和高效的數據處理,NVLink服務器不僅滿足瞭這些領域的嚴格要求,還推動瞭這些領域的進步和創新。

NVLink交換機

2022年,英偉達(NVIDIA)將NVSwitch芯片獨立齣來,並製作成NVLink交換機,用於連接主機之間的GPU設備。它采用瞭1U尺寸設計,具有32個OSFP端口;每個OSFP端口包含8個112G PAM4通道,每個交換機內置2個NVSwitch3芯片。

NVLink網絡

NVSwitch物理交換機將多個NVLink GPU服務器連接成一個大型Fabric網絡,即NVLink網絡,解決瞭GPU之間的高速通信帶寬和效率問題。每個服務器都有獨立的地址空間,為NVLink網絡中的GPU提供數據傳輸、隔離和安全保護。當係統啓動時,NVLink網絡通過軟件API自動建立連接,並可以在運行過程中更改地址。

該圖比較瞭NVLink網絡與傳統以太網網絡,演示瞭如何創建獨立於IP以太網並專用於GPU服務的NVLink網絡。

InfiniBand網絡 VS NVLink網絡

InfiniBand網絡和NVLink網絡是在高性能計算和數據中心應用中使用的兩種不同的網絡技術。它們有以下區彆:
架構和設計:InfiniBand網絡是一種采用多通道、高速串行連接的開放標準網絡技術,支持點對點和多播通信。NVLink網絡是由英偉達(NVIDIA)開發的專有技術,旨在實現GPU之間的高速直連。
應用場景:InfiniBand網絡廣泛應用於高性能計算集群和大規模數據中心。NVLink網絡主要用於大規模GPU集群、HPC、人工智能等領域。
帶寬和延遲:InfiniBand網絡提供高帶寬和低延遲的通信,提供更高的吞吐量和更短的傳輸延遲。NVLink網絡為GPU之間提供更高的帶寬和更低的延遲,以支持快速數據交換和協同計算。以下是使用NVLink網絡的H100和使用InfiniBand網絡的A100之間的帶寬比較。

結論

NVIDIA NVLink作為一項開創性的技術,徹底改變瞭高性能計算和人工智能領域。它能夠增強GPU之間的通信,提高性能,並實現無縫的並行處理,成為眾多高性能計算和人工智能應用中不可或缺的組成部分。隨著先進計算領域的不斷發展,NVLink的重要性和影響力將不斷擴大,推動技術創新。
相關閱讀:
  • Arm架構升級,v9與v8版本有何差異?
  • 從X86到ARM,跨越CPU架構鴻溝
  • ARM vs x86雲數據庫性能深度測評與對比

  • 從Arm v8到v9,服務器發展之路

  • ARM與x86:有何區彆?

  • Arm增長突齣,中國服務器市場占比達16%

  • 分布式軟件:X86/ARM CPU混閤部署

  • Arm競爭加劇,全球眾多巨頭湧入

  • ARM處理器架構和天梯圖解析

  • 信創始於芯:Arm64體係結構編程與實踐

  • ARM v8處理器概述、架構、及技術介紹

  • 飛騰係和鯤鵬係:國産Arm架構CPU服務器正在崛起

  • Fujitsu A64FX:繼承SPARC64架構的Arm超級處理器

  • 收藏:從全球超算戰略看ARM指令架構在HPC領域的發展

  • 眾多科技巨頭湧入ARM,國內研發進展及玩傢詳解

  • 亞馬遜最新Arm服務器芯片詳解

  • 計算芯片變革:ARM取代x86成為趨勢

  • 國內外AI芯片、算力綜閤對比

  • 華為算力編年史(2023)

  • AI算力研究框架(2023)

  • 大模型訓練,英偉達Turing、Ampere和Hopper算力分析

  • AI大語言模型原理、演進及算力測算

  • 大算力模型,HBM、Chiplet和CPO等技術打破技術瓶頸

  • 走進芯時代:AI算力GPU行業深度報告
  • 高性能計算:RoCE技術分析及應用
  • 高性能計算:談談被忽視的國之重器
  • 高性能計算:RoCE v2 vs. InfiniBand網絡該怎麼選?
  • 高性能網絡全麵嚮RDMA進軍


轉載申明:轉載本號文章請注明作者來源,本號發布文章若存在版權等問題,請留言聯係處理,謝謝。

推薦閱讀
更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(41本技術資料打包匯總詳情可通過“閱讀原文”獲取)。

全店內容持續更新,現下單“架構師技術全店資料打包匯總(全)”一起發送“服務器基礎知識全解(終極版)和“存儲係統基礎知識全解(終極版)pdf及ppt版本,後續可享全店內容更新“免費”贈閱,價格僅收249元(原總價399元)。


溫馨提示:

掃描二維碼關注公眾號,點擊閱讀原文鏈接獲取架構師技術全店資料打包匯總(全)電子書資料詳情