英偉達NVLink技術深度分析
![](https://img1.headline01.com/images/cd/65/cd65f15a76e33f99bfeb86b1d7bcdfbd760fe0d9.jpg?wx_fmt=png&from=appmsg)
NVIDIA NVLink已成為高性能計算(HPC)和人工智能領域的關鍵技術。本文深入探討瞭NVLink的復雜性,並介紹NVSwitch芯片、NVLink服務器和NVLink交換機,以揭示其在不斷演進的先進計算領域中的重要性。
關於CPU、服務器和存儲詳細技術,請參考“服務器基礎知識全解(終極版)”,“2023年服務器計算機CPU行業報告”、“2023年機架式服務器行業洞察”、“2023~2025服務器CPU路綫圖”、“2023服務器産業鏈及市場競爭格局”、“存儲係統關鍵技術全解(終極版)”、“更新下載:存儲係統基礎知識全解(終極版)”、“存儲芯片技術基礎知識介紹(2023)”等等。
什麼是NVIDIA NVLink
NVLink是一種解決服務器內GPU之間通信限製的協議。與傳統的PCIe交換機不同,NVLink帶寬有限,可以在服務器內的GPU之間實現高速直接互連。第四代NVLink提供更高的帶寬,每條通道達到112Gbps,比PCIe Gen5通道速率快三倍。
![](https://img1.headline01.com/images/42/59/42596aa5d3e1cc6b1ede3728e819103a9a93493f.jpg?wx_fmt=png&from=appmsg)
NVLink旨在為GPU直接互連提供簡化、高速、點對點的網絡,相比傳統網絡減少瞭開銷。通過在不同層次提供CUDA加速,NVLink減少瞭與通信相關的網絡開銷。NVLink隨著GPU架構的演進不斷發展,從P100的NVLink1到H100的NVLink4,如圖所示。NVLink 1.0、NVLink 2.0、NVLink 3.0和NVLink 4.0之間的關鍵區彆在於連接方式、帶寬和性能。![](https://img1.headline01.com/images/24/26/2426e7f762642a3bdf639383f9b04d88cc1d3ba9.jpg?wx_fmt=png&from=appmsg)
NVSwitch芯片
NVSwitch芯片是一種物理芯片,類似於交換機ASIC,可通過高速的NVLink接口連接多個GPU,提高服務器內的通信和帶寬。第三代NVIDIA NVSwitch可支持以900 GB/s的速率互連每對GPU。![](https://img1.headline01.com/images/47/07/4707ad59af19bd4110c8c20f7c8dd2febca6980b.jpg?wx_fmt=png&from=appmsg)
NVSwitch3芯片具有64個NVLink4端口,提供總共12.8 Tbps的單嚮帶寬或3.2 TB/s的雙嚮帶寬。NVSwitch3芯片的獨特之處在於其集成瞭SHARP功能,對多個GPU單元的計算結果進行聚閤和更新,減少網絡數據包並提高計算性能。![](https://img1.headline01.com/images/34/8a/348a5f8c790c8f0e8c3c85df04b2b3df150a18d9.jpg?wx_fmt=png&from=appmsg)
NVLink服務器
NVLink服務器采用NVLink和NVSwitch技術連接GPU,通常可在英偉達(NVIDIA)的DGX係列服務器或具有類似架構的OEM HGX服務器中找到。這些服務器利用NVLink技術,提供齣色的GPU互聯性、可擴展性和高性能計算能力。2022年,英偉達(NVIDIA)宣布推齣第四代NVIDIA® DGX™係統,這是世界上首個采用新的NVIDIA DGX H100服務器構建的AI平颱。![](https://img1.headline01.com/images/9b/c3/9bc3bcef4209307c888bf16792b58aafb85ee2ba.jpg?wx_fmt=png&from=appmsg)
因此,NVLink服務器在科學計算、人工智能、大數據處理和數據中心等關鍵領域已經變得不可或缺。通過提供強大的計算能力和高效的數據處理,NVLink服務器不僅滿足瞭這些領域的嚴格要求,還推動瞭這些領域的進步和創新。![](https://img1.headline01.com/images/3b/d5/3bd5f1085b389abed1c4aea6f6d2a798e9ec2eb4.jpg?wx_fmt=png&from=appmsg)
NVLink交換機
2022年,英偉達(NVIDIA)將NVSwitch芯片獨立齣來,並製作成NVLink交換機,用於連接主機之間的GPU設備。它采用瞭1U尺寸設計,具有32個OSFP端口;每個OSFP端口包含8個112G PAM4通道,每個交換機內置2個NVSwitch3芯片。![](https://img1.headline01.com/images/0e/7c/0e7cd2fe2b1526a96827c4c83b2a91e0caa65d61.jpg?wx_fmt=png&from=appmsg)
NVLink網絡
NVSwitch物理交換機將多個NVLink GPU服務器連接成一個大型Fabric網絡,即NVLink網絡,解決瞭GPU之間的高速通信帶寬和效率問題。每個服務器都有獨立的地址空間,為NVLink網絡中的GPU提供數據傳輸、隔離和安全保護。當係統啓動時,NVLink網絡通過軟件API自動建立連接,並可以在運行過程中更改地址。![](https://img1.headline01.com/images/f1/e4/f1e4dccbe523cafe46dfb99c7081c88239299998.jpg?wx_fmt=png&from=appmsg)
該圖比較瞭NVLink網絡與傳統以太網網絡,演示瞭如何創建獨立於IP以太網並專用於GPU服務的NVLink網絡。InfiniBand網絡 VS NVLink網絡
InfiniBand網絡和NVLink網絡是在高性能計算和數據中心應用中使用的兩種不同的網絡技術。它們有以下區彆:架構和設計:InfiniBand網絡是一種采用多通道、高速串行連接的開放標準網絡技術,支持點對點和多播通信。NVLink網絡是由英偉達(NVIDIA)開發的專有技術,旨在實現GPU之間的高速直連。應用場景:InfiniBand網絡廣泛應用於高性能計算集群和大規模數據中心。NVLink網絡主要用於大規模GPU集群、HPC、人工智能等領域。帶寬和延遲:InfiniBand網絡提供高帶寬和低延遲的通信,提供更高的吞吐量和更短的傳輸延遲。NVLink網絡為GPU之間提供更高的帶寬和更低的延遲,以支持快速數據交換和協同計算。以下是使用NVLink網絡的H100和使用InfiniBand網絡的A100之間的帶寬比較。![](https://img1.headline01.com/images/5e/00/5e000749445d51684a712166f42c7102b7dd292c.jpg?wx_fmt=png&from=appmsg)
結論
NVIDIA NVLink作為一項開創性的技術,徹底改變瞭高性能計算和人工智能領域。它能夠增強GPU之間的通信,提高性能,並實現無縫的並行處理,成為眾多高性能計算和人工智能應用中不可或缺的組成部分。隨著先進計算領域的不斷發展,NVLink的重要性和影響力將不斷擴大,推動技術創新。ARM vs x86雲數據庫性能深度測評與對比
從Arm v8到v9,服務器發展之路
ARM與x86:有何區彆?
Arm增長突齣,中國服務器市場占比達16%
分布式軟件:X86/ARM CPU混閤部署
Arm競爭加劇,全球眾多巨頭湧入
ARM處理器架構和天梯圖解析
信創始於芯:Arm64體係結構編程與實踐
ARM v8處理器概述、架構、及技術介紹
飛騰係和鯤鵬係:國産Arm架構CPU服務器正在崛起
Fujitsu A64FX:繼承SPARC64架構的Arm超級處理器
收藏:從全球超算戰略看ARM指令架構在HPC領域的發展
眾多科技巨頭湧入ARM,國內研發進展及玩傢詳解
亞馬遜最新Arm服務器芯片詳解
計算芯片變革:ARM取代x86成為趨勢
國內外AI芯片、算力綜閤對比
華為算力編年史(2023)
AI算力研究框架(2023)
大模型訓練,英偉達Turing、Ampere和Hopper算力分析
AI大語言模型原理、演進及算力測算
大算力模型,HBM、Chiplet和CPO等技術打破技術瓶頸
- 高性能計算:RoCE v2 vs. InfiniBand網絡該怎麼選?
轉載申明:轉載本號文章請注明作者和來源,本號發布文章若存在版權等問題,請留言聯係處理,謝謝。更多架構相關技術知識總結請參考“架構師全店鋪技術資料打包(全)”相關電子書(41本技術資料打包匯總詳情可通過“閱讀原文”獲取)。全店內容持續更新,現下單“架構師技術全店資料打包匯總(全)”一起發送“服務器基礎知識全解(終極版)”和“存儲係統基礎知識全解(終極版)”pdf及ppt版本,後續可享全店內容更新“免費”贈閱,價格僅收249元(原總價399元)。
溫馨提示:
掃描二維碼關注公眾號,點擊閱讀原文鏈接獲取“架構師技術全店資料打包匯總(全)”電子書資料詳情。
![](https://img1.headline01.com/images/5e/b7/5eb7b4b4d1410061cb95cf05ecfa52cd8d651ce0.jpg?wx_fmt=other&wxfrom=5&wx_lazy=1&wx_co=1&tp=webp)
![](https://img1.headline01.com/images/b4/39/b439c8c36e7c06ef58f785b4203c2e975e1caa64.jpg?wx_fmt=gif&wxfrom=5&wx_lazy=1&tp=webp)