Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand-switch in productie

April 15, 2026

Laatste bedrijfsnieuws over Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand-switch in productie
Achtergrond & Uitdaging: De Schaalbaarheidsmuur in AI-trainingsclusters

Een toonaangevend Oost-Aziatisch AI-onderzoeksinstituut kampte met een veelvoorkomende maar kritieke knelpunt. Hun 512-GPU-cluster, gebruikt voor het trainen van grote taalmodellen en moleculaire dynamische simulaties, leed onder ernstige prestatievermindering naarmate de taken schaalden. De hoofdoorzaak was het verouderde 100 Gb/s Ethernet-netwerk, waar TCP/IP-overhead en pakketverlies tijdens incast-gebeurtenissen leidden tot GPU-inactiviteitstijden van wel 35%. Het team had behoefte aan een verliesvrij, ultralage latentie netwerk dat RDMA kon ondersteunen en kon schalen naar duizenden knooppunten zonder compromissen te sluiten op deterministische prestaties. Na evaluatie van verschillende oplossingen kozen ze voor de Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand-switch als de kern van hun nieuwe spine-leaf architectuur.

Oplossing & Implementatie: Integratie van de 920-9B210-00FN-0D0 in een NDR-netwerk

De implementatie was gecentreerd rond de 920-9B210-00FN-0D0 als de spine-laag, met 32 leaf-switches die 512 NVIDIA A100 GPU's verbonden via ConnectX-7 adapters. Elke 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR switch biedt 400 Gb/s per poort, wat de bandbreedte van eerdere HDR-oplossingen verdubbelt met behoud van sub-microseconden schakellatentie. De officiële 920-9B210-00FN-0D0 InfiniBand switch OPN vereenvoudigde de inkoop en zorgde voor firmwareconsistentie over alle eenheden. Netwerkengineers gebruikten het gedetailleerde 920-9B210-00FN-0D0 datasheet en 920-9B210-00FN-0D0 specificaties om de stroom- en thermische vereisten te valideren, waardoor een naadloze integratie in bestaande 19" racks mogelijk werd. Cruciaal is dat de switch volledig 920-9B210-00FN-0D0 compatibel is met zowel de bestaande HDR-infrastructuur als nieuwere NDR-endpoints, wat een gefaseerde migratie mogelijk maakt.

Prestatieresultaten & Operationele Voordelen
  • RDMA Efficiëntiewinsten: Met de NVIDIA Mellanox 920-9B210-00FN-0D0 die hardwarematige congestiecontrole mogelijk maakt, daalde de RDMA write-latentie van 12 µs naar 1,2 µs. GPU direct RDMA (GDR) werd volledig effectief, waardoor CPU-geheugenknelpunten werden geëlimineerd.
  • HPC Applicatiesnelheid: Een belangrijke weersvoorspellingscode (MPI-gebaseerd) zag een 2,7x prestatieverbetering dankzij de adaptieve routering en SHARP v2 collectieve offloads van de switch.
  • AI Training Doorvoer: Voor een 175 miljard parameter LLM-trainingsjob verminderde het nieuwe netwerk de all-reduce tijd met 68%, waardoor de algehele GPU-benutting van 62% naar 91% verbeterde.
  • Operationele Eenvoud: De 920-9B210-00FN-0D0 InfiniBand switch OPN-oplossing integreerde met NVIDIA's UFM-platform, wat realtime telemetrie en voorspellende storingsmeldingen bood. IT-managers rapporteerden een 50% reductie in netwerkgerelateerde probleemoplossingstijd.
Inzicht in Kosten & Beschikbaarheid

Bij het evalueren van het project vergeleek het onderzoeksinstituut de 920-9B210-00FN-0D0 prijs met concurrerende Ethernet-oplossingen. Ondanks hogere initiële kosten, gaf de totale eigendomskosten (TCO) de voorkeur aan InfiniBand vanwege hogere GPU-benutting en lager vermogen per Gb/s. Eenheden zijn direct beschikbaar als 920-9B210-00FN-0D0 te koop via de distributiekanalen van NVIDIA, met aanzienlijk kortere levertijden dan andere NDR-switches. De gedetailleerde 920-9B210-00FN-0D0 specificaties bevestigden ook de ondersteuning voor redundante voedingen en hot-swappable ventilatoren, wat voldeed aan de betrouwbaarheidsvereisten van het instituut voor 24/7 AI-onderzoeksactiviteiten.

Belangrijkste Technische Specificaties in één oogopslag
Parameter Detail
Model NVIDIA Mellanox 920-9B210-00FN-0D0
Poortsnelheid 400 Gb/s NDR (per poort)
Basis OPN 920-9B210-00FN-0D0 InfiniBand switch OPN
Volledige Configuratie 920-9B210-00FN-0D0 MQM9790-NS2F 400Gb/s NDR
Samenvatting & Vooruitzichten: De Standaard voor Next-Gen AI-netwerken

Het AI-onderzoeksinstituut heeft nu de 920-9B210-00FN-0D0 gestandaardiseerd voor alle toekomstige clusteruitbreidingen, inclusief een gepland 2.048-GPU NDR200-netwerk. Dit praktijkvoorbeeld toont aan dat de NVIDIA Mellanox 920-9B210-00FN-0D0 niet zomaar een switch is - het is een fundamenteel onderdeel voor het bereiken van lineaire prestatieschaalbaarheid in AI- en HPC-omgevingen. Voor architecten en IT-managers die netwerkknelpunten willen elimineren, biedt de 920-9B210-00FN-0D0 InfiniBand switch OPN-oplossing een bewezen, productieklare weg vooruit.