Mellanox (NVIDIA Mellanox) 920-9B210-00FN-0D0 InfiniBand Switch Toepassingspraktijk
January 6, 2026
Achtergrond en uitdagingen: de knelpunt van het netwerk in de moderne informatica
In de race voor wetenschappelijke ontdekkingen en AI doorbraken, werd de rekenkracht van een toonaangevende onderzoeksinstelling niet verstikt door een gebrek aan ruwe verwerkingskracht,maar door hun netwerk weefselHun bestaande HDR InfiniBand-infrastructuur, hoewel in staat, had moeite om bij te blijven met de enorme,synchroniseerde communicatiebehoeften van hun nieuw ingezette NVIDIA DGX-clusters en traditionele HPC-workloadsOnderzoekers werden geconfronteerd met aanzienlijke vertragingen in de voltooiingstijden van de werkzaamheden, waarbij netwerklatentie en congestie tijdens alle-tot-alle-communicatiepatronen de belangrijkste knelpunten werden.
De uitdaging was tweeledig: ten eerste om de latentie voor Remote Direct Memory Access (RDMA) -operaties die cruciaal zijn voor MPI-gebaseerde HPC-simulaties drastisch te verminderen.niet-blokkerende stof voor AI-trainingswerkzaamheden die een constante synchronisatie van parameters tussen honderden GPU's vereistenDe instelling had een toekomstbestendige oplossing nodig die NDR 400Gb/s snelheden kon verwerken en tegelijkertijd volledigverenigbaarde bestaande ecosystemen, waardoor een kosteneffectief upgradeproces zonder volledige herziening wordt gewaarborgd.
Oplossing en implementatie: implementatie van de 920-9B210-00FN-0D0 stof
Na een grondige evaluatie heeft de instelling deNVIDIA Mellanox 920-9B210-00FN-0D0De oplossing richtte zich op het inzetten van meerdere920-9B210-00FN-0D0 MQM9790-NS2Fschakelaars om een high-bandwidth, low-latency ruggengraatslaag te vormen, die alle reken- en opslagknooppunten verbindt.
De implementatie werd gestructureerd als een hybride tweelaagse fat-tree-topologie om de bisectionele bandbreedte te maximaliseren en het aantal hops te minimaliseren.
- Fabriekskern:Een wervelkolom die volledig is opgebouwd met920-9B210-00FN-0D0switches, die de NDR 400Gb/s backbone leveren.
- Naadloze integratie:Door gebruik te maken van de achterwaarts compatibiliteit van de switch, werden bestaande HDR-leaf-switches en NIC's aangesloten, waardoor eerdere investeringen werden beschermd en tegelijkertijd incrementele knoopupgrades naar NDR werden mogelijk gemaakt.
- Geavanceerd management:De gehele stof, inclusief de nieuwe920-9B210-00FN-0D0 InfiniBand-schakelaar OPNDe apparatuur werd onder een enkel glaspaneel beheerd met behulp van NVIDIA UFM®, waardoor precieze prestatietelemetrie, geautomatiseerde stofvoorziening en snelle foutisolatie mogelijk werden.
- Validatie:Het IT-team heeft de ambtenaar grondig geraadpleegd920-9B210-00FN-0D0 gegevensbladenspecificatiesom de bereik, vermogen en koelingsvereisten van de kabels in hun datacenters te valideren en zo optimale prestaties te garanderen.
Deze architectuur heeft een verenigde920-9B210-00FN-0D0 InfiniBand switch OPN oplossing, die zowel de klassieke HPC- als de opkomende AI-workloads van de instelling bedient op een enkel, krachtig netwerk.
Effecten en voordelen: kwantificeerbare prestatie- en efficiëntiewinsten
De impact van de inzet van de920-9B210-00FN-0D0Het was onmiddellijk meetbaar en transformerend in meerdere dimensies van hun activiteiten.
| Metrische | Voorafgaand aan de uitzending | Na 920-9B210-00FN-0D0 Inzet |
|---|---|---|
| Gemiddelde MPI-latentie (ronde) | ~ 0,7 microseconden | ~0,5 microseconden |
| Tijdstip van voltooiing van de AI-opleidingsbaan (groot model) | 5.2 dagen | 3.8 dagen(27% vermindering) |
| Gebruik van stoffen tijdens de piek van alle-tot-alle | Vaak hoger dan 85%, waardoor congestie ontstaat | Stabiel onder 60% bij NDR-snelheden |
| Administratieve taken (fabrieksreconfiguratie) | Handmatige, tijdrovende processen | Geautomatiseerd via UFM®-integratie |
Het belangrijkste voordeel was de dramatische vermindering van de runtime van de applicatie.Een verbetering van 20-30% is te wijten aan een lagere en meer consistente MPI-latentie.Voor AI-teams betekende de bijna theoretische prestaties van RDMA over de nieuwe fabric dat de GPU-bronnen volledig waren verzadigd met berekeningen, niet vastzaten in afwachting van netwerkoverdrachten.Bij de beoordeling van het totaal920-9B210-00FN-0D0 prijsDe Commissie heeft de Commissie verzocht om een verslag uit te brengen over de resultaten van de onderzoeksprocedure.
Conclusie en vooruitzichten: een blauwdruk voor toekomstbestendige infrastructuur
De succesvolle toepassing van deNVIDIA Mellanox 920-9B210-00FN-0D0In deze onderzoeksomgeving dient het als een krachtige blauwdruk voor elke organisatie die geconfronteerd wordt met vergelijkbare interconnect uitdagingen.Het toont aan dat investeringen in een geavanceerd netwerkstuk geen bijkomende kosten zijn, maar een strategische vermenigvuldiger voor computationele investeringen.
De inzet van de instelling bewijst dat de920-9B210-00FN-0D0Het is meer dan een schakelaar; het is een platform voor convergentie. Het verenigt naadloos RDMA-gedreven HPC- en AI-werklasten op een enkel, ultra responsive netwerk,vereenvoudiging van de werkzaamheden en versnelling van de ontdekkingAls deze technologie wijdverspreid beschikbaar wordtvoor verkoop, stelt het een nieuwe standaard voor wat mogelijk is bij clustering met hoge prestaties.
Voor de toekomst betekent de inherente schaalbaarheid en prestatiekracht van de NDR 400Gb/s-fabriek dat de instelling in de toekomst goed gepositioneerd is om nog krachtigere rekenkrachten te integreren.De...920-9B210-00FN-0D0Het netwerk als een knelpunt heeft effectief geëlimineerd, waardoor onderzoekers zich uitsluitend kunnen concentreren op de grenzen van hun algoritmen en verbeelding.

