Toepassingspraktijk: NVIDIA Mellanox MCX631102AN-ADAT ¢ RDMA/RoCE Low-Latency Transport & Server Throughput Enhancement

April 27, 2026

Laatste bedrijfsnieuws over Toepassingspraktijk: NVIDIA Mellanox MCX631102AN-ADAT ¢ RDMA/RoCE Low-Latency Transport & Server Throughput Enhancement

In gedistribueerde opslag, high-performance computing en AI training clusters zijn netwerklatentie en CPU overhead de belangrijkste knelpunten geworden die de prestaties van servers beperken.Een cloudserviceprovider heeft onlangs zijn NVMe-oF-opslagbackend bijgewerkt door deNVIDIA Mellanox MCX631102AN-ADATDoor RDMA over Converged Ethernet (RoCEv2) in te zetten, bereikten ze end-to-end transport met lage latentie en aanzienlijke serverdoorvoerwinsten.Deze casestudy onderzoekt hoe de adapter in een productieomgeving presteert.

Achtergrond en uitdaging: de knelpunt van het TCP/IP-protocol

De bestaande 25GbE-infrastructuur van de provider verwerkte opslagverkeer met behulp van de traditionele TCP/IP-softwarestack.CPU-uitgaven voor pakketincapsulatie en -ontkapsulatie hoger dan 40%, wat resulteert in opslaglatenties hoger dan 200 μs en een sterk verminderde rekenkapaciteit op applicatie servers.CPU-interferentie verminderenNa het evalueren van meerdere opties kozen zij voor deMCX631102AN-ADAT ConnectX-6 Lx met twee poorten 25GbE SFP28als kernhardware voor de renovatie van hun opslagfabriek.

Oplossing en implementatie: RDMA/RoCEv2 met hardware-offloads

De implementatie vervangt alle opslaggerichte servers door deMCX631102AN-ADAT Ethernet-adapterkaartDe belangrijkste implementatiestappen waren onder meer:

  • Het mogelijk maken van SR-IOV en het toewijzen van virtuele functies (VF's) aan virtuele machines voor opslag, waarbij de hypervisor-netwerkstapel wordt omzeild
  • Configuratie van NVMe over Fabrics (NVMe-oF) met RDMA-transport, waarbij TCP-overhead volledig wordt geëlimineerd
  • Tuning switch bufferdrempels voor verliesloos 25GbE RoCE-verkeer over de leaf-spine-topologie

DeMCX631102AN-ADAT specificaties inclusief hardware-tijdstempels, dynamisch verbindingsvervoer (DCT) en vectoriseerde ontvangmotor  werden volledig gebruikt om voorspelbare submicroseconde latentie te garanderen, zelfs onder een totale belasting van 50 Gbps.

Gemeten prestatiewinsten en operationele voordelen

Na de migratie naar deNVIDIA Mellanox MCX631102AN-ADAT- op basis van weefsel, werden de volgende statistieken vastgelegd:

Metrische Voor (TCP/IP 25GbE) Na (RoCEv2 met MCX631102AN-ADAT)
NVMe-oF leeslatentie (P99) 215 μs 18 μs
CPU-gebruik (opslag I/O-pad) 41% (verzadigd met één kern) 7% (verdeeld over de kern)
Aggregate Server Throughput (RX+TX) 42 Gbps (software beperkt) 49.8 Gbps (lijnsnelheid)
Small Packet (64B) Doorvoer 8.1 Mpps 37.5 Mpps (hardwarestroomsturing)

Ingenieurs merkten op dat deMCX631102AN-ADAT Ethernet adapter kaart oplossingDe resultaten van het onderzoek toonden aan dat de CPU-kernen die vrij waren, opnieuw werden toegewezen aan applicatiewerklasten.het verhogen van de totale huurdersdichtheid met ongeveer 24% op dezelfde fysieke servers.

Compatibiliteit en ecosysteemintegratie

Bij de uitbreiding van de inzet heeft het operatieteam gecontroleerd of de adapterMCX631102AN-ADAT-compatibelVoor de aankoopplanning verwezen zij naar de ToR-switches van Arista en Cisco met DCBX-configuratie.MCX631102AN-ADAT-gegevensbladDe eerste grote enquêtes bevestigden dat de capaciteit van de installatie in de Gemeenschap met ongeveer 12 W was gestegen.MCX631102AN-ADAT prijsDe markt voor smartNIC's in de VS blijft concurrerend in vergelijking met SmartNIC's van vergelijkbare klasse, met meerdere distributeurs dieMCX631102AN-ADAT te koopin het kader van standaardvolumeovereenkomsten.

Samenvatting en vooruitzichten

De productieprocedure toont duidelijk aan dat deMCX631102AN-ADATHet is de bedoeling van de nieuwe technologie om een fundamentele verschuiving van TCP-gebonden opslagnetwerken naar RDMA-versnelde fabrics mogelijk te maken zonder een volledige 100GbE-infrastructuuroverziening te vereisen.MCX631102AN-ADAT ConnectX-6 Lx met twee poorten 25GbE SFP28Het is de bedoeling dat de organisaties de effectieve doorvoer voor latency-gevoelige workloads kunnen verdubbelen en tegelijkertijd aanzienlijke CPU-bronnen kunnen terugvorderen.Hetzelfde inzetpatroon zal zich uitstrekken tot gedistribueerde machine learning frameworks (NCCL over RoCE) en op microservices gebaseerde stateful applicaties.Voor architecten die 25GbE-upgrades evalueren, is deNVIDIA Mellanox MCX631102AN-ADATstaat als een beproefde, productie-geharde bouwsteen voor high-performance, low-latency datacenter netwerken.