NVIDIA veröffentlicht MRC-Protokoll als Open-Source zur Standardisierung von Gigascale AI Networking
NVIDIA hat das Multipath Reliable Connection (MRC) Protokoll als offene Spezifikation über das Open Compute Project (OCP) veröffentlicht, um Netzwerk-Engpässe in massiven KI-Clustern zu beheben. Dieses MRC protocol ist eine spezialisierte RDMA-Transporttechnologie, die es einer einzelnen Datenverbindung ermöglicht, mehrere Netzwerkpfade gleichzeitig zu nutzen, wodurch die in herkömmlichen Ethernet-Setups üblichen Überlastungen vermieden werden. Durch die Offenlegung dieser Technologie strebt das Unternehmen an, einen einheitlichen Standard für Gigascale AI-Infrastrukturen zu etablieren, während Organisationen auf Hunderttausende von GPUs skalieren.
Das MRC protocol funktioniert durch die Verteilung des Datenverkehrs über verschiedene verfügbare Routen innerhalb eines Network Fabric, ähnlich wie ein Stadtgitter Staus verhindert, indem es mehrere Straßen zu einem einzigen Ziel anbietet. Dieser Ansatz ist besonders effektiv für die Blackwell-Generation von GPU-Clustern, bei denen das schiere Datenvolumen Single-Path-Verbindungen leicht überlasten kann. Das Protokoll umfasst Hardware-Level Failure Bypass-Funktionen, die Netzwerkausfälle in nur Mikrosekunden identifizieren und den Verkehr umleiten können, um sicherzustellen, dass teure KI-Trainingsläufe nicht durch geringfügige Hardwarefehler unterbrochen werden.
Strategische Auswirkungen auf die KI-Infrastruktur
Die Entscheidung, das MRC protocol als Open-Source bereitzustellen, signalisiert einen Wandel im Umgang der Branche mit dem Physical Layer der KI-Entwicklung. Während Networking zuvor ein proprietärer Vorteil bestimmter Hardware-Anbieter war, deutet der Schritt hin zu offenen Standards darauf hin, dass Interoperabilität zu einer Voraussetzung für die nächste Phase der KI-Skalierung wird. Große Branchenakteure wie OpenAI, Microsoft und Oracle haben bereits damit begonnen, diese Technologie in ihren KI-Fabriken einzusetzen, um einen hohen Durchsatz und die Systemverfügbarkeit aufrechtzuerhalten.
Für technische Entscheidungsträger bietet die Einführung des MRC protocol einen Weg zu resilienteren Rechenzentrumsarchitekturen. Durch die Eliminierung netzwerkbedingter Verlangsamungen, die häufig Cluster mit mehr als 100.000 GPUs plagen, können Unternehmen die Auslastung ihrer Rechenressourcen maximieren. Die Integration mit Spectrum-X Ethernet-Hardware bietet eine bewährte Grundlage für dieses Protokoll, wobei sein Status als OCP-Spezifikation bedeutet, dass andere Hardwarehersteller ihre Produkte nun an diesem Standard ausrichten können.
Diese Veröffentlichung erfolgt zu einem Zeitpunkt, an dem der Bedarf an Gigascale Networking parallel zur Größe von Foundation Models weiter wächst. Stand Mai 2026 bewegt sich die Branche weg von isolierten, proprietären Silos hin zu einem kollaborativeren Infrastrukturmodell. Das MRC protocol liefert den notwendigen Rahmen für diesen Übergang und stellt sicher, dass die Netzwerkschicht mit den rasanten Fortschritten der KI-Rechenleistung Schritt halten kann.
Obwohl wir uns um Genauigkeit bemühen, kann bytevyte Fehler machen. Benutzern wird empfohlen, alle Informationen unabhängig zu überprüfen. Wir übernehmen keine Haftung für Fehler oder Auslassungen.
Related Articles
- NVIDIA bringt NemoClaw Open-Source Stack zur Absicherung autonomer KI-Agenten auf den Markt
- NVIDIA bringt NemoClaw auf den Markt, um das virale OpenClaw AI Agent Framework abzusichern
- Marvell und Alphabet entwickeln gemeinsam Custom AI Inference Silicon
✔Human Verified