NVIDIA rend le protocole MRC open-source pour standardiser le réseautage IA à l'échelle gigascale
NVIDIA a publié le protocole Multipath Reliable Connection (MRC) en tant que spécification ouverte via l'Open Compute Project (OCP) pour remédier aux goulots d'étranglement réseau dans les clusters d'IA massifs. Ce MRC protocol est une technologie de transport RDMA spécialisée qui permet à une seule connexion de données d'utiliser plusieurs chemins réseau simultanément, évitant ainsi la congestion courante dans les configurations Ethernet traditionnelles. En ouvrant cette technologie, l'entreprise vise à établir une norme unifiée pour l'infrastructure IA à l'échelle gigascale, alors que les organisations passent à des centaines de milliers de GPU.
Le MRC protocol fonctionne en répartissant le trafic sur divers itinéraires disponibles au sein d'une structure réseau, à l'instar d'un quadrillage urbain qui prévient les embouteillages en offrant plusieurs rues pour une seule destination. Cette approche est particulièrement efficace pour la génération Blackwell de clusters GPU, où le volume massif de données peut facilement saturer les connexions à chemin unique. Le protocole inclut des capacités de contournement de défaillance au niveau matériel capables d'identifier et de réacheminer le trafic en cas de panne réseau en quelques microsecondes seulement, garantissant que les coûteuses sessions d'entraînement d'IA ne soient pas interrompues par des incidents matériels mineurs.
Impact stratégique sur l'infrastructure d'IA
La décision de rendre le MRC protocol open-source marque un tournant dans la gestion de la couche physique du développement de l'IA par l'industrie. Alors que le réseautage était auparavant un avantage propriétaire pour certains fournisseurs de matériel, le passage vers des normes ouvertes suggère que l'interopérabilité devient une exigence pour la prochaine phase de mise à l'échelle de l'IA. Des acteurs majeurs du secteur, notamment OpenAI, Microsoft et Oracle, ont déjà commencé à déployer cette technologie au sein de leurs usines d'IA pour maintenir un débit élevé et une disponibilité du système.
Pour les décideurs techniques, l'adoption du MRC protocol offre une voie vers des architectures de centres de données plus résilientes. En éliminant les ralentissements liés au réseau qui affectent souvent les clusters de plus de 100 000 GPU, les organisations peuvent maximiser l'utilisation de leurs ressources de calcul. L'intégration avec le matériel Ethernet Spectrum-X fournit une base éprouvée pour ce protocole, bien que son statut de spécification OCP signifie que d'autres fabricants de matériel peuvent désormais aligner leurs produits sur cette norme.
Cette version intervient alors que la demande pour le réseautage à l'échelle gigascale continue de croître parallèlement à la taille des modèles de fondation. En mai 2026, l'industrie s'éloigne des silos propriétaires isolés pour s'orienter vers un modèle d'infrastructure plus collaboratif. Le MRC protocol fournit le cadre nécessaire à cette transition, garantissant que la couche réseau puisse suivre le rythme des avancées rapides de la puissance de traitement de l'IA.
Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité en cas d'erreurs ou d'omissions.
Related Articles
- NVIDIA lance la NVIDIA NemoClaw open-source stack pour sécuriser les agents IA autonomes
- NVIDIA lance NemoClaw pour sécuriser le framework viral d'agents IA OpenClaw
- Marvell et Alphabet co-développent du silicium d'inférence IA personnalisé
✔Human Verified