bytevyte
bytevyte
Language
ai-beats-es

NVIDIA libera el protocolo MRC como código abierto para estandarizar el networking de IA a escala giga

protocolo MRC

NVIDIA ha lanzado el protocolo Multipath Reliable Connection (MRC) como una especificación abierta a través del Open Compute Project (OCP) para abordar los cuellos de botella de red en clústeres masivos de IA. Este MRC protocol es una tecnología de transporte RDMA especializada que permite que una sola conexión de datos utilice múltiples rutas de red a la vez, evitando la congestión común en las configuraciones de Ethernet tradicionales. Al abrir esta tecnología, la compañía busca establecer un estándar unificado para la infraestructura de IA a escala giga a medida que las organizaciones escalan a cientos de miles de GPUs.

El MRC protocol funciona distribuyendo el tráfico a través de varias rutas disponibles dentro de un tejido de red, de manera similar a cómo una cuadrícula urbana evita los atascos de tráfico al ofrecer múltiples calles hacia un mismo destino. Este enfoque es particularmente efectivo para la generación Blackwell de clústeres de GPU, donde el volumen masivo de datos puede saturar fácilmente las conexiones de una sola ruta. El protocolo incluye capacidades de derivación de fallos a nivel de hardware que pueden identificar y redirigir el tráfico ante interrupciones de red en cuestión de microsegundos, garantizando que las costosas ejecuciones de entrenamiento de IA no se vean interrumpidas por fallos menores de hardware.

Impacto estratégico en la infraestructura de IA

La decisión de liberar el MRC protocol como código abierto señala un cambio en la forma en que la industria maneja la capa física del desarrollo de la IA. Si bien el networking era anteriormente una ventaja patentada para proveedores de hardware específicos, el movimiento hacia estándares abiertos sugiere que la interoperabilidad se está convirtiendo en un requisito para la próxima fase de escalado de la IA. Importantes actores de la industria, incluidos OpenAI, Microsoft y Oracle, ya han comenzado a implementar esta tecnología dentro de sus fábricas de IA para mantener un alto rendimiento y disponibilidad del sistema.

Para los responsables de la toma de decisiones técnicas, la adopción del MRC protocol ofrece un camino hacia arquitecturas de centros de datos más resilientes. Al eliminar las ralentizaciones relacionadas con la red que a menudo afectan a los clústeres con más de 100,000 GPUs, las organizaciones pueden maximizar la utilización de sus recursos de cómputo. La integración con el hardware Ethernet Spectrum-X proporciona una base probada para este protocolo, aunque su estatus como especificación de OCP significa que otros fabricantes de hardware ahora pueden alinear sus productos con este estándar.

Este lanzamiento se produce mientras la demanda de networking a escala giga sigue creciendo junto con el tamaño de los modelos fundacionales. A partir de mayo de 2026, la industria se está alejando de los silos patentados aislados hacia un modelo de infraestructura más colaborativo. El MRC protocol proporciona el marco necesario para esta transición, asegurando que la capa de red pueda seguir el ritmo de los rápidos avances en la potencia de procesamiento de la IA.

Si bien nos esforzamos por la precisión, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.

✔Human Verified

Share