bytevyte
bytevyte
Language
ai-beats-pt

NVIDIA torna o MRC Protocol de código aberto para padronizar o Gigascale AI Networking

protocolo MRC

NVIDIA lançou o protocolo Multipath Reliable Connection (MRC) como uma especificação aberta através do Open Compute Project (OCP) para lidar com gargalos de rede em clusters massivos de IA. Este MRC protocol é uma tecnologia de transporte RDMA especializada que permite que uma única conexão de dados utilize múltiplos caminhos de rede simultaneamente, evitando o congestionamento comum em configurações Ethernet tradicionais. Ao tornar esta tecnologia aberta, a empresa visa estabelecer um padrão unificado para infraestrutura de IA em escala giga, à medida que as organizações escalam para centenas de milhares de GPUs.

O MRC protocol funciona distribuindo o tráfego por várias rotas disponíveis dentro de um fabric de rede, de forma semelhante a como uma malha urbana evita engarrafamentos ao oferecer várias ruas para um único destino. Esta abordagem é particularmente eficaz para a geração Blackwell de clusters de GPU, onde o volume colossal de dados pode facilmente sobrecarregar conexões de caminho único. O protocolo inclui recursos de desvio de falhas em nível de hardware que podem identificar e redirecionar o tráfego em torno de interrupções de rede em meros microssegundos, garantindo que execuções dispendiosas de treinamento de IA não sejam interrompidas por pequenas falhas de hardware.

Impacto Estratégico na Infraestrutura de IA

A decisão de abrir o código do MRC protocol sinaliza uma mudança na forma como a indústria lida com a camada física do desenvolvimento de IA. Embora a rede fosse anteriormente uma vantagem proprietária para fornecedores de hardware específicos, o movimento em direção a padrões abertos sugere que a interoperabilidade está se tornando um requisito para a próxima fase de escalonamento de IA. Grandes players do setor, incluindo OpenAI, Microsoft e Oracle, já começaram a implantar esta tecnologia em suas fábricas de IA para manter a alta taxa de transferência e a disponibilidade do sistema.

Para tomadores de decisão técnica, a adoção do MRC protocol oferece um caminho para arquiteturas de data center mais resilientes. Ao eliminar as lentidões relacionadas à rede que frequentemente assolam clusters com mais de 100.000 GPUs, as organizações podem maximizar a utilização de seus recursos de computação. A integração com o hardware Ethernet Spectrum-X fornece uma base comprovada para este protocolo, embora seu status como uma especificação OCP signifique que outros fabricantes de hardware podem agora alinhar seus produtos com este padrão.

Este lançamento ocorre no momento em que a demanda por gigascale networking continua a crescer junto com o tamanho dos modelos de fundação. Em maio de 2026, a indústria está se afastando de silos proprietários isolados em direção a um modelo de infraestrutura mais colaborativo. O MRC protocol fornece a estrutura necessária para esta transição, garantindo que a camada de rede possa acompanhar o ritmo dos rápidos avanços no poder de processamento de IA.

Embora nos esforcemos pela precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos qualquer responsabilidade por erros ou omissões.

✔Human Verified

Share