bytevyte
bytevyte
Language
ai-beats-pt

NVIDIA Estreia Arquitetura Vera Rubin para Reduzir Custos de Inferência de AI

arquitetura Vera Rubin

NVIDIA introduziu a Vera Rubin architecture, uma plataforma de computação de próxima geração projetada para alimentar as cargas de trabalho de inteligência artificial mais exigentes. Anunciado antes da conferência COMPUTEX 2026 em Taipei, o novo sistema foi projetado para lidar com modelos de trilhões de parâmetros, reduzindo significativamente os custos operacionais associados à inferência em larga escala.

A peça central deste anúncio é o Vera Rubin NVL72, um sistema de rack refrigerado a líquido que integra 36 Vera CPUs e 72 Rubin GPUs. Esta configuração de hardware foi construída para atender aos massivos requisitos de computação dos modelos de fronteira de AI. A NVIDIA afirmou que a arquitetura alcança uma redução de dez vezes nos custos de inferência por token, uma métrica que impacta diretamente a viabilidade comercial da implantação de sistemas massivos de AI generativa em escala.

Robótica Avançada e Sistemas Autônomos

Além da infraestrutura de data centers, a empresa expandiu seu alcance para a AI física com a estreia do Jetson Thor. Esta nova plataforma de robótica entrega 2.070 teraflops FP4 de desempenho, fornecendo o processamento de alta velocidade necessário para raciocínio e interação robótica complexa. A plataforma destina-se a preencher a lacuna entre a inteligência digital e o movimento físico em ambientes industriais e comerciais.

A empresa também lançou o Alpamayo, uma plataforma aberta especificamente para o desenvolvimento de veículos autônomos. O Alpamayo utiliza modelos de visão e linguagem com 10 bilhões de parâmetros para melhorar as capacidades de raciocínio de sistemas de condução autônoma. Ao fornecer uma estrutura aberta, a NVIDIA visa acelerar a implantação de veículos que possam entender e reagir melhor a ambientes de condução complexos por meio de contexto linguístico e visual avançado.

Implicações Estratégicas da Vera Rubin Architecture

A introdução da Vera Rubin architecture sinaliza uma mudança em direção a um hardware mais eficiente e especializado para a era pós-treinamento da AI. À medida que as empresas passam do treinamento inicial do modelo para a implantação de alto volume, a redução de custo de 10x oferecida pelo sistema NVL72 fornece um caminho claro para o escalonamento de serviços sem aumentos proporcionais no gasto de energia ou hardware. O foco no resfriamento líquido também reflete a crescente necessidade de gerenciamento térmico avançado em data centers de alta densidade.

O CEO da NVIDIA, Jensen Huang, deve proferir uma palestra em 1º de junho de 2026, onde são esperados mais detalhes sobre o lançamento dessas tecnologias. O avanço simultâneo em robótica e condução autônoma sugere uma estratégia para dominar todo o ciclo de vida da AI, desde as fábricas baseadas em nuvem onde os modelos nascem até os dispositivos de borda onde eles interagem com o mundo físico.

Embora nos esforcemos pela precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos qualquer responsabilidade por erros ou omissões.

Sources

NVIDIA GTC Taipei at COMPUTEX: Live Updates on What’s Next in AI

✔Human Verified

Share