bytevyte
bytevyte
Language
ai-beats-pt

NVIDIA Cosmos 3 é Lançado como Modelo de Fundação Aberto para Raciocínio de IA Física

NVIDIA Cosmos 3

NVIDIA apresentou o NVIDIA Cosmos 3, um modelo de fundação de mundo projetado para unificar raciocínio e ação para sistemas de IA física. Anunciado na Computex 2026, esta plataforma de código aberto representa uma mudança em relação às arquiteturas robóticas tradicionais que dependem de módulos separados para percepção e controle motor. Ao integrar dados de texto, vídeo, áudio e ação robótica em um único framework Mixture-of-Transformers (MoT), o modelo permite que máquinas autônomas prevejam interações físicas e gerenciem casos extremos complexos em tempo real.

O lançamento inclui duas versões primárias: Cosmos 3 Nano, com 8 bilhões de parâmetros para raciocínio e geração, e Cosmos 3 Super, um modelo maior de 32 bilhões de parâmetros. Esses modelos são otimizados para ambientes de hardware específicos, com a variante Nano adaptada para estações de trabalho RTX PRO 6000, enquanto a variante Super foi construída para clusters de GPU Hopper e Blackwell. A NVIDIA está distribuindo a tecnologia sob a licença OpenMDW 1.1 via Hugging Face e GitHub, sinalizando um compromisso com o desenvolvimento de código aberto no setor de robótica.

Arquitetura Técnica do NVIDIA Cosmos 3

A arquitetura Mixture-of-Transformers é a inovação central do NVIDIA Cosmos 3. Este design combina uma subsequência de raciocínio autorregressiva com uma subsequência de geração baseada em difusão. O componente de raciocínio lida com dedução lógica e planejamento, enquanto o componente de difusão gera resultados fisicamente plausíveis para movimentos robóticos, como ângulos de articulação e posições de garras. Essa abordagem unificada elimina a latência e a perda de dados frequentemente associadas à transferência de informações entre subsistemas de software distintos.

Para apoiar o treinamento de agentes autônomos, o lançamento inclui conjuntos de dados de geração de dados sintéticos (SDG). Esses recursos cobrem domínios críticos, como segurança em armazéns, direção autônoma e robótica geral. Ao fornecer simulações de alta fidelidade de cenários físicos de cauda longa, os conjuntos de dados ajudam os desenvolvedores a treinar modelos para lidar com eventos raros, porém perigosos, que são difíceis de capturar no mundo real. Benchmarks de desempenho indicam que o modelo ocupa atualmente o primeiro lugar tanto no VANTAGE-Bench quanto no Physics-IQ, validando sua capacidade de compreender leis físicas.

Impacto Estratégico no Desenvolvimento de IA Física

A decisão de lançar o NVIDIA Cosmos 3 sob uma licença aberta através da biblioteca Hugging Face Diffusers tem implicações significativas para o mercado competitivo de IA. Ao fornecer uma base pré-treinada para raciocínio físico, a NVIDIA está reduzindo a barreira de entrada para startups e instituições de pesquisa que desenvolvem robôs humanoides ou veículos autônomos. Este movimento posiciona a empresa como a principal fornecedora de infraestrutura para a próxima geração de IA incorporada, indo além do hardware puro para fornecer a lógica de software essencial que governa o movimento físico.

Para tomadores de decisão empresariais, a disponibilidade do NVIDIA Cosmos 3 oferece um caminho padronizado para a implantação de sistemas autônomos em ambientes industriais. A integração de múltiplas modalidades em uma única passagem direta reduz a complexidade da pilha de IA, potencialmente diminuindo a sobrecarga computacional necessária para tarefas robóticas sofisticadas. A partir de 2026-06-01, a colaboração entre NVIDIA e Hugging Face garante que essas ferramentas estejam acessíveis para integração imediata nos fluxos de trabalho de desenvolvedores existentes, acelerando a transição da IA digital para a automação física.

Embora nos esforcemos pela precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos responsabilidade por erros ou omissões.

Sources

How Cosmos 3 Helps Physical AI Think Before It Acts

Welcome NVIDIA Cosmos 3: The First Open Omni-model for Physical AI Reasoning and Action

✔Human Verified