bytevyte
bytevyte
Language
ai-beats-pt

Dell e NVIDIA lançam AI Factory otimizada para agentic AI inference

inferência de IA de agentes

Dell Technologies e NVIDIA expandiram sua infraestrutura colaborativa de IA com o lançamento da Dell AI Factory, uma plataforma projetada especificamente para suportar a implantação de agentes autônomos em escala. O destaque deste anúncio é o servidor Dell PowerEdge XE9812, que integra a nova plataforma NVIDIA Vera Rubin NVL72. Esta combinação de hardware foi desenvolvida para lidar com a orquestração complexa e o gerenciamento de contexto longo exigidos pela agentic AI inference, um segmento crescente do mercado corporativo.

A Dell AI Factory visa reduzir as barreiras financeiras para a implantação de agentes de IA sofisticados. De acordo com dados divulgados pela NVIDIA esta semana, os novos sistemas proporcionam uma redução de até 10x no custo por token para agentic AI inference quando comparados às arquiteturas Blackwell anteriores. Esse ganho de eficiência é acompanhado por melhorias significativas de desempenho; sandboxes de agentes operam 50% mais rápido na plataforma Vera do que em CPUs x86 tradicionais, enquanto as consultas de dados corporativos apresentam um aumento de velocidade de 3x. Essas métricas sugerem uma mudança em direção ao hardware otimizado para a lógica específica e os padrões de chamada de ferramentas de sistemas autônomos.

Infraestrutura Estratégica para Agentic AI Inference

No coração do novo servidor está a NVIDIA Vera CPU, que apresenta 88 núcleos Olympus projetados sob medida. Este processador é a primeira CPU da NVIDIA construída especificamente para as tarefas de orquestração inerentes aos fluxos de trabalho de agentes. Com uma largura de banda de memória de 1,2 TB/s por socket, a Vera CPU resolve os gargalos de taxa de transferência de dados que frequentemente dificultam os agentes autônomos. As unidades iniciais da Vera CPU já foram entregues a grandes laboratórios de IA, incluindo OpenAI, Anthropic e SpaceXAI, bem como para a Oracle Cloud Infrastructure.

A parceria também introduz sistemas em escala de rack resfriados a líquido, capazes de suportar até 144 GPUs por rack. Esta configuração de alta densidade utiliza redes NVIDIA Quantum-X800 InfiniBand e Spectrum-6 Ethernet para manter a baixa latência necessária para interações de agentes em tempo real. Além do hardware, a colaboração se estende à integração de software e nuvem. Dell e NVIDIA estão trabalhando com o Google para trazer o Google Distributed Cloud (GDC) com Gemini 3.0 para o hardware Dell, permitindo que as empresas implantem modelos de fronteira dentro de seus próprios ambientes on-premises seguros.

A adoção corporativa dessas soluções integradas já é substancial, com mais de 5.000 organizações utilizando atualmente a infraestrutura Dell AI Factory. Empresas como Eli Lilly e Samsung estão entre os primeiros adotantes que aproveitam esses sistemas para cargas de trabalho de IA em larga escala. Ao fornecer uma pilha pré-integrada que combina o silício especializado da NVIDIA com o hardware corporativo da Dell, as duas empresas estão se posicionando como os principais fornecedores para a próxima fase da implantação de IA corporativa, onde o foco muda de chatbots simples para agentes autônomos capazes de executar processos de negócios complexos.

Embora nos esforcemos pela precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos responsabilidade por erros ou omissões.

Sources

NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic, Utterly Parabolic’

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs

✔Human Verified

Share