Plataforma NVIDIA Vera Rubin impulsiona novos servidores Dell para reduzir custos de IA
NVIDIA e Dell Technologies revelaram uma nova colaboração em infraestrutura de IA projetada para reduzir drasticamente os custos operacionais de execução de agentes autônomos. Anunciada esta semana no Dell Technologies World, a parceria centra-se no servidor Dell PowerEdge XE9812, que utiliza a plataforma NVIDIA Vera Rubin NVL72. Essa combinação de hardware visa reduzir o custo por token para inferência de IA em larga escala em até 10 vezes em comparação com arquiteturas anteriores, abordando uma grande barreira para a adoção de IA corporativa.
A arquitetura NVIDIA Vera Rubin introduz uma CPU dedicada projetada especificamente para cargas de trabalho de IA de agentes (agentic AI). De acordo com a NVIDIA, este processador executa essas tarefas complexas 50% mais rápido do que os sistemas tradicionais baseados em x86. Uma vantagem técnica fundamental é a largura de banda de memória de 1,2 TB/s, que é três vezes superior às soluções concorrentes. Essa alta largura de banda permite que o sistema lide com a rápida movimentação de dados necessária para que os agentes autônomos funcionem de forma eficaz em ambientes de produção.
Impacto Estratégico da Plataforma NVIDIA Vera Rubin
A transição de pilotos experimentais de IA para a produção em escala total exige uma redução significativa nas despesas de computação. Dell e NVIDIA estão visando essa transição ao oferecer soluções on-premises que competem diretamente com provedores de nuvem pública. A Dell afirmou que as empresas que implantam esses sistemas localmente podem atingir o ponto de equilíbrio em relação aos custos de API na nuvem em apenas três meses. Esse incentivo financeiro é acompanhado pelo lançamento do PowerRack, um sistema totalmente integrado que combina computação, rede e armazenamento em uma única solução em escala de rack.
Para suportar o calor intenso gerado por esses sistemas de alto desempenho, a Dell introduziu a PowerCool CDU C7000. Esta unidade de resfriamento montada em rack oferece mais de 220kW de capacidade e é a primeira de seu tipo construída especificamente para a NVIDIA Vera Rubin NVL72. Esses avanços no gerenciamento térmico são necessários para manter os níveis de desempenho exigidos para modelos de fronteira como Gemini 3 e Grok, que as empresas estão trabalhando para trazer para o ambiente local por meio de parcerias estratégicas com o Google e SpaceXAI.
As remessas iniciais das unidades equipadas com Vera já chegaram aos principais players do setor, incluindo OpenAI, Anthropic, Oracle e SpaceXAI. Para necessidades de menor escala, a Dell também está lançando as estações de trabalho Deskside Agentic AI. Elas permitem que as empresas executem agentes autônomos localmente, garantindo a soberania dos dados e mantendo os benefícios de desempenho da nova arquitetura. À medida que a demanda por computação de IA continua a crescer, essa abordagem de hardware integrado oferece um caminho claro para que as organizações escalem suas operações de IA enquanto controlam os custos de longo prazo.
Embora busquemos a precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos responsabilidade por erros ou omissões.
Sources
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Dell Technologies Closes the Gap Between AI Ambition and AI Outcomes
Related Articles
- NVIDIA e Ineffable Intelligence se unem para avançar na infraestrutura de Reinforcement Learning
- NVIDIA Inicia Produção em Massa das GPUs Rubin R100 e CPUs Vera para IA de Próxima Geração
- Dell e Kioxia Revelam Servidor de AI Flash Storage de 9,8 PB para Massive Data Lakes
✔Human Verified