bytevyte
bytevyte
Language
ai-beats-pt

Plataforma NVIDIA Vera Rubin impulsiona novos servidores Dell para reduzir custos de IA

NVIDIA Vera Rubin

NVIDIA e Dell Technologies revelaram uma nova colaboração em infraestrutura de IA projetada para reduzir drasticamente os custos operacionais de execução de agentes autônomos. Anunciada esta semana no Dell Technologies World, a parceria centra-se no servidor Dell PowerEdge XE9812, que utiliza a plataforma NVIDIA Vera Rubin NVL72. Essa combinação de hardware visa reduzir o custo por token para inferência de IA em larga escala em até 10 vezes em comparação com arquiteturas anteriores, abordando uma grande barreira para a adoção de IA corporativa.

A arquitetura NVIDIA Vera Rubin introduz uma CPU dedicada projetada especificamente para cargas de trabalho de IA de agentes (agentic AI). De acordo com a NVIDIA, este processador executa essas tarefas complexas 50% mais rápido do que os sistemas tradicionais baseados em x86. Uma vantagem técnica fundamental é a largura de banda de memória de 1,2 TB/s, que é três vezes superior às soluções concorrentes. Essa alta largura de banda permite que o sistema lide com a rápida movimentação de dados necessária para que os agentes autônomos funcionem de forma eficaz em ambientes de produção.

Impacto Estratégico da Plataforma NVIDIA Vera Rubin

A transição de pilotos experimentais de IA para a produção em escala total exige uma redução significativa nas despesas de computação. Dell e NVIDIA estão visando essa transição ao oferecer soluções on-premises que competem diretamente com provedores de nuvem pública. A Dell afirmou que as empresas que implantam esses sistemas localmente podem atingir o ponto de equilíbrio em relação aos custos de API na nuvem em apenas três meses. Esse incentivo financeiro é acompanhado pelo lançamento do PowerRack, um sistema totalmente integrado que combina computação, rede e armazenamento em uma única solução em escala de rack.

Para suportar o calor intenso gerado por esses sistemas de alto desempenho, a Dell introduziu a PowerCool CDU C7000. Esta unidade de resfriamento montada em rack oferece mais de 220kW de capacidade e é a primeira de seu tipo construída especificamente para a NVIDIA Vera Rubin NVL72. Esses avanços no gerenciamento térmico são necessários para manter os níveis de desempenho exigidos para modelos de fronteira como Gemini 3 e Grok, que as empresas estão trabalhando para trazer para o ambiente local por meio de parcerias estratégicas com o Google e SpaceXAI.

As remessas iniciais das unidades equipadas com Vera já chegaram aos principais players do setor, incluindo OpenAI, Anthropic, Oracle e SpaceXAI. Para necessidades de menor escala, a Dell também está lançando as estações de trabalho Deskside Agentic AI. Elas permitem que as empresas executem agentes autônomos localmente, garantindo a soberania dos dados e mantendo os benefícios de desempenho da nova arquitetura. À medida que a demanda por computação de IA continua a crescer, essa abordagem de hardware integrado oferece um caminho claro para que as organizações escalem suas operações de IA enquanto controlam os custos de longo prazo.

Embora busquemos a precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos responsabilidade por erros ou omissões.

Sources

NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’

Dell Technologies Closes the Gap Between AI Ambition and AI Outcomes

✔Human Verified

Share