NVIDIA envia as primeiras CPUs Vera para OpenAI e Anthropic para cargas de trabalho de agentic AI
NVIDIA começou a enviar sua primeira CPU customizada, Vera, para os principais laboratórios de inteligência artificial, incluindo OpenAI e Anthropic. Este lançamento de hardware representa uma mudança na arquitetura de data centers, afastando-se de processadores de uso geral em direção ao silício otimizado para cargas de trabalho de agentic AI. A CPU Vera foi projetada para gerenciar a complexa orquestração, chamadas de ferramentas e tarefas de aprendizado por reforço que frequentemente criam gargalos em ambientes de computação tradicionais.
O novo processador apresenta 88 núcleos Olympus customizados por socket e fornece 1.2 TB/s de largura de banda de memória. De acordo com a NVIDIA, a arquitetura entrega o dobro da eficiência energética da infraestrutura existente. Embora possa funcionar como uma unidade autônoma, o processador destina-se principalmente a servir como host para Rubin GPUs via interconexão NVLink-C2C. Os destinatários iniciais do hardware também incluem SpaceXAI e Oracle Cloud Infrastructure.
Otimizando a Infraestrutura para Agentic AI
A introdução da Vera CPU aborda as demandas computacionais específicas de agentes autônomos. Esses sistemas exigem análise de dados rápida e interação frequente com ferramentas de software externas, tarefas que diferem significativamente do processamento paralelo massivo lidado pelas GPUs. A NVIDIA relata que consultas de dados empresariais rodam até três vezes mais rápido na Vera em comparação com CPUs de servidor padrão, enquanto sandboxes de agentes veem um aumento de 50% no desempenho.
A implantação estratégica deste hardware já está escalando. A Oracle Cloud Infrastructure anunciou planos para integrar centenas de milhares de unidades Vera em seus data centers a partir de 2026. Essa adoção em larga escala sugere uma transição para clusters especializados onde a CPU não é mais um componente secundário, mas um motor especializado para lógica e gerenciamento de ferramentas.
A eficiência de custos continua sendo o principal impulsionador dessa mudança de hardware. Quando pareado com o sistema Vera Rubin NVL72, a NVIDIA afirma que os custos de inferência de agentic AI podem ser reduzidos a um décimo do preço por token. Ao descarregar tarefas de orquestração para um processador dedicado, os desenvolvedores de AI podem maximizar a utilização de seus clusters de GPU, potencialmente encurtando os ciclos de treinamento e implantação para modelos autônomos de próxima geração.
Embora busquemos a precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos responsabilidade por erros ou omissões.
Sources
Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs
NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic’
Related Articles
- NVIDIA Inicia Produção em Massa das GPUs Rubin R100 e CPUs Vera para IA de Próxima Geração
- Plataforma NVIDIA Vera Rubin impulsiona novos servidores Dell para reduzir custos de IA
- NVIDIA Lança Hardware DGX Spark enquanto Hermes Agent Atinge 140.000 Estrelas no GitHub
✔Human Verified