Benchmarks da NVIDIA Vera CPU Revelam Salto de 60% em Desempenho para Workloads de Agentic AI
NVIDIA revelou os primeiros dados públicos de desempenho para sua Vera CPU, um processador projetado para lidar com as demandas específicas de workloads de agentic AI dentro do data center moderno. De acordo com os resultados de benchmark divulgados esta semana, o novo chip entrega uma melhoria de desempenho de 1,6x em relação à geração anterior Grace CPU. Este aumento de velocidade é acompanhado por um subsistema de memória que manteve 90% de seu pico de largura de banda de 1,2 TB/s durante testes intensivos, resolvendo um gargalo crítico no gerenciamento de clusters de AI.
A Vera CPU é construída sobre a arquitetura Armv9.2 e apresenta 88 núcleos Olympus customizados. Com um thermal design power (TDP) de 450 watts, o processador foi projetado para tarefas de alta intensidade que suportam a infraestrutura de AI, como compilação de código e orquestração de dados. A NVIDIA afirmou que a mudança em direção a agentes de AI autônomos exige uma nova classe de CPU que possa sustentar alto desempenho em todos os núcleos ativos, fornecendo uma largura de banda de memória massiva para alimentar clusters de GPU famintos por dados.
Impacto Estratégico na Infraestrutura de AI
A introdução da Vera CPU representa uma mudança na forma como a NVIDIA posiciona seu silício para a "fábrica de AI". Enquanto as GPUs lidam com o trabalho pesado de treinamento e inferência de modelos, a CPU continua responsável pela lógica complexa de orquestrar fluxos de dados e gerenciar as pilhas de software que permitem o funcionamento dos agentes de AI. Ao atingir 1,2 TB/s em largura de banda de memória, a Vera CPU garante que a movimentação de dados não se torne um gargalo secundário à medida que o tamanho dos modelos e a complexidade agêntica crescem.
Para tomadores de decisão empresariais, o desempenho da Vera CPU destaca a crescente especialização da pilha de hardware. O salto geracional de 60% no desempenho sugere que organizações que estão escalando suas operações de AI podem precisar avaliar todo o seu tecido de computação, em vez de focar apenas na contagem de GPUs. A capacidade dos núcleos Olympus de manter a largura de banda próxima ao pico sob carga total é particularmente relevante para a orquestração de dados em tempo real, onde a latência pode degradar a responsividade de sistemas agênticos.
Este lançamento de hardware alinha-se a uma tendência mais ampla da indústria, onde chips de servidor de propósito geral estão sendo substituídos por silício especializado, adaptado para os requisitos de processamento de dados intensivo de machine learning. A NVIDIA confirmou que a Vera CPU é otimizada para o "encanamento" específico de clusters de AI, garantindo que a infraestrutura circundante possa acompanhar o ritmo da rápida evolução de modelos generativos e agentes de software autônomos.
Embora busquemos a precisão, o bytevyte pode cometer erros. Os usuários são aconselhados a verificar todas as informações de forma independente. Não aceitamos responsabilidade por erros ou omissões.
Sources
NVIDIA Vera CPU Is ‘Packing a Heavy-Hitting Punch’ Against Competition
Related Articles
- NVIDIA envia as primeiras CPUs Vera para OpenAI e Anthropic para cargas de trabalho de agentic AI
- NVIDIA Vera CPU é lançada como produto independente para alimentar a infraestrutura de agentes de IA
- NVIDIA Inicia Produção em Massa das GPUs Rubin R100 e CPUs Vera para IA de Próxima Geração
✔Human Verified