Los benchmarks de NVIDIA Vera CPU revelan un salto de rendimiento del 60% para cargas de trabajo de IA agéntica
NVIDIA ha revelado los primeros datos públicos de rendimiento de su Vera CPU, un procesador diseñado para manejar las demandas específicas de las cargas de trabajo de IA agéntica dentro del centro de datos moderno. Según los resultados de los benchmarks publicados esta semana, el nuevo chip ofrece una mejora de rendimiento de 1,6 veces respecto a la generación anterior, Grace CPU. Este aumento de velocidad se combina con un subsistema de memoria que mantuvo el 90% de su ancho de banda máximo de 1,2 TB/s durante pruebas intensivas, abordando un cuello de botella crítico en la gestión de clústeres de IA.
La Vera CPU está construida sobre la arquitectura Armv9.2 y cuenta con 88 núcleos Olympus personalizados. Con una potencia de diseño térmico (TDP) de 450 vatios, el procesador está diseñado para tareas de alta intensidad que soportan la infraestructura de IA, como la compilación de código y la orquestación de datos. NVIDIA afirmó que el cambio hacia agentes de IA autónomos requiere una nueva clase de CPU que pueda mantener un alto rendimiento en todos los núcleos activos, proporcionando al mismo tiempo un ancho de banda de memoria masivo para alimentar a los hambrientos clústeres de GPU.
Impacto estratégico en la infraestructura de IA
La introducción de la Vera CPU supone un cambio en la forma en que NVIDIA posiciona su silicio para la "fábrica de IA". Mientras que las GPU se encargan del trabajo pesado del entrenamiento e inferencia de modelos, la CPU sigue siendo responsable de la lógica compleja de orquestar los flujos de datos y gestionar las pilas de software que permiten el funcionamiento de los agentes de IA. Al alcanzar 1,2 TB/s de ancho de banda de memoria, la Vera CPU garantiza que el movimiento de datos no se convierta en un cuello de botella secundario a medida que crecen el tamaño de los modelos y la complejidad agéntica.
Para los responsables de la toma de decisiones en las empresas, el rendimiento de la Vera CPU subraya la creciente especialización de la pila de hardware. El salto generacional del 60% en el rendimiento sugiere que las organizaciones que escalan sus operaciones de IA podrían necesitar evaluar todo su tejido de computación en lugar de centrarse únicamente en el número de GPU. La capacidad de los núcleos Olympus para mantener un ancho de banda cercano al máximo bajo carga completa es particularmente relevante para la orquestación de datos en tiempo real, donde la latencia puede degradar la capacidad de respuesta de los sistemas agénticos.
Este lanzamiento de hardware se alinea con una tendencia más amplia de la industria en la que los chips de servidor de propósito general están siendo reemplazados por silicio especializado adaptado a los requisitos de uso intensivo de datos del aprendizaje automático. NVIDIA confirmó que la Vera CPU está optimizada para la "fontanería" específica de los clústeres de IA, asegurando que la infraestructura circundante pueda seguir el ritmo de la rápida evolución de los modelos generativos y los agentes de software autónomos.
Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.
Sources
NVIDIA Vera CPU Is ‘Packing a Heavy-Hitting Punch’ Against Competition
Related Articles
- NVIDIA envía las primeras CPU Vera a OpenAI y Anthropic para cargas de trabajo de agentic AI
- NVIDIA presenta la arquitectura Vera Rubin para reducir drásticamente los costes de inferencia de IA
- NVIDIA comienza la producción en masa de las GPU Rubin R100 y las CPU Vera para la IA de próxima generación
✔Human Verified