NVIDIA presenta la arquitectura Vera Rubin para reducir drásticamente los costes de inferencia de IA
NVIDIA ha presentado la Vera Rubin architecture, una plataforma de computación de próxima generación diseñada para potenciar las cargas de trabajo de inteligencia artificial más exigentes. Anunciado antes de la conferencia COMPUTEX 2026 en Taipéi, el nuevo sistema está diseñado para manejar modelos de billones de parámetros, reduciendo significativamente los costes operativos asociados con la inferencia a gran escala.
La pieza central de este anuncio es el Vera Rubin NVL72, un sistema de rack refrigerado por líquido que integra 36 Vera CPUs y 72 Rubin GPUs. Esta configuración de hardware está diseñada para abordar los masivos requisitos de cómputo de los modelos de IA de vanguardia. NVIDIA afirmó que la arquitectura logra una reducción de diez veces en los costes de inferencia por token, una métrica que impacta directamente en la viabilidad comercial del despliegue de sistemas masivos de IA generativa a escala.
Robótica avanzada y sistemas autónomos
Más allá de la infraestructura de centros de datos, la compañía amplió su alcance hacia la IA física con el debut de Jetson Thor. Esta nueva plataforma de robótica ofrece 2.070 teraflops FP4 de rendimiento, proporcionando el procesamiento de alta velocidad necesario para el razonamiento e interacción robótica compleja. La plataforma está destinada a cerrar la brecha entre la inteligencia digital y el movimiento físico en entornos industriales y comerciales.
La compañía también lanzó Alpamayo, una plataforma abierta específicamente para el desarrollo de vehículos autónomos. Alpamayo utiliza modelos de visión-lenguaje con 10.000 millones de parámetros para mejorar las capacidades de razonamiento de los sistemas de conducción autónoma. Al proporcionar un marco abierto, NVIDIA pretende acelerar el despliegue de vehículos que puedan comprender y reaccionar mejor a entornos de conducción complejos mediante un contexto lingüístico y visual avanzado.
Implicaciones estratégicas de la Vera Rubin architecture
La introducción de la arquitectura Vera Rubin señala un cambio hacia un hardware más eficiente y especializado para la era post-entrenamiento de la IA. A medida que las empresas pasan del entrenamiento inicial del modelo al despliegue de alto volumen, la reducción de costes de 10 veces que ofrece el sistema NVL72 proporciona un camino claro para escalar servicios sin aumentos proporcionales en el gasto de energía o hardware. El enfoque en la refrigeración líquida también refleja la creciente necesidad de una gestión térmica avanzada en centros de datos de alta densidad.
El CEO de NVIDIA, Jensen Huang, tiene programado ofrecer un discurso de apertura el 1 de junio de 2026, donde se esperan más detalles sobre el despliegue de estas tecnologías. El impulso simultáneo en robótica y conducción autónoma sugiere una estrategia para dominar todo el ciclo de vida de la IA, desde las fábricas basadas en la nube donde nacen los modelos hasta los dispositivos de borde donde interactúan con el mundo físico.
Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.
Sources
NVIDIA GTC Taipei at COMPUTEX: Live Updates on What’s Next in AI
Related Articles
- Los ingresos de NVIDIA se disparan a 81.600 millones de dólares mientras la nueva arquitectura Vera Rubin NVL72 apunta a la eficiencia de la IA agéntica
- La plataforma NVIDIA Vera Rubin impulsa los nuevos servidores Dell para reducir drásticamente los costes de IA
- NVIDIA e Ineffable Intelligence se asocian para avanzar en la infraestructura de Reinforcement Learning
✔Human Verified