bytevyte
bytevyte
Language
ai-beats-es

Dell y NVIDIA lanzan AI Factory optimizada para agentic AI inference

inferencia de IA de agentes

Dell Technologies y NVIDIA han ampliado su infraestructura colaborativa de IA con el lanzamiento de Dell AI Factory, una plataforma diseñada específicamente para soportar el despliegue de agentes autónomos a escala. La pieza central de este anuncio es el servidor Dell PowerEdge XE9812, que integra la nueva plataforma NVIDIA Vera Rubin NVL72. Esta combinación de hardware está diseñada para manejar la compleja orquestación y la gestión de contextos largos requerida para la agentic AI inference, un segmento creciente del mercado empresarial.

La Dell AI Factory tiene como objetivo reducir las barreras financieras para el despliegue de agentes de IA sofisticados. Según los datos publicados por NVIDIA esta semana, los nuevos sistemas proporcionan una reducción de hasta 10 veces en el coste por token para agentic AI inference en comparación con las arquitecturas anteriores basadas en Blackwell. Esta ganancia de eficiencia se combina con mejoras significativas de rendimiento; los sandboxes de agentes operan un 50% más rápido en la plataforma Vera que en las CPUs x86 tradicionales, mientras que las consultas de datos empresariales experimentan un aumento de velocidad de 3 veces. Estas métricas sugieren un cambio hacia un hardware optimizado para la lógica específica y los patrones de llamada a herramientas de los sistemas autónomos.

Infraestructura estratégica para agentic AI inference

En el corazón del nuevo servidor se encuentra la NVIDIA Vera CPU, que cuenta con 88 núcleos Olympus diseñados a medida. Este procesador es la primera CPU de NVIDIA construida específicamente para las tareas de orquestación inherentes a los flujos de trabajo de agentes. Con un ancho de banda de memoria de 1,2 TB/s por socket, la Vera CPU aborda los cuellos de botella en el rendimiento de datos que a menudo obstaculizan a los agentes autónomos. Las unidades iniciales de la Vera CPU ya han sido entregadas a los principales laboratorios de IA, incluidos OpenAI, Anthropic y SpaceXAI, así como a Oracle Cloud Infrastructure.

La asociación también introduce sistemas a escala de rack refrigerados por líquido capaces de soportar hasta 144 GPUs por rack. Esta configuración de alta densidad utiliza redes NVIDIA Quantum-X800 InfiniBand y Spectrum-6 Ethernet para mantener la baja latencia requerida para las interacciones de agentes en tiempo real. Más allá del hardware, la colaboración se extiende al software y la integración en la nube. Dell y NVIDIA están trabajando con Google para llevar Google Distributed Cloud (GDC) con Gemini 3.0 al hardware de Dell, permitiendo a las empresas desplegar modelos de frontera dentro de sus propios entornos locales seguros.

La adopción empresarial de estas soluciones integradas ya es sustancial, con más de 5.000 organizaciones utilizando actualmente la infraestructura de Dell AI Factory. Empresas como Eli Lilly y Samsung se encuentran entre los primeros adoptantes que aprovechan estos sistemas para cargas de trabajo de IA a gran escala. Al proporcionar un stack pre-integrado que combina el silicio especializado de NVIDIA con el hardware empresarial de Dell, las dos compañías se posicionan como los principales proveedores para la próxima fase del despliegue de IA corporativa, donde el enfoque pasa de simples chatbots a agentes autónomos capaces de ejecutar procesos de negocio complejos.

Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.

Sources

NVIDIA CEO Jensen Huang at Dell Technologies World: ‘Demand Is Going Parabolic, Utterly Parabolic’

Vera Arrives: NVIDIA’s First CPU Built for Agents Lands at Top AI Labs

✔Human Verified

Share