NVIDIA lleva Nemotron 3 Ultra a AWS para potenciar agentes a

NVIDIA ha lanzado Nemotron 3 Ultra en Amazon SageMaker JumpStart, introduciendo un modelo de alta eficiencia diseñado específicamente para agentes autónomos de larga duración y razonamiento complejo. Este lanzamiento, anunciado esta semana, representa un cambio significativo hacia la IA agéntica al ofrecer un modelo de 550 mil millones de parámetros que mantiene los costes operativos de sistemas mucho más pequeños. La plataforma admite una longitud de contexto masiva de 1 millón de tokens, lo que permite a las empresas procesar vastos conjuntos de datos dentro de una única ventana de razonamiento.

El modelo Nemotron 3 Ultra utiliza una arquitectura híbrida que equilibra 550 mil millones de parámetros totales con 55 mil millones de parámetros activos. Este diseño permite que el sistema logre una inferencia 5 veces más rápida para cargas de trabajo agénticas, al tiempo que reduce los costes de alojamiento en un 30% en comparación con los modelos densos tradicionales. Al optimizar para el formato NVFP4, NVIDIA y AWS han simplificado el proceso de despliegue para empresas que requieren capacidades de razonamiento de múltiples pasos y alto rendimiento sin la sobrecarga de hardware típica de los LLM a gran escala.

Impacto estratégico de la eficiencia en la IA agéntica

Para los responsables de la toma de decisiones, la llegada de Nemotron 3 Ultra a Amazon SageMaker JumpStart aborda la principal barrera para el despliegue de agentes autónomos: la relación coste-rendimiento. Los modelos densos estándar suelen volverse prohibitivamente caros cuando se les asigna el procesamiento continuo e iterativo que requieren los agentes autónomos. El enfoque híbrido de NVIDIA mitiga esto activando solo una fracción de los parámetros totales para cada tarea, garantizando que el razonamiento complejo no provoque aumentos exponenciales en el gasto de computación.

Junto con las mejoras de rendimiento, NVIDIA está abordando el aspecto de la gobernanza de la IA empresarial con el lanzamiento de Nemotron 3.5 Content Safety. Este modelo de 4 mil millones de parámetros, basado en Google Gemma 3, proporciona filtrado de seguridad multimodal y multilingüe en 12 idiomas. Una característica clave es el modo THINK, que ofrece un razonamiento auditable paso a paso para los veredictos de seguridad. Esta transparencia permite a las organizaciones aplicar políticas de seguridad personalizadas que se ajusten a requisitos corporativos o regulatorios específicos, en lugar de depender de filtros de seguridad de caja negra.

La integración de estos modelos en el ecosistema de AWS simplifica el camino desde el desarrollo hasta la producción. Con el despliegue en un solo clic ahora disponible, las empresas pueden integrar protocolos de seguridad avanzados y razonamiento de alta eficiencia en sus flujos de trabajo en la nube existentes. A medida que las empresas pasan de simples chatbots a sofisticados agentes autónomos, la combinación de inferencia de alta velocidad y marcos de seguridad auditables probablemente se convertirá en el estándar para las aplicaciones de IA de grado de producción.

Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.

Sources

NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart

Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI

✔Human Verified

Impacto estratégico de la eficiencia en la IA agéntica

Sources

Related Articles