El lanzamiento de DeepSeek V4 introduce los modelos Pro de un billón de parámetros y Flash de alta velocidad
DeepSeek ha ampliado su cartera de inteligencia artificial con el lanzamiento de los DeepSeek V4 AI models, una nueva familia de modelos de lenguaje de gran tamaño diseñados para competir con sistemas de vanguardia como GPT-5. Anunciada esta semana, la línea incluye el DeepSeek-V4-Pro, un modelo masivo de 1,6 billones de parámetros, y el DeepSeek-V4-Flash, optimizado para una inferencia de alta velocidad. Estos lanzamientos representan un cambio significativo en el panorama competitivo, ofreciendo capacidades de alto rendimiento bajo una licencia de código abierto.
El buque insignia DeepSeek-V4-Pro utiliza una arquitectura Mixture-of-Experts (MoE), que cuenta con un total de 1,6 billones de parámetros, de los cuales 49 mil millones están activos durante cualquier inferencia individual. Las características técnicas clave incluyen:
- Ventana de contexto de 2 millones de tokens impulsada por Sparse Attention (DSA).
- Memoria condicional Engram para mejorar la retención de datos a largo plazo.
- Arquitectura mHC diseñada para minimizar las alucinaciones lógicas.
Impacto estratégico de los DeepSeek V4 AI models
Los datos de referencia publicados por la empresa muestran que los DeepSeek V4 AI models alcanzan una puntuación MMLU del 88,5% y una puntuación SWE-bench del 84%. Estas cifras sitúan al modelo Pro en competencia directa con los modelos propietarios de primer nivel de los laboratorios con sede en EE. UU. Al igualar o superar el rendimiento de sistemas como Claude 4 y GPT-5 en codificación y razonamiento matemático, DeepSeek se posiciona como una alternativa rentable para aplicaciones de IA de nivel empresarial.
Para los desarrolladores que requieren velocidad, la variante DeepSeek-V4-Flash ofrece una configuración de 284 mil millones de parámetros optimizada para una latencia inferior a 15 ms. DeepSeek confirmó que los precios de la API para el modelo Flash comienzan desde tan solo $0,40 por millón de tokens de entrada, un punto de precio significativamente más bajo que muchos líderes actuales del mercado. Esta agresiva estrategia de precios, combinada con la licencia Apache 2.0, permite una amplia adopción comercial y modificación.
La introducción de los DeepSeek V4 AI models subraya el ritmo acelerado del desarrollo de IA de código abierto. Al proporcionar un rendimiento de frontera con una ventana de contexto masiva y arquitecturas de memoria especializadas, la empresa está desafiando el dominio de los proveedores de código cerrado. Los responsables de la toma de decisiones pueden encontrar estos modelos particularmente atractivos para tareas de razonamiento de alto volumen donde la latencia y los costos operativos son factores críticos.
Si bien nos esforzamos por lograr la precisión, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.
Related Articles
- La ronda de financiación de DeepSeek apunta a una valoración de 10.000 millones de dólares
- Cloudflare y OpenAI lanzan Cloudflare Agent Cloud
- OpenAI presenta GPT-5.4-Cyber para reforzar las herramientas de seguridad defensiva
✔Human Verified