NVIDIA presenta Nemotron-Labs Diffusion para la generación de texto en paralelo a alta velocidad
NVIDIA lanza Nemotron-Labs Diffusion, modelos que usan generación de tokens en paralelo para alcanzar 865 tokens/seg en hardware Blackwell B200.
NVIDIA lanza Nemotron-Labs Diffusion, modelos que usan generación de tokens en paralelo para alcanzar 865 tokens/seg en hardware Blackwell B200.
NVIDIA startet Nemotron-Labs Diffusion: Eine neue Modellfamilie mit paralleler Token-Generierung für bis zu 865 Token/Sekunde auf Blackwell B200 Hardware.
La ServiceNow-AWS partnership alcanza los 1.000M$ con nuevas herramientas de gobernanza de IA como AI Control Tower e integración con Amazon Bedrock.
NVIDIA launches Nemotron-Labs Diffusion, a new model family using parallel token generation to reach 865 tokens per second on Blackwell B200 hardware.
Die ServiceNow-AWS partnership erreicht 1 Mrd. $ Meilenstein mit neuen AI Governance-Tools wie AI Control Tower und Amazon Bedrock für Enterprise AI-Agenten.
The ServiceNow-AWS partnership hits a $1B milestone with new AI governance tools like AI Control Tower and Amazon Bedrock integration for enterprise AI agents.
Databricks lança automated prompt caching para LLMs open-source como Llama 3.1 e Gemma 3, reduzindo a latência em 3x e aumentando o throughput para empresas.
Databricks lancia l'automated prompt caching per LLM open-source come Llama 3.1, riducendo la latenza di 3 volte e aumentando il throughput per le aziende.
Databricks lance l'automated prompt caching pour LLM open-source (Llama 3.1, Gemma 3), réduisant la latence par 3 et boostant le débit pour les entreprises.
Databricks lanza automated prompt caching para LLMs como Llama 3.1 y Gemma 3, reduciendo la latencia 3 veces y aumentando el rendimiento para empresas.
Databricks führt automated prompt caching für Open-Source-LLMs wie Llama 3.1 ein, was die Latenz um das 3-fache senkt und den Durchsatz für Unternehmen erhöht.
Databricks launches automated prompt caching for open-source LLMs like Llama 3.1 and Gemma 3, reducing latency by 3x and increasing throughput for enterprises.
NVIDIA revela a arquitetura Vera Rubin na COMPUTEX 2026, com o sistema NVL72 para reduzir os custos de inferência de AI em 10x para modelos de trilhões de parâmetros.
Samsung TV Plus K-Pop series traz concertos mensais gratuitos de artistas da SM Entertainment, como AESPA e NCT, para Samsung Smart TVs e dispositivos Galaxy.
NVIDIA svela l'architettura Vera Rubin al COMPUTEX 2026: il sistema NVL72 riduce di 10 volte i costi di inferenza AI per modelli con trilioni di parametri.