bytevyte
bytevyte
Language
ai-beats-es

Databricks lanza Sketch Functions para agilizar la estimación de datos a gran escala

sketch functions

Databricks ha presentado una nueva suite de sketch functions diseñada para proporcionar respuestas rápidas y aproximadas para conjuntos de datos de varios petabytes. Estas estructuras de datos probabilísticas permiten a los equipos de datos evitar la alta latencia típicamente asociada con los cálculos exactos en almacenes de información masivos. Al integrar estas herramientas directamente en Databricks SQL y Spark, la compañía busca facilitar un análisis exploratorio más rápido donde una estimación casi perfecta es suficiente para la toma de decisiones operativas.

La implementación de sketch functions aborda un cuello de botella común en entornos de big data: el tiempo requerido para escanear cada fila de un conjunto de datos para obtener métricas precisas. Databricks declaró esta semana que estas funciones pueden reducir la latencia de las consultas hasta en un 90%. Esta ganancia de rendimiento se logra mediante el uso de algoritmos matemáticos como HyperLogLog para recuentos distintos, count-min sketches para la estimación de frecuencia y t-digests para cuantiles. Estos métodos proporcionan resultados de alta fidelidad que normalmente mantienen una tasa de precisión del 99% mientras consumen significativamente menos recursos computacionales.

Impacto estratégico de las Sketch Functions en la analítica empresarial

Para los líderes técnicos y estrategas, la llegada de estas herramientas representa un cambio hacia arquitecturas de datos más eficientes. Mientras que los gigantes a escala web han utilizado durante mucho tiempo estructuras probabilísticas personalizadas, Databricks ahora está haciendo que estas capacidades sean accesibles para una gama más amplia de empresas. La integración con Unity Catalog garantiza que estos resultados aproximados permanezcan gobernados y seguros, permitiendo a las organizaciones gestionar cómo y dónde se utilizan las estimaciones en sus unidades de negocio.

El caso de uso principal para esta tecnología se encuentra en los dashboards y la exploración inicial de datos. En lugar de esperar minutos a que una consulta devuelva un recuento exacto de usuarios únicos a lo largo de una década de registros, una consulta de sketch functions puede proporcionar una cifra casi idéntica en segundos. Esta velocidad permite a los analistas iterar más rápidamente e identificar tendencias sin la sobrecarga de un procesamiento exhaustivo. A partir de abril de 2026, estas funciones están disponibles para ayudar a los equipos a equilibrar la relación entre la precisión absoluta y la velocidad de obtención de información.

Aunque nos esforzamos por la exactitud, bytevyte puede cometer errores. Se aconseja a los usuarios verificar toda la información de forma independiente. No aceptamos ninguna responsabilidad por errores u omisiones.

✔Human Verified

Share