Qué es Databricks y por qué Amazon, Google y Microsoft han invertido mil millones de dólares en ella

Pablo Rodríguez

Los números que maneja Databricks son mareantes. La empresa con sede en San Francisco, y dedicada al análisis de datos y la inteligencia artificial, acaba de levantar una ronda de financiación de mil millones de dólares, lo que ha elevadoel valor global de la compañía a 28 mil millones de dólaresy la convierte en una de las tecnológicas más valiosas de los Estados Unidos.

Estas cifras son aún más significativas se si indaga en la lista de los inversores que ha compartido la compañíaen un comunicado. Entre ellos aparecen Amazon Web Services (AWS), Capital G -la firma de capital de riesgo de Google-, Microsoft o Salesforces, entre otras. La desarrolladora de Windows, de hecho, ya había participado en rondas anteriores,y tanto su servicio en la nube, Azure, como AWS incluyen desde hace algún tiempo la herramienta de análisis de datos de Databricksentre sus servicios.

Yen la nube está, precisamente, la clave de que los tres gigantes tecnológicos hayan invertido sumas considerables en Databricks. Los servicios cloudhan experimentado un crecimiento extraordinarioen los últimos meses: la pandemia ha acelerado la digitalización de casi todos los sectores económicos y ha aumentado enormemente el gasto de las empresas en servicios en la nube. Entre ellos, el análisis de datos.

Con este movimiento,Amazon, Google y Microsoft se aseguran la presencia en una de las empresas con mayor crecimiento en los últimos años-fue fundada en 2013- en el sector en Estados Unidos y amplían los segmentos cloud en los que participan.

Análisis más rápidos y baratos

El rápido crecimiento que ha experimentado Databricks se debe a la efectividad de su herramienta paraprocesar ingentes cantidades de datos muy diversos y en formatos diferentes.

La plataforma de esta empresa actúa sobre los llamadosdata lakes(lagos de datos), repositorios en el que empresas y grandes organizaciones almacenan cantidades masivas de información diversa, sin procesar y en su formato original. Estos entornos son adecuados para almacenar esos datos, perosu falta de estructuración hace que sea difícil, o caro, analizarlos con eficacia.

Los lagos de datos son útiles porque las empresas cada vez recopilan más información de fuentes diferentes y con diversos formatos, velocidad y volumen. Pero, a la hora de tratarlos, el proceso es lento, complejo y costoso, aseguran desde Databricks. Con anterioridad a losdata lakesse usaban los almacenes de datos, queeran efectivos para tratar datos estructurados pero mostraban carencias para procesar información no estructurada.

La plataforma de Databricks unifica las ventajas de ambos sistemas con una nueva estructura desarrollada por ellos y que han bautizado como casa del lago olake house. De acuerdo con los californianos, su herramienta tiene la capacidad dealmacenar enormes cantidades de datos no estructurados y permite gestionarlos y procesarlos con la efectividadde los almacenes de datos manteniendo el bajo coste de los lagos de datos.

“La combinación de lagos de datos y almacenes de datos en un solo sistema significa que los equipos de datos pueden moverse más rápido, ya que pueden usar los datos sin necesidad de acceder a varios sistemas”, afirman desde la compañía.