Data sintética: el real valor de los datos puede sorprenderlos

Data sintética

Por Leandro Balboni, Head of Digital Acceleration | Healthcare & Insurance en Softtek

Son el nuevo petróleo. Son el corazón de los negocios. Su análisis es clave para saber orientar a la empresa. Todo eso se repite sin cesar cuando se habla de datos, pero ¿somos conscientes del valor que tienen? Probablemente no, pero no porque las compañías no conozcan qué tipo de información almacenan y qué importancia tiene, sino porque muchas veces no se piensa en las conexiones entre los datos y los insights que estos pueden relevar cuando se aplica Machine Learning para interpretarlos y encontrar patrones, tendencias y correlaciones, incluso cuando se pierdan algunos eslabones en la cadena. Entonces, acá empieza a deslizarse el concepto de data sintética.

Banner_frasco-suscripcion-800x250

Es importante reconocer que, por más expertise que tenga el analista de datos, se le pueden pasar por alto muchos patrones, ya que la amplitud que tiene la información hace por momentos inabarcable la tarea.

Entonces, la llegada de los algoritmos de Inteligencia Artificial (IA) al mundo de la analítica (y de la Big Data) ha dado lugar al surgimiento de una nueva tipología de datos: datos sintéticos o Synthetic Data. ¿De qué se trata? Son los datos conformados por información generada de forma artificial a través del procesamiento algorítmico que los sistemas de IA y Machine Learning llevan a cabo para simular eventos de la vida real.

¿Para qué sirven los datos sintéticos? ¿Por qué se crean? ¿Qué empresas ya están apelando a su utilización? Estos se vuelven necesarios cuando queremos dar un primer paso hacia las pruebas de concepto y pilotar soluciones que utilicen Machine Learning. Esto se da especialmente en lo relacionado con modelos predictivos, porque suele ser una barrera para encarar estas iniciativas ya que en muchos casos hay una falta de acceso a los datos para evaluar el potencial de adoptar estas soluciones.

Cambio de mindset

Si bien las organizaciones tienen en muchos casos suficiente información histórica, estos no están estructurados de la manera que se requiere, contienen “vacíos» o demasiado ruido y outliers, o se requiere mayor variedad y casuística, por lo cual en la mayoría de los casos se vuelve imprescindible complementarlos con cierto volumen de datos sintéticos.

Por ejemplo, en la industria de la salud, se utilizan cuando por confidencialidad o compliance regulatorio no es posible contar con los datos completos de los pacientes. O en la industria aseguradora, cuando es contrapartida al cálculo actuarial tradicional, se quieren diseñar futuros posibles y simulaciones, incluso ante un evento inesperado con baja probabilidad de ocurrencia pero con alto impacto, por lo que se vuelven necesarios estos modelos de datos sintéticos que permitir simular estos escenarios, como una forma de implementar “gemelos digitales».

En Softtek utilizamos datos sintéticos para crear entornos de prueba y simulaciones que permitan realizar testeos de concepto, para evaluar la adopción de modelos predictivos en casos de uso de interés para las diferentes industrias y verticales de negocio. Por ejemplo, para anticiparse a la fuga de clientes, prevenir el fraude, aumentar el cross-selling u optimizar el Customer LifeTime Value, entre otros.

Aún hay más. Este enfoque se relaciona con el concepto del Data Mesh, que tiene como premisa empoderar al negocio, que disponga de los datos, obtener nuevos insights para tomar decisiones. Es decir, donde realmente cobran valor y donde se materializa la transformación digital.

A su vez, se crea un marketplace de productos de datos, tanto intra organizacional como hacia el ecosistema externo. El negocio se hace dueño de los datos, los convierte en un activo sobre el cual tienen responsabilidad como área o unidad de negocios, debe asegurarse de que son confiables, obtener fuentes externas, crear e interpretar modelos usando el dominio del experto del negocio y convertirlo finalmente en ventaja competitiva y mayores ingresos.


Reciba las últimas noticias de la industria en su casilla:

Suscribirse ✉