¿Ciencia de Datos? Vamos a explicarlo con un jugoso ejemplo.
En una tarde calurosa decides prepararte un zumo de naranja. Vas a la cocina, cortas las frutas y las exprimes una a una.
Estas naranjas posiblemente tengan variedad de tamaños, algunas grandes, otras chicas; diferentes colores, unas verdes, otras amarillas; y hasta distintos sabores, unas amargas y otras dulces. Inclusive, algunas naranjas grandes tendrán poco jugo y otras pequeñas tendrán mucho.
Pero luego de exprimir cierta cantidad de naranjas tendrás zumo suficiente para llenar tu vaso. Puedes ponerle azúcar, hielo o puedes guardarlo y usarlo para un receta de cocina. También puedes combinarlo con otras frutas o vegetales, como fresa o zanahoria.
¡En tu empresa también tienes naranjas para sacarles el jugo! Sí, como lees.
Quizás tienes una base de datos pequeña o una con millones de clientes. Estos datos son nuestras naranjas. El jugo que obtenemos es la información que nos ayudará en la toma de decisiones. Cada naranja tiene características particulares y de cada una puedes sacar tanto jugo como ésta tenga. Mientras más naranjas buenas combines, más información de valor es posible obtener.
Datos = Naranja
Ciertamente, alguna de las naranjas podría estar dañada y arruinaría nuestro zumo.
De igual forma pasa con los datos y la información obtenida, en cuyo caso llegaríamos a las conclusiones erróneas. Por eso es vital asegurarse que cada naranja tenga buen color y buen sabor, y sino cumple con excelente calidad debemos descartarla.
Por ejemplo, si nuestra base de datos sobre el género de clientes no es confiable y la cruzamos con nuestra base de datos, podríamos terminar dirigiendo promociones al género totalmente errado.
Ahora bien, cuando de zumo se trata conocemos en detalle nuestros propios gustos: ¡Un jugo de naranja y fresa con hielo y azúcar, por favor!
De igual forma al aplicar la Ciencia de Datos debemos estar claros de nuestro objetivo para obtener el resultado que deseamos. Por ejemplo estas podrían ser algunos de las preguntas que podríamos contestar usando Ciencia de Datos.
- ¿Qué características diferencian a los usuarios que invierten más de los que invierten menos? ¿Frecuencia y cantidad de compras?
- ¿En cuántos grupos se dividen nuestros clientes y cuáles son las características de estos grupos? ¿Padres solteros de más de 40 años de edad que les gusta el fútbol o familias con hijos que disfrutan vacaciones juntos?
- ¿Qué productos compran juntos mis usuarios? ¿Los pañales y las cervezas se llevan juntos? El famoso caso target.
Toda esta información sirve de base para plantear nuestra estrategia de mercadeo. En los ejemplos mencionados podríamos usar email marketing para estar en contacto con nuestros usuarios más rentables, crear anuncios con el objetivos de atraer nuevos clientes con un target específico, hacer ventas cruzada o up-selling en nuestra tienda en linea a segmentos de usuarios específicos.
El último punto vital es el proceso de la aplicación de Ciencia de Datos... o en la extracción del jugo (Sí, seguimos con las naranjas). Quizás la máquina de exprimir no tenga la suficiente fuerza, esté en malas condiciones o no es adecuada para procesar nuestro zumo. Quizás necesitamos extraer el jugo de 5.000 naranjas y combinarlas con coco, con lo que la mayoría de las máquinas simplemente fallarían. En este caso, no seriamos capaces de procesar la informacion o hacerlo de forma muy tardía para tomar decisiones.
Para obtener calidad, lo esencial es:
- Asegurarse que los ingredientes sean de calidad.
- Tener claro qué zumo deseas.
- Asegurar la calidad del proceso de extracción de jugo.
Como te habrás dado cuenta, las naranjas de este post son una analogía y la terminología usada peca por ser general. La Ciencia de Datos es mucho más que combinar y procesar los datos para obtener información. Abarca muchos otros procesos como limpieza de datos, crear y validar modelos predictivos y usarlos en producción. Pero eso lo tocaremos en otros artículos.
Seguramente cuentas con naranjas de calidad en tu empresa y, por más pequeñas que sean, hay forma de sacarles mucho jugo. ¡A aprovechar la Ciencia de Datos!