Ciencia de datos, la capacidad de proveer valor

¿Cómo iniciar proyectos de ciencia de datos?

El impacto del uso de información en los negocios como mecanismo de medición del negocio es algo tan común que muy probablemente no nos imaginariamos vivir sin ella, desde cosas tan básicas como ¿Cuál es nuestra facturación actual? ¿Cuál es nuestro ticket de venta promedio? Hasta un poco más sofisticadas como: ¿Cuál es el tiempo promedio que nos toma realizar un cierre? ¿Cuál es nuestra proyección de crecimiento a 5 años?

La respuesta a estas preguntas describe un aspecto específico del negocio, ahora ante el éxito de organizaciones de avanzada en el uso de los datos no tan solo desde una perspectiva descriptiva, sino para predecir comportamientos o modelar perfiles de cliente tipo para sugerir el mejor conjunto de productos similares en un sitio de comercio electrónico, ha surgido un creciente interés por la mayoría de las organizaciones en “desenterrar” ese potencial valor que se encuentra en los datos que se generan en la organización, usando técnicas como aprendizaje de máquina (Machine Learning) o técnicas estadísticas.

Por lo tanto no es de sorprender que algunas compañías se han volcado a buscar en el mercado laboral Científicos de Datos sin saber, bien a bien ¿Qué son capaces de hacer? o ¿Qué problema de negocio resolverán?

Metrics, Metricser, Artículos, Ciencia de datos, datos

Con estos antecedentes, no es sorprendente los testimonios de empresas que amargamente comparten sus malas experiencias resultantes de experimentar con proyectos de ciencia de datos, empezando por el desconocimiento de la disciplina, el dejarse ir por los cantos de las sirenas de las promesas de los proveedores de tecnología (que siempre parecen tener la herramienta mágica que resolverá todo en cuestión de semanas), la desconexión de tecnología con negocios hasta los casos donde el área de ciencia de datos fue simplemente un “proyecto mascota” del director de tecnología.

Es por ello que como siempre, ante cualquier iniciativa, debe quedar de manifiesto el valor de negocio, los costos y los riesgos involucrados en la misma. Específicamente para el caso de proyectos de ciencia de datos, como su nombre lo dice, se debe de partir de un conjunto de hipótesis, las cuales siguiendo el método científico se comprobarán o desecharán según sea el caso.

Leer también:
Salvador Cienfuegos: un tema en común para EEUU y México

Metrics, Metricser, Artículos, Ciencia de datos, datos

Generalmente la hipótesis tiene una relación directa al caso de negocio. Por ejemplo: queremos aumentar el ticket promedio de nuestros clientes cuando compran en nuestra tienda en línea. Por lo que creemos que un mejor sistema de recomendaciones nos llevará a ese objetivo. En este caso nuestra hipótesis girará en torno a que si podemos clasificar a los clientes por los productos que compran y encontrar similitudes, podemos recomendar productos más afines para esos clientes.

Bajo este método en el proceso se realizarán diversos experimentos, para nuestro ejemplo podría ser crear esos grupos de clientes (clusters) por la “cadena” de compras que realizan o probablemente encontremos mejor resultados agrupando a los clientes no tanto por la secuencia de artículos que compran sino por los montos promedios de los mismos.

Todos estos experimentos implicarán tener acceso a datos reales y en un formato que sea fácil de procesar, esto último que puede parecer obvio en realidad suele ser en la práctica un camino lleno de espinas: quizás para tener acceso a toda la información requerida nos daremos cuenta que esta en realidad se encuentra en diferentes sistemas o fuentes de datos con diferentes permisos para accederlo (a veces incluso bajo el control de diferentes áreas) y con estructuras disímiles e incluso incompatibles.

Metrics, Metricser, Artículos, Ciencia de datos, datos

Esta realidad muchas veces es un cruel despertar para organizaciones que incursionan en este tipo de proyectos, más allá del glamour del término “ciencia de datos”: el tiempo que se invierte en acceder, limpiar y preparar la información representa para un proyecto típico ¡el 80% del tiempo total del proyecto!

Ante este panorama, cabe la pregunta: ¿Conviene realmente iniciar un proyecto de este tipo? La respuesta (como siempre) deriva en su posible impacto al negocio, la realidad que organizaciones que pasan por el proceso de aprendizaje y que focalizan sus esfuerzos en la generación de valor, en lugar del uso de la tecnología  o herramientas simplemente porque están de moda, encuentran que la recompensa puede no tan solo mejorar las ventas o aumentar el número de clientes sino la creación de productos nuevos, estrategias o líneas de productos incluso modificar su mismo modelo de negocio.Recordemos que hay ya toda una industria que debe su existencia a eso: la capacidad de explotar y proveer valor a partir de los datos.


Alberto Borbolla, es Director de Innovación y socio de Metrics.