Por: André Chávez, gerente de Analítica de Datos y docente de posgrado
Cada vez las organizaciones se van convenciendo más de que la ciencia de datos (lo que se conoce como data science) no es una moda, sino una ventaja competitiva que adopta mayor relevancia en la actualidad y hacia el futuro de las empresas. Hasta me atrevería a decir que las empresas que no la usen ni la tomen como herramienta en su toma de decisiones podrían llegar a extinguirse debido a la poca o nula reacción frente a los consumidores cada vez más exigentes y proveedores cada vez más informados que hacen que el proceso productivo sea más sofisticado.
Saber cómo gestionar los datos, cómo apalancarse en tecnología y el correcto uso de herramientas de inteligencia artificial, les permite a las compañías manejar mejor sus recursos, ser más asertivos en sus decisiones, conocer cómo funciona realmente la estrategia llevada a ejecución, identificar cuellos de botella; y, sobre todo, adelantarse a la competencia. ¿Y si hablamos de predecir el futuro? Por supuesto que es posible.
Uno de los usos que se les puede dar a los datos con los que se cuenta en la compañía es la de pronosticar situaciones futuras. Es decir, crear modelos de pronóstico o soluciones que pueden entender comportamientos históricos, modelarlos o recrearlos mediante modelos matemáticos, estadísticos, biológicos o computacionales para conocer el futuro incierto, a través del estudio de sus tendencias, estacionalidades y ciclos.
¿Por qué hacerlo? Porque nos permite planear, preveer y prevenir. Esto resulta crucial en tiempos de tanta incertidumbre como los actuales. Los invito a reflexionar: si a las personas nos angustia nuestro futuro, imagínense a una empresa o corporación.
Un modelo de pronóstico está dentro de la tecnología de machine learning. Uno podría tender a creer que se trata de un proceso totalmente automatizado. Sin embargo, esto es un error. La participación humana (el factor humano) es esencial. A continuación, les explico el motivo.
Resumo en cinco los pasos para construir un modelo de pronóstico exitoso. En todos ellos, la intervención humana es determinante.
¿Cuál es la pregunta?
Primero, para construir un modelo de pronóstico, se necesita que entendamos cuál es la necesidad (el dolor) del área usuaria. Es decir, ¿para qué requerimos construir el modelo de pronóstico?, ¿qué información deseamos predecir?, ¿cuál es la necesidad puntual? Se usará para acciones en el corto o mediano plazo, requieren que sea un modelo más explicativo o preciso. En pocas palabras, debemos convertirnos en una suerte de “psicólogo de datos”.
Según mi experiencia, este primer paso es quizás el más importante. Porque de nada sirve construir un modelo de pronóstico que funcione a la perfección, si es que no va a resolver el problema que dio origen a la construcción de este.
Separar los datos
El segundo paso que se necesita para construir un modelo de pronóstico es el de identificar qué tipo de datos tenemos. Aquí es necesario conocer dónde están alojados los datos (en la nube, en un servidor propio de la empresa, en el computador de un compañero de trabajo); con qué frecuencia se generan estos datos; saber si se trata de datos propios o de terceros; entre otras características.
El tercer paso consiste en limpiar los datos. Es importante poder distinguir entre los datos relevantes para la necesidad que queremos atender, y aquellos datos que existen pero que no nos sirven para el caso puntual que estamos trabajando. Adicionalmente, si tenemos problemas en los datos como valores ausentes o perdidos, es imprescindible entender su origen y el mejor tratamiento a seguir para éstos.
Conocer a nuestro usuario
Una vez efectuados estos tres primeros pasos, podemos continuar con la creación propia del modelo; y, sobre todo, con la implementación del modelo creado. En la fase de implementación del modelo es sumamente importante conocer los usos y costumbres del área usuaria. Es decir, es necesario entender cómo el área usuaria del modelo de predicción podrá interactuar con él. Por tanto, aquí hay que tener en cuenta factores de UX y UI (la forma como el usuario lo usa y la forma como el usuario lo ve).
De nada sirve crear un modelo de pronóstico que dé las respuestas correctas a la pregunta correcta si el usuario no podrá aprovecharlo. Para terminar, resumo esto con lo siguiente: el mejor modelo es aquel que se usa y ha sido co-creado con el usuario final.