AnalíticaPredictiva, EstrategiaFinanciera

"Optimiza tus estrategias financieras gracias a la analítica predictiva"

En un mundo donde los datos son el nuevo petróleo, la analítica predictiva surge como una herramienta imprescindible para tomar decisiones más informadas y efectivas. Pero ¿qué es exactamente la analítica predictiva y cómo puede transformar tus estrategias de negocio?

¿Qué es la analítica predictiva?

La analítica predictiva es el proceso de predecir eventos futuros a partir de datos históricos, utilizando algoritmos estadísticos y técnicas de machine learning. En el contexto financiero, implica analizar patrones de datos para anticipar tendencias, riesgos y oportunidades.

Caso de éxito en el uso de analítica predictiva

Las empresas y organizaciones se apoyan en la analítica predictiva para optimizar sus decisiones, reduciendo los riesgos y mejorando la rentabilidad. Un uso frecuente es la optimización de campañas de marketing. Implementando estrategias más efectivas y personalizadas, las empresas pueden dirigirse solo a los clientes con mayor probabilidad de contratar un producto o aceptar una oferta. La hipótesis se centra en que, al identificar y enfocarse en los clientes más propensos, se logra maximizar el retorno de inversión y optimizar los recursos de marketing.

Escenario desarrollado en el Laboratorio de Arena Tech

Para demostrar el poder de la analítica predictiva, en el Laboratorio de Arena Tech se desarrolló un escenario utilizando un modelo de machine learning (ML) con el objetivo de predecir la propensión de los usuarios a contratar un producto.

Metodología

La metodología empleada se basa en los árboles de decisión, que se usan para tomar decisiones basadas en reglas derivadas de los datos. Cada nodo del árbol representa una pregunta, cada rama el resultado de la pregunta y cada hoja final una decisión o una clasificación.

Por ejemplo, en un árbol de decisión simple para predecir si un cliente comprará un producto, el primer nodo podría dividir a los clientes en función del tiempo que pasan en el sitio web. Si el tiempo es mayor a 2 minutos, la probabilidad de compra podría aumentar, mientras que, si es menor, la probabilidad podría disminuir.

En la práctica, un solo árbol no es lo suficientemente robusto, por lo que se utilizan modelos de conjunto de árboles. Entre estos, destacan los modelos de gradient boosting, como XGBoost (Extreme Gradient Boosting). En este enfoque, se entrena una secuencia de árboles de decisión, donde cada uno busca corregir los errores del anterior mediante un proceso llamado boosting. Cada árbol se enfoca en los errores residuales del conjunto anterior, refinando así la predicción en cada paso. Además, los árboles se ponderan según su capacidad para mejorar la precisión general del modelo, lo que significa que los más efectivos tienen mayor influencia en la predicción final.

El ensamble combina estas predicciones ponderadas para producir una predicción final más precisa y robusta, aprovechando la diversidad de los árboles y mejorando continuamente el rendimiento del modelo.

Datos

Se simuló un conjunto de datos compuesto por 100.000 clientes y más de 10 variables que se pueden clasificar en los siguientes 3 grandes grupos.

El conjunto de datos total se dividió en dos partes: el 70% se utilizó para entrenar el modelo, asegurando que aprendiera de manera precisa y efectiva, mientras que el 30% restante se reservó para testearlo, validando así capacidad de predicción del modelo en datos nuevos. 

La cocina detrás de la analítica predictiva

Es crucial contar con buenos datos, lo que implica explorarlos minuciosamente para detectar posibles valores atípicos y realizar las transformaciones necesarias antes de elegir el modelo adecuado.

Generalmente, se exploran distintos algoritmos y se selecciona el que tenga el mejor rendimiento. En este caso, se probaron múltiples modelos, incluyendo regresión logística y random forest. No obstante, se optó por XGBoost debido a que mostró un desempeño superior en el conjunto de datos de prueba, logrando una mejor clasificación de los datos no vistos previamente por el modelo. Esto podría atribuirse a la capacidad del XGBoost para mejorar progresivamente las predicciones a través de las iteraciones.

Además, la optimización de hiperparámetros es importante para mejorar el rendimiento del modelo. Sin embargo, debe hacerse con precaución para evitar sobreajuste. La clave es conseguir un equilibrio entre precisión y capacidad de generalización.

Resultados

Cada uno de los 30.000 clientes, que conformaron el conjunto de testeo, fue scoreado por el modelo. A mayor score, mayor probabilidad de propensión a contratar un producto.

Se agruparon a los clientes en deciles según dicho score y se graficaron de acuerdo a si fueron o no propensos a la contratación. En el gráfico se observa que en los primeros deciles ninguno de los clientes fue propenso a contratar. Por el contrario, en los deciles superiores se encuentran la mayoría de los clientes propensos. Claramente, el modelo nos ayuda a ordenar a los clientes de acuerdo a su probabilidad de propensión a partir a las variables consideradas.

Para interpretar los resultados del modelo, se utiliza además el método SHAP (SHapley Additive exPlanations), que permite entender el impacto de cada variable en la predicción. El gráfico de valores SHAP muestra la distribución de los impactos de cada variable en las predicciones, destacando las variables que más influyen en la propensión de los clientes a contratar un producto. Se observa que la cantidad de clics en el banner del producto y los ingresos son las variables que más contribuyen de manera positiva a la probabilidad de propensión predicha por el modelo. Por el contrario, el tiempo de inactividad en la web afecta de manera negativa.

Función de ganancia

Considerando tanto el costo de la estrategia como los beneficios económicos derivados de la contratación, se estableció una función de ganancia. En una campaña de marketing dirigida a más de 7.000 clientes, con un costo de 700.000€, las ganancias adicionales ascienden a 1.500.000€ siguiendo las recomendaciones del modelo, comparado con solo 79.000€ si los clientes se seleccionaran al azar.

Uso de la analítica predictiva en Arena Financial Tech

La analítica predictiva ofrece un inmenso potencial para transformar las estrategias financieras. Al implementar este enfoque, las empresas pueden tomar decisiones más inteligentes y aprovechar al máximo sus recursos humanos y financieros. En ARENA, utilizamos la analítica predictiva en nuestros proyectos para ayudar a nuestros clientes a optimizar sus operaciones y alcanzar sus objetivos comerciales con mayor eficacia.