Análisis de marketing para Y.Afisha, análisis de cohortes, cálculo de métricas clave (CAC, ROMI, LTV) y visualización con mapa de calor
Para ver desarrollo en código hacer click aquí
Este proyecto se centra en analizar los datos de la empresa Y.Afisha para evaluar el comportamiento de los usuarios, las compras realizadas y los costos de marketing asociados. Se utilizaron tres datasets que contienen información sobre visitas al sitio web, compras realizadas y gastos en diversas campañas de marketing. Después de limpiar y analizar los datos, se realizó una comparación detallada del rendimiento de varias campañas para hacer recomendaciones sobre en cuáles invertir de manera más efectiva y los beneficios esperados.
- Lenguaje de Programación: Python.
- Entorno de Desarrollo: Jupyter Notebook.
- Bibliotecas: Pandas, Numpy, Matplotlib, Seaborn.
- Pre-análisis de los datos: Los datos fueron extraídos de tres archivos proporcionados por la compañía (
orders
,visits
ycosts
). Además, se llevaron a cabo operaciones de limpieza, como la búsqueda y eventual manejo de valores nulos, duplicados y formateo de datos. - Análisis de los datos: .
- Visitas: Se estudia la duración y frecuencia de las visitas de forma diaria, semanal y mensual, durante el año estudiado. También, se estudia la tasa de retención de cada cohorte mensual.
- Ventas: Se analiza en qué momento la gente comienza a comprar, el tamao promedio de pedido y el LTV de cada cohorte mensual.
- Marketing: Se compararon, usando métricas clave como CAC, LTV y ROMI, los costos y el rendimiento de diferentes campañas de marketing. Además, se generaron visualizaciones ilustrativas, tales como, mapas de calor por cohorte y gráficos de barra para el CAC y un gráfico de líneas con los costos de todas las campañas por mes.
- Conclusión: Con base en el análisis, se proporcionaron recomendaciones sobre las campañas en las que sería más rentable invertir.
Se presentarán los principales descubrimientos del análisis en diferentes ámbitos.
- La distribución mensual de visitas es muy variable, teniendo su peak en noviembre (antes de las fiestas de fin de año) y su punto más bajo en agosto.
- La tasa de retención es muy baja, ninguna cohorte supera el 10% de retención mensual, lo anterior indica que se deben tomar medidas para retener a los visitantes y a los clientes que hacen su primera compra.
- El ASL (tiempo de sesión promedio) es de 60 segundos, lo cual es suficiente para que un cliente haga una compra.
- En promedio, cada visitante entra 1.08 veces al día a la web.
- Una gran mayoría de clientes hace su compra el mismo día de la primera visita a la web, y en específico durante los primeros 5 minutos.
- La mediana en cuanto a tamaño de ventas es 2.5 dólares y en general las compras son por valores bajos, hay un numero pequeño de compras muy grandes (por sobre los mil dolares) pero estas no afectan significativamente las metricas finales como el ROMI y el LTV.
- el LTV de un cliente captado en junio de 2017 (la cohorte más antigua) es de 11.88 dólares.
- El CAC tiende a subir en los peores meses, lo que indica que es probable que por el rubro de la tienda, estos sean simplemente malos meses para la venta de estos productos.
- El Costo de adquisición de cliente de la fuente 3 es de más de 13 dólares, lo que nos da un indicio de lo poco rentable que está resultando esta fuente de anuncios.
- La fuente 3 es, también, la que más recibió dinero durante el año estudiado.
Se analizará el ROMI mensual acumulado de cada fuente de anuncios, esto nos brindará una idea de en cuanto tiempo se recupera la inversión y si es que se llegan a generar ganancias, es el indicador clave de rendimiento de una campaña de marketing orientada a vender.
- Se recomienda eliminar la fuente de anuncios 3 debido a que tiene CAC muy alto y no es capaz de generar ganancias sino al contrario, están generando pérdidas para la empresa, en la cual se gastaron 140.000 dólares durante el año estudiado.
- La fuente 1 funciona bien y se debe invertir más en ella, genera ganancias la mayoría del año, salvo unos pocos meses (de diciembre a febrero y abril).
- La fuente 2 trae buenos resultados sólo en septiembre y diciembre.
- La fuente 4 trae buenos resultados sólo en noviembre.
- La fuente 5 funciona bien para atraer compradores para navidad en el mes de septiembre, el resultado muestra que los clientes atraídos en esta fecha generaron muy buenos resultados, sin embargo el resto del año la campaña no funciona bien.
- La fuente 9 trae resultados relativamente buenos desde junio hasta octubre.
- La fuente 10 ha mostrado buenos números en marzo y mayo.
- Según los resultados anteriores es que se propone el siguiente esquema de distribución de recursos entre las campañas de marketing.
- El porcentaje de fondos a redistribuir sería por lo bajo un 42.9%
- Durante los meses donde no se ven campañas rentables, se recomienda invertir en campañas de remarketing enfocadas en la retención de los usuarios que hicieron visitas y realizaron compras anteriormente, ya que es un punto débil en la estrategia actual y atacarlo podría traer grandes beneficios.
Comparando el ROMI mensual promedio de la tienda, con el ROMI de la fuente 1 (la más rentable) podemos observar que los beneficios de llevar a cabo las recomendaciones serían el doble de retorno de la inversión en marketing calculado a nivel mensual, y eso es sólo contemplando la eliminación de la fuente 3 de anuncios, considerando en la ecuación el ajuste de las otras campañas y la implementación de campañas de remarketing, los beneficios netos serán aún más grandes.
Ejecuta el proyecto aquí
Para ver el diccionario de datos, el desarrollo completo en código, todos los gráficos y las conclusiones, haga click en el enlace de arriba