Este repositorio contiene código y datos relacionados con un proyecto de análisis de datos y modelado analítico. A continuación, se detalla la estructura del repositorio:
├── src
│ ├── test1_loading_dataset.py
│ ├── test2_data_manipulation.py
│ ├── test3_sql.py
│ ├── test6_analytic_modelation.ipynb
│ ├── test6_analytic_modelation.py
│ ├── test8_bi_script_normalize_addr.py
│ └── documentation.md
├── Datos3
│ ├── Prueba BI
│ │ ├── CL ORDERS - testcube.csv
│ │ ├── FU ORDER DETAIL - testcube.csv
│ │ └── FU ORDERS - testcube.csv
│ ├── Datos Maestros VF.xlsx
│ ├── dDEC1204.txt
│ ├── diccionario_variables.xlsx
│ ├── OFEI1204.txt
│ ├── test.csv
│ └── train.csv
├── output
│ ├── analytic_modelation.pdf
│ ├── oferta_plantas_emgesa.xlsx
│ ├── oferta_plantas_tipo_d.xlsx
│ ├── prueba_sql.xlsx
│ ├── PruebaBI.pbix
│ └── test_evaluado.xlsx
├── README.md
├── requirements.txt
└── .gitignore
##Descripción de Carpetas y Archivos src: Contiene scripts y notebooks relacionados con el análisis de datos y el modelado analítico.
- test1_loading_dataset.py: Script para cargar el conjunto de datos.
- test2_data_manipulation.py: Script para la manipulación de datos.
- test3_sql.py: Script que utiliza SQL para realizar operaciones en los datos.
- test6_analytic_modelation.ipynb: Jupyter Notebook para el modelado analítico, con explicaciones
- test6_analytic_modelation.py: Script de python para el modelado analítico.
- test8_bi_script_normalize_addr.py: Script para normalizar direcciones en un entorno de BI.
- documentation.md: Documentación relacionada con el código.
Datos3: Carpeta que contiene conjuntos de datos y archivos necesarios para el análisis.
- Prueba BI: Conjunto de archivos CSV relacionados con pruebas de Business Intelligence.
- Datos Maestros VF.xlsx: Archivo Excel con datos maestros.
- dDEC1204.txt: Archivo de texto con datos específicos.
- diccionario_variables.xlsx: Archivo Excel que contiene un diccionario de variables.
- OFEI1204.txt: Archivo de texto con datos específicos.
- test.csv y train.csv: Conjuntos de datos de prueba y entrenamiento.
output: Carpeta que contiene resultados y salidas generadas por el proyecto.
- analytic_modelation.pdf: Resultados del modelado analítico en formato PDF.
- oferta_plantas_emgesa.xlsx y oferta_plantas_tipo_d.xlsx: Resultados específicos en formato Excel.
- prueba_sql.xlsx: Resultados de las consultas SQL en formato Excel.
- PruebaBI.pbix: Archivo de Power BI con visualizaciones y análisis.
- test_evaluado.xlsx: Resultados de evaluación en formato Excel.
README.md: Este archivo que proporciona información general sobre el repositorio. requirements.txt: Archivo que lista las dependencias y versiones necesarias del proyecto. .gitignore: Archivo que especifica patrones de archivos que deben ser ignorados por el sistema de control de versiones Git.