Este é um projeto de predição de Metascores de filmes usando técnicas de aprendizado de máquina. O Jupyter Notebook fornecido contém o código e a análise completa do projeto. Feito como entrega final para a disciplina Ciência dos Dados, do 2° Semestre da Engenharia do Insper.
O objetivo deste projeto é desenvolver um modelo de aprendizado de máquina capaz de prever o Metascore de um filme com base em diferentes características e dados históricos. O Metascore é uma pontuação numérica que reflete a crítica geral de um filme, variando de 0 a 100. Nesse projeto, previu-se essa nota através de duas técnicas diferentes: regressão linear e árvore de decisão.
O notebook contém as seguintes seções principais:
- Importação de bibliotecas e configuração inicial
- Análise exploratória de dados
- Pré-processamento de dados
- Divisão de dados em conjuntos de treinamento e teste
- Treinamento e avaliação do modelo
- Visualização dos resultados
- Conclusões
Antes de executar o Jupyter Notebook, certifique-se de ter as seguintes bibliotecas instaladas:
- NumPy
- Pandas
- Scikit-learn
- Matplotlib
- Seaborn
Você pode instalá-las usando o gerenciador de pacotes Python, pip, da seguinte forma:
pip install numpy pandas scikit-learn matplotlib seaborn
- Clone ou faça o download deste repositório em seu ambiente local.
- Certifique-se de ter todas as dependências mencionadas na seção de requisitos instaladas.
- Abra o Jupyter Notebook
Projeto-2.ipynb
usando o Jupyter Notebook ou uma IDE compatível com arquivos .ipynb. - Execute as células do notebook em ordem para reproduzir a análise, treinar o modelo e visualizar os resultados.