Análise de Risco no Transporte Público - London Bus Safety Analysis.
Curso - Big Data Real-Time Analytics Com Python e Spark - Versão 3.0
Projeto da Formação Cientista de Dados da Data Science Academy
- Quais incidentes de trânsito ocorrem com mais frequência?
- Qual a faixa etária que mais se envolve em incidentes de trânsito?
- Qual o evento mais comum nos incidentes?
- Passageiros ou pedestres são as maiores vítimas dos incidentes?
Essas e outras perguntas devem ser respondidas através da análise de dados reais disponíveis publicamente. Este projeto não requer Machine Learning e seu trabalho é aplicar suas habilidades de análise e responder diversas perguntas de negócio através de gráficos e storytelling.
Para a construção desse projeto, recomendamos a utilização da Linguagem Python e Linguagem SQL e o dataset disponível para download no link: data.world
O conjunto de dados lista incidentes de trânsito ocorridos na cidade de Londres.
- Andy Kriebel link
- Data.world
- Data Science Academy
- Conda
- Jupyterlab
- Python
- Pandas
- Seaborn
- Streamlit
- Vega-Altair
- Github
- Pycharm
- Criar um ambiente de trabalho com o conda
conda create --name busSafe --file requirements.txt
- Depois de criado ativa ambiente
conda activate busSafe
- Rodar aplicativo Streamlit (obs: com ambiente ativado e dentro da pasta de trabalho)
# baixando o repositório
streamlit run Bus_Safety.py
# direto do GitHub
streamlit run https://github.com/rbalbinotti/Analise_Risco_Transp_Publico/blob/main/Bus_Safety.py
- Qual a quantidade de incidentes por gênero?
- Qual faixa etária esteve mais envolvida nos incidentes?
- Qual o percentual de incidentes por tipo de evento?
- Como foi a evolução de incidentes por mês ao longo do tempo?
- Quando o incidente foi colisão em qual mês houve o maior número de incidentes envolvendo pessoas do sexo feminino?
- Qual foi a média de incidentes por mês envolvendo crianças?
- Considerando a descrição de incidente como tratamento no local, qual o total de incidentes de pessoas do sexo masculino e sexo feminino?
- No ano de 2017 em qual mês houve mais incidentes com idosos?
- Considerando o Operador qual a distribuição de incidentes ao longo do tempo?
- Qual o tipo de incidente mais comum com ciclistas?
Material criado por Roberto R Balbinotti.
Projeto de Conclusão do Curso 3.0 - Big Data Real-Time Analytics com Python e Spark da Data Science Academy