IBAMA_residues

Note

Repositório desttinado a apresentação de projeto pós graduação. Por esse motivo, versionado e documentado parcialmente me português. Repository solely destinated to present post-grad projects in Brazil, hence the documentation partially in portuguese.

Motivação

No Brasil, resíduos são produzidos e grande quantidade pelas mais diversas atividades. Bilhões de litros de líquidos e trilhões de kilogramas de sólidos são gerados todos os anos, em grande parte perigosos e/ou danosos à saúde do homem, da fauna e da flora. O controle quantitativo de todo esse material existe e hoje é realizado pelo IBAMA. Entretanto, a difusão dessa informação é ruim e de difícil acesso pelo cidadão médio. O presente projeto visa então prover esse acesso de maneira facilitada e clara, implementando diversas técnicas da engenharia de dados.

Arquitetura

Aqui é utilizado o ambiente de nuvem Amazon Web Services (AWS), nele foi implementado um procedimento padrão de Extract Transform Load (ETL) da seguinte maneira:

graph LR
	subgraph S3
		raw[(Raw)]
		cmp[(Compressed)]
		std[(Glue\nStandardized)]
	end
	
	i[(IBAMA\nDB)]
	--> a{{API\nIBAMA}}
	--> e[[Extrator]]
	-.-> raw
	e --> cmp

	cmp --> g
	raw -.-> g
	
	
	g[[Glue]]
	--> std
	g
	-.-> gc[(Glue\nCatalog)] 
	
	gc & std
	--> at[[Athena]]
	--> s[(Spice)] & q{{QuickSight}}
	s --> q --> u((User))

Implementação

Abaixo são demonstrados alguns pontos principais da implementação:

Extração (local, Lambda, E2C)

Transformação (Glue, Spark):

Tosdas as trasformações realidadas nos dasdos em interface AWS Glue se tutilizam de transformações SQL em ambiente ApacheSpark (pyspark).
É feita análise textual quantitativa relacionando não só frequência de ocorrêndcia de palavras, com também seu immpacto relativo nas emissões.

Carregamento (Athena, Spice e QuickSight)

Uso (QuickSight)

Conclusão

O projeto demonstrou a implementção completa de uma pipeline de dados usando o ecossistema AWS, de maneira a dar publicidade a dados de interesse público. Assim se mostra como completa em seu estado inicial.

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
AWS_GLUE		AWS_GLUE
final_pdf		final_pdf
info		info
logs		logs
.gitattributes		.gitattributes
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
armazenador.sql		armazenador.sql
aws_manifest.json		aws_manifest.json
aws_utils.py		aws_utils.py
config.json		config.json
destinador.sql		destinador.sql
extraction.py		extraction.py
gerador.sql		gerador.sql
shell.nix		shell.nix
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

IBAMA_residues

Motivação

Arquitetura