Análise de Atrasos de Voos em Aeroportos
ETL pipeline seguindo a arquitetura Medallion (Raw, Silver, Gold) para análise de dados sobre atrasos de voos em aeroportos dos Estados Unidos.
Sobre o Projeto
Este repositório é dedicado à documentação de todos os artefatos criados pelo Grupo 04 na disciplina de Sistemas de Banco de Dados 2 da Faculdade de Ciências e Tecnologias em Engenharia da Universidade de Brasília (FCTE-UnB).
Objetivos
O projeto implementa um pipeline ETL completo utilizando a Arquitetura Medallion para análise de dados históricos de atrasos de voos nos Estados Unidos. Os principais objetivos são:
-
Arquitetura Lakehouse: Implementar camadas Bronze (Raw), Silver (Curated) e Gold (Aggregated) para armazenamento e processamento
-
Modelagem de Dados: Desenvolver representações conceitual (MER), lógica (DER) e física (DDL) do modelo de dados
-
Banco de Dados: Construir e popular um banco PostgreSQL containerizado para consultas
-
Dashboard Analítico: Desenvolver painéis interativos no Power BI para exploração de dados e geração de insights sobre:
- Atrasos de voos por companhia aérea
- Causas de atrasos (meteorologia, companhia, NAS, segurança, aeronave)
- Padrões de sazonalidade
- Cancelamentos e desvios
- Tendências temporais
Principais Análises
13 Visualizações Implementadas:
Análises de Correlação e Causas:
- Matriz de Correlação entre tipos de atrasos (Carrier, Weather, NAS, Security, Late Aircraft)
- Breakdown por causa de atraso - Grid 2x2 (contribuição relativa de cada fator)
- Contribuição percentual média de cada causa de atraso
Performance de Companhias Aéreas:
- Ranking de companhias aéreas por atraso médio (TOP/BOTTOM performers)
- Taxa de cancelamento e desvio por companhia
- Volume de operações vs. eficiência operacional
Análises Temporais:
- Sazonalidade mensal - identificação de picos de atrasos
- Tendências anuais (2013-2023) - evolução da performance
- Decomposição sazonal (STL) - padrões cíclicos e tendências
- Agregações temporais (dia/semana/mês/ano)
Análises de Distribuição:
- Distribuições estatísticas de atrasos (histogramas e boxplots)
- Impacto das condições meteorológicas na operação
- Top rankings por aeroporto - hubs mais afetados por atrasos
Equipe
Grupo 04 - Banco de Dados 2 | FCTE-UnB
|
Felipe das Neves
Desenvolvedor |
Leonardo de Melo
Desenvolvedor |
Mateus Bastos
Desenvolvedor |
Vitor Pereira
Nosso Amigo <3 |
Gabriel Lima
Nosso Amigo <3 |
Licença
Este projeto é parte de uma atividade acadêmica da disciplina de Sistemas de Banco de Dados 2 da Universidade de Brasília (UnB).
Instituição: Faculdade de Ciências e Tecnologias em Engenharia (FCTE)
Curso: Engenharia de Software
Período: 2025.4