Entrega 1.1 – Raw Layer (Camada Bruta)
Objetivo
Documentar a Raw Layer, responsável por armazenar os dados brutos exatamente como foram extraídos da fonte original, sem qualquer tipo de transformação, garantindo rastreabilidade, reprocessamento e integridade dos dados.
Características da Raw Layer
A Raw Layer segue o princípio de imutabilidade dos dados, ou seja, os dados não sofrem alterações após a ingestão.
Principais características:
- Armazenamento fiel à fonte original
- Ausência de tratamento, limpeza ou padronização
- Preservação de erros, nulos e inconsistências da fonte
- Base para auditoria e reprocessamentos futuros
Processo de Ingestão
Estratégia de Carga
- O arquivo CSV original é carregado integralmente
- Nenhuma coluna é removida ou modificada
- Os nomes e tipos de dados permanecem conforme a fonte
Fluxo de ingestão:
Fonte Externa (CSV)
↓
Raw Layer
Estrutura dos Dados
- Cada linha representa um voo registrado
-
As colunas descrevem:
-
Identificadores de voo
- Companhia aérea
- Datas e horários
- Indicadores de atraso e cancelamento
- Causas de atraso
Exemplo de um Gráfico
labels_pt = { 'carrier_delay': 'Atraso Companhia', 'weather_delay': 'Atraso Meteorológico', 'nas_delay': 'Atraso NAS', 'late_aircraft_delay': 'Atraso Aeronave Atrasada', 'arr_delay': 'Atraso Total', 'arr_cancelled': 'Voos Cancelados', 'arr_diverted': 'Voos Desviados' }
Nesta camada, não há garantias de qualidade, pois a função da Raw Layer é preservar o dado original. ```
Atenção!
Para visualizar os resultados da camada Raw em sua completude verifique os ETLs desenvolvidos em Transformer
Importância da Raw Layer no Pipeline
A Raw Layer é fundamental para:
- Garantir rastreabilidade dos dados
- Permitir correções e reprocessamentos
- Servir como fonte única da verdade (single source of truth)
- Evitar perda de informação durante transformações
Saídas da Camada Raw
- Dados brutos prontos para processamento
- Insumo direto para a etapa de transformação (Silver Layer)
- Dicionário de Dados
- Visualização dos gráficos dos dados brutos