/
Pipeline - Bronze

Pipeline - Bronze

  • Os dados estão na sua maneira mais pura possível

  • Diversos formatos de arquivos

  • Podem estar particionados por data

  • Oculta para as áreas de negócios

  • Contém dados sensíveis

Sistemas

  • SAP_ECC

  • SAP_S4

  • SALES_FORCE

Regras

No notebook preencha a primeira célula com as informações:

  • Nome do schema e tabela sendo gerada

  • O link do Jira e o ID da tarefa

  • @ do responsável pela tarefa

  • Data de atualização do script

  • Não há filtros e nem alteração dos dados

  • Desenvolvido em pyspark

  • Todas as tabelas extraídas não terão nenhum tratamento estando em sua forma bruta, com exceção do sistema sales force onde o delta já deverá ser calculado já nesta etapa.

  • Os resultados finais desta etapa devem ser salvos em formato de tabela delta, independente do formato de entrada

Padrão de variáveis para ingestões automatizadas

Dado que as ingestões podem vir de variados sistemas e origens a seguinte nomenclatura de variáveis abaixo deve ser adotada como objetivo do script da camada bronze conseguir abstrair todas as ingestões (quando possível).

 

 

 

Add label

Related content

Arquitetura de Dados Atual
Arquitetura de Dados Atual
Read with this
Pipeline - Refined
More like this
Guideline - Devs (Databricks)
Guideline - Devs (Databricks)
Read with this
Pipeline - Silver
More like this
Pipeline - Staging
Read with this