Skip to end of metadata
Go to start of metadata

You are viewing an old version of this content. View the current version.

Compare with Current Restore this Version View Version History

« Previous Version 4 Next »

  • Sempre em Pyspark

  • Pode haver renomeação de colunas unicamente para estruturação

  • Transforma tudo em relacional

  • Pode gerar mais de uma tabela nos casos em que a base não é relacional

  • Normalmente não se cria novas colunas com novas informações nesta etapa (o ideal é que aconteça na bronze)

  • Situações onde se precisa criar um campo primary key (usando o monotonically_increasing_id , por exemplo) para uma tabela relacional, o ideal é fazê-lo na etapa gold, quando necessário

  • Não há filtros nos dados

  • Realizar Tratamento de tipos, nulos, etc

  • Tradução do nome de colunas e tabelas do pt-br para o inglês

Regras

No notebook preencha a primeira célula com as informações:

  • Nome do schema e tabela sendo gerada

  • O link do Jira e o ID da tarefa

  • @ do responsável pela tarefa

  • Data de atualização do script

0 Comments

You are not logged in. Any changes you make will be marked as anonymous. You may want to Log In if you already have an account.