Este espaço é destinado a documentação da equipe de Analytics
BCM SEOP
Este documento tem como objetivo descrever detalhes da migração do processo MADEIRA_SEOP_BCM, que foi efetuado a partir da DAG Airflow dag_etl_kettle_madeira_sop.
Tarefa Jira de Desenvolvimento: https://dtxlab.atlassian.net/browse/AEMD-147
Nome da DAG Migrada: dag_etl_kettle_madeira_sop
Arquivo Utilizado para Migração:
Nome do Notebook Databricks: /gold/analytics-madeira/Backoffice/PROCESSO_SEOP_BCM/MADEIRA_SEOP_BCM
Link do Notebook Databricks: https://dbc-9570c746-ec11.cloud.databricks.com/?o=3606981051492833#notebook/3707336503349121/command/4205888893951135
Nome do JOB Databricks: JOB_FLOW_MADEIRA_SEOP
Link do JOB Databricks: https://dbc-9570c746-ec11.cloud.databricks.com/?o=3606981051492833#job/218920062944148/runs
Agenda de Execução do JOB: Processo é inicializado pela AWS Lambda. Assim que o arquivo é salvo no bucket o job no databricks inicia.
Nome do Notebook START JOB: -
Link do Notebook START JOB: -
Tabela (s) e Arquivo (s) utilizado (s) na Leitura do Processo
prd_t_bcm_seop.xlsm
Observações Importantes Referentes à (às) Tabela (s) de Leitura
-
Tabela(s) atualizadas(s) no Processo
analytics_madeira.t_bcm_seop
Detalhes do Processo Migrado
Verifica se o arquivo existe na pasta;
Copia o arquivo para uma pasta temporária;
Com base no arquivo eh gerado um dataframe e aplica-se a regra de negocio;
Apaga na tabela delta todos os dados em comum com os dados do dataframe;
Inseri os dados do dataframe na tabela delta;
Apaga o arquivo cria na pasta temporária;
Cria o Arquive;
Exclui o arquivo na origem.
Related content
CAL-03-ANALITYCS