Este espaço é destinado a documentação da equipe de Analytics
Smartsheet Status Operação
Este documento tem como objetivo descrever detalhes da migração do processo SMARTSHEET_STATUS_OPERACAO, que foi efetuado a partir da DAG Airflow dag_etl_smartsheet_status_operacao.
Tarefa Jira de Desenvolvimento: https://dtxlab.atlassian.net/browse/AEMD-34
Nome da DAG Migrada: dag_etl_smartsheet_status_operacao
Arquivo Utilizado para Migração:
Nome do Notebook Databricks: /gold/analytics-madeira/Backoffice/SMARTSHEET/SMARTSHEET_STATUS_OPERACAO
Link do Notebook Databricks: https://dbc-9570c746-ec11.cloud.databricks.com/?o=3606981051492833#notebook/4254588840945867/command/4205888893951537
Nome do JOB Databricks: JOB_MADEIRA_SMARTSHEET_STATUS_OPERACAO
Link do JOB Databricks: https://dbc-9570c746-ec11.cloud.databricks.com/?o=3606981051492833#job/279783446056862
Agenda de Execução do JOB: Schedule "0 0 6 * * ?". Será executado via cronograma todos os dias as 6:00am.
Nome do Notebook START JOB: -
Link do Notebook START JOB: -
Tabela (s) e Arquivo (s) utilizado (s) na Leitura do Processo
API Smartsheet - Worksheet ID:
6161973290264452
Observações Importantes Referentes à (às) Tabela (s) de Leitura
-
Tabela(s) atualizadas(s) no Processo
analytics.t_smartsheet_status_operacao
Detalhes do Processo Migrado
Cria acessos, lê e extrai as informais referente a consulta da API;
Para cada campo dos dados da API é criado uma lista;
Cria um dataframe spark com as listas da API;
Normaliza, define e aplica as regras de negocio no dataframe;
Caso haja registros no dataframe é feito a gravação dos dados na tabela do databricks e/ou redshift subscrevendo os dados já existentes.
Related content
CAL-03-ANALITYCS