Este espaço é destinado a documentação da equipe de Analytics
Smartsheet Pesquisa Operação
Este documento tem como objetivo descrever detalhes da migração do processo SMARTSHEET_PESQUISA_OPERACAO, que foi efetuado a partir da DAG Airflow dag_smartsheet_pesquisa_operacao.
Tarefa Jira de Desenvolvimento: https://dtxlab.atlassian.net/browse/AEMD-34
Nome da DAG Migrada: dag_smartsheet_pesquisa_operacao
Arquivo Utilizado para Migração:
Nome do Notebook Databricks: /gold/analytics-madeira/Backoffice/SMARTSHEET/SMARTSHEET_PESQUISA_OPERACAO
Link do Notebook Databricks: https://dbc-9570c746-ec11.cloud.databricks.com/?o=3606981051492833#notebook/337959509360800/command/4205888893951453
Nome do JOB Databricks: -
Link do JOB Databricks: -
Agenda de Execução do JOB: -Nome do Notebook START JOB: -
Link do Notebook START JOB: -
Tabela (s) e Arquivo (s) utilizado (s) na Leitura do Processo
API Smartsheet - Worksheet ID:
4580016240519044
Observações Importantes Referentes à (às) Tabela (s) de Leitura
-
Tabela(s) atualizadas(s) no Processo
analytics.t_smartsheet_pesquisa_operacao
Detalhes do Processo Migrado
Cria acessos, lê e extrai as informais referente a consulta da API;
Para cada campo dos dados da API é criado uma lista;
Cria um dataframe spark com as listas da API;
Normaliza, define e aplica as regras de negocio no dataframe;
Caso haja registros no dataframe é feito a gravação dos dados na tabela do databricks e/ou redshift subscrevendo os dados já existentes.
Related content
CAL-03-ANALITYCS