Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Esta página tem como finalidade documentar o processo de coleta dos dados de planilhas presentes no Sharepoint.

...

Relação de Jobs x Notebooks que compõem o processo:

  • Databrics job: coletor_excel_sharepoint

Task
Parâmetros
Periodicidade
Notebook
Repositório

coletor_energia_eletrica

Code Block
{
                        "base_url": "https://duratexsa.sharepoint.com/sites/JornadaCrescimento",
                        "file": "/sites/JornadaCrescimento/Documentos Partilhados/Processar/Energia Elétrica/Energia Elétrica.xlsx",
                        "sheet_name": "Sheet1",
                        "remove_lines": "[0,1,2,3]",
                        "remove_columns": "['ID:']",
                        "database": "indicadores_mercado",
                        "table": "tb_energia_eletrica",
                        "schema": "{'mes':'date','energia_eletrica_brasil':'double','energia_eletrica_brasil_projecao':'double'}"
                    }

Diário

(13 0 0 ? * *)

/analytics-databricks-inteligencia-mercado/Workspace/bronze/inteligencia-mercado/coletor-excel-sharepoint

https://bitbucket.org/duratex/analytics-databricks-inteligencia-mercado/src/master/

coletor_economia_vs_poa

Code Block
languagejson
{
                        "base_url": "https://duratexsa.sharepoint.com/sites/JornadaCrescimento",
                        "file": "/sites/JornadaCrescimento/Documentos Partilhados/Processar/Economia vs POA (Suprimentos)/Economia vs POA.xlsx",
                        "sheet_name": "Economia",
                        "remove_lines": "[0]",
                        "remove_columns": "['Unnamed: 6','Dados para Gráfico','Unnamed: 8','Unnamed: 9','Unnamed: 10']",
                        "database": "indicadores_mercado",
                        "table": "tb_economia_vs_poa",
                        "schema": "{'mes_ytd':'date','inflacao_acumulada_reais_madeira':'double','inflacao_acumulada_reais_deca':'double','inflacao_acumulada_reais_rc':'double','inflacao_acumulada_reais_total':'double', 'perc_spend_total':'double'}"
                    }

Diário

(13 0 0 ? * *)

/analytics-databricks-inteligencia-mercado/Workspace/bronze/inteligencia-mercado/coletor-excel-sharepoint

https://bitbucket.org/duratex/analytics-databricks-inteligencia-mercado/src/master/

coletor_market_consensus

Code Block
languagejson
{
                        "base_url": "https://duratexsa.sharepoint.com/sites/JornadaCrescimento",
                        "file": "/sites/JornadaCrescimento/Documentos Partilhados/Processar/Market Consensus/Market Consensus.xlsx",
                        "sheet_name": "Consensus",
                        "remove_lines": "[0, 1]",
                        "remove_columns": "[]",
                        "database": "indicadores_mercado",
                        "table": "tb_market_consensus",
                        "schema": "{'data': 'date', 'ebitda_2022': 'smallint', 'ebitda_2023': 'smallint', 'ebitda_2024': 'smallint', 'ebitda_2025': 'smallint', 'ebitda_2026': 'smallint', 'ev_ebitda': 'float', 'media_5y': 'float', 'maior_1dp': 'float', 'menor_1dp': 'float'}"
                    }

Diário

(13 0 0 ? * *)

/analytics-databricks-inteligencia-mercado/Workspace/bronze/inteligencia-mercado/coletor-excel-sharepoint

https://bitbucket.org/duratex/analytics-databricks-inteligencia-mercado/src/master/

coletor_hoff_solucoes

Code Block
languagejson
{
                        "base_url": "https://duratexsa.sharepoint.com/sites/JornadaCrescimento",
                        "file": "/sites/JornadaCrescimento/Documentos Partilhados/Processar/Hoff Soluções/Hoff Soluções.xlsx",
                        "sheet_name": "Projetos Arquitetônicos",
                        "remove_lines": "[0]",
                        "remove_columns": "[]",
                        "database": "hoff_solucoes",
                        "table": "hoff_solucoes",
                        "schema": "{'data': 'date', 'ano': 'smallint', 'proj_arquit': 'int', 'proj_arquit_reformas': 'int', 'proj_arquit_empreendimentos': 'int', 'proj_arquit_reformas_pf': 'int', 'proj_arquit_reformas_pj': 'int', 'proj_arquit_reformas_2019_10': 'int', 'proj_arquit_empreendimentos_2019_100': 'int', 'proj_arquit_empreendimentos_n': 'int', 'proj_arquit_empreendimentos_ne': 'int', 'proj_arquit_empreendimentos_co': 'int', 'proj_arquit_empreendimentos_se': 'int', 'proj_arquit_empreendimentos_s': 'int', 'ano2': 'int', 'proj_arquit_reformas_ano': 'string', 'proj_arquit_empreendimentos_ano': 'string'}"
                    }

Diário

(13 0 0 ? * *)

/analytics-databricks-inteligencia-mercado/Workspace/bronze/inteligencia-mercado/coletor-excel-sharepoint

https://bitbucket.org/duratex/analytics-databricks-inteligencia-mercado/src/master/

coletor_sell_out_deca

Code Block
languagejson
{
                        "base_url": "https://duratexsa.sharepoint.com/sites/JornadaCrescimento",
                        "file": "/sites/JornadaCrescimento/Documentos Partilhados/Processar/Sell-out Deca/Sell-out Deca.xlsx",
                        "sheet_name": "Sheet1",
                        "remove_lines": "[0]",
                        "remove_columns": "[]",
                        "database": "indicadores_mercado",
                        "table": "tb_sell_out_deca",
                        "schema": "{'ano': 'int', 'mes': 'int', 'ano_mes': 'string', 'Sellout_Metais': 'float', 'Sellout_Loucas': 'float', 'Sellout_Hydra': 'float', 'Sellout_RC': 'float'}"
                    }

Diário

(13 0 0 ? * *)

/analytics-databricks-inteligencia-mercado/Workspace/bronze/inteligencia-mercado/coletor-excel-sharepoint

https://bitbucket.org/duratex/analytics-databricks-inteligencia-mercado/src/master/

coletor_investing_taxa_de_longo_prazo

Code Block
{
                        "base_url": "https://duratexsa.sharepoint.com/sites/JornadaCrescimento",
                        "file": "/sites/JornadaCrescimento/Documentos Partilhados/Processar/Taxa de Longo Prazo/Taxa de Longo Prazo.xlsx",
                        "sheet_name": "Onda1",
                        "remove_lines": "[]",
                        "remove_columns": "[]",
                        "database": "investing",
                        "table": "tb_brazil_10_year_bond_yield_sharepoint_silver",
                        "schema": "{'Data': 'date','10y_Brazilian_Bond': 'double'}"
                    }

Diário

(13 0 0 ? * *)

/analytics-databricks-inteligencia-mercado/Workspace/bronze/inteligencia-mercado/coletor-excel-sharepoint

https://bitbucket.org/duratex/analytics-databricks-inteligencia-mercado/src/master/

...

  • Tabelas referentes ao job: coletor_excel_sharepoint

indicadores_mercado.tb_energia_eletrica

Field
Key
Not Null
Partition
Element
Type
Size
Decimal
Description

mes

Não

Não

Não

 

date

 

 

energia_eletrica_brasil

Não

Não

Não

 

double

 

 

energia_eletrica_brasil_projecao

Não

Não

Não

 

double

 

 

View file
nameindicadores_mercado.tb_energia_eletrica.csv

indicadores_mercado.tb_economia_vs_poa

Field
Key
Not Null
Partition
Element
Type
Size
Decimal
Description

mes_ytd

Não

Não

Não

 

date

 

 

inflacao_acumulada_reais_madeira

Não

Não

Não

 

double

 

 

inflacao_acumulada_reais_deca

Não

Não

Não

 

double

 

 

inflacao_acumulada_reais_rc

Não

Não

Não

 

double

 

 

inflacao_acumulada_reais_total

Não

Não

Não

 

double

 

 

perc_spend_total

Não

Não

Não

double

...

View file
nameindicadores_mercado.tb_economia_vs_poa.csv

indicadores_mercado.tb_market_consensus

Field
Key
Not Null
Partition
Element
Type
Size
Decimal
Description

data

Não

Não

Não

 

date

 

 

ebitda_2022

Não

Não

Não

 

smallint

 

 

ebitda_2023

Não

Não

Não

 

smallint

 

 

ebitda_2024

Não

Não

Não

 

smallint

 

 

ebitda_2025

Não

Não

Não

 

smallint

 

 

ebitda_2026

Não

Não

Não

 

smallint

ev_ebitda

Não

Não

Não

 

float

media_5y

Não

Não

Não

 

float

maior_1dp

Não

Não

Não

 

float

menor_1dp

Não

Não

Não

 

float

View file
nameindicadores_mercado.tb_market_consensus.csv

hoff_solucoes.hoff_solucoes

Field
Key
Not Null
Partition
Element
Type
Size
Decimal
Description

data

Não

Não

Não

 

date

 

 

ano

Não

Não

Não

 

smallint

 

 

proj_arquit

Não

Não

Não

 

int

 

 

proj_arquit_reformas

Não

Não

Não

 

int

 

 

proj_arquit_empreendimentos

Não

Não

Não

 

int

 

 

proj_arquit_reformas_pf

Não

Não

Não

 

int

proj_arquit_reformas_pj

Não

Não

Não

 

int

proj_arquit_reformas_2019_10

Não

Não

Não

 

int

proj_arquit_empreendimentos_2019_100

Não

Não

Não

 

int

proj_arquit_empreendimentos_n

Não

Não

Não

 

int

proj_arquit_empreendimentos_ne

Não

Não

Não

 

int

proj_arquit_empreendimentos_co

Não

Não

Não

 

int

proj_arquit_empreendimentos_se

Não

Não

Não

 

int

proj_arquit_empreendimentos_s

Não

Não

Não

 

int

ano2

Não

Não

Não

 

int

proj_arquit_reformas_ano

Não

Não

Não

 

string

proj_arquit_empreendimentos_ano

Não

Não

Não

 

string

View file
nameindicadoreshoff_mercadosolucoes.hoff_solucoes.csv

indicadores_mercado.tb_sell_out_deca

Field
Key
Not Null
Partition
Element
Type
Size
Decimal
Description

ano

Não

Não

Não

 

int

 

 

mes

Não

Não

Não

 

int

 

 

ano_mes

Não

Não

Não

 

string

 

 

Sellout_Metais

Não

Não

Não

 

float

 

 

Sellout_Loucas

Não

Não

Não

 

float

 

 

Sellout_Hydra

Não

Não

Não

 

float

Sellout_RC

Não

Não

Não

 

float

...