Conectando Excel com o Databricks

Este documento tem como propósito esclarecer todas as dúvidas referente a obtenção dos dados do Databricks diretamente pro Excel.

1 - DOWNLOAD E INSTALAÇÃO DO CONECTOR

O primeiro passo é o download e configuração do conector simba Spark para a máquina que será utilizada.

Para isto, basta acessar o link ( ODBC Drivers Download – Databricks ) e realizar o download levando em consideração o sistema operacional / versão que você está utilizando.

Apos o download, basta realizar a instalação apenas clicando para seguir até o final

OBS: Em algumas máquinas pode dar problema na instalação caso o usuário não tenha a permissão, para isto, será necessário entrar em contato com o suporte, abrir chamado e solicitar a instalação.

2 - CONFIGURAÇÃO

Uma vez que o passo 1 foi feito com sucesso, agora iremos configurar a conexão com os passos abaixo:

2.1 ABRIR O ADMINISTRADOR DE FONTE DE DADOS (ODBC)

Para isto, basta ir no menu iniciar e digitar ODBC conforme print abaixo:

OBS: Atente-se a arquitetura da sua máquina se é 32BIT ou 64BIT. No caso do print acima a máquina é 64 BIT por isto vou abrir o respectivo aplicativo.

2.2 CONFIGURAR ODBC

Uma vez que abrirmos o gerenciador ODBC, iremos realizar a configuração do mesmo. Para isto, é necessário ter em mãos as seguintes informações:

TOKEN
HOSTNAME
HTTP PATH

Estas informações devem ser solicitadas para o time de arquitetura de dados. Sem elas, não dá para seguir para os próximos passos.

Com as informações necessárias em mãos e com o o gerenciador ODBC aberto, basta ir no DNS de Sistema conforme print abaixo:

Ai clicar aparecerá uma tela semelhante a abaixo:

Selecione o conector respectivo ao driver Simba Spark ODBC Driver e clicar em configurar e com isto aparecerá uma tela semelhante ao print abaixo:

Abaixo uma explicação de cada numeral:

Nome do Driver (Pode-se colocar o que quiser, a sugestão é um nome que seja fácil identificar que seja o SIMBA Conector pro Databricks)
Uma descrição (Pode-se colocar o que quiser, esta informação serve para identificar o conector nas ferramentas)
Deve-se selecionar o SparkThriftServer (Spark 1.1 and Later) - Importante esta informação, por default vem outro selecionado.
Coloca neste campo o hostname do ambiente que está sendo conectado. Esta informação deve ser solicitada para o time de arquitetura de dados.
Porta que será conectada, sempre será 443
Database que iniciará a conexão. (Está informação pode ser trocada depois dentro antes da conexão do excel)
Selecione sempre User Name anda Password
SEMPRE fixo token
TOKEN informado pelo time de arquitetura de dados. (Obs: Este token é por área, caso a sua já tenha, pode-se usar o mesmo, não é necessário solicitar outro)
Fixo HTTP
Neste menu, selecionar Enable SSL conforme print abaixo:

12. No HTTP Option colocar a informação enviada pela arquitetura de dados, ou a já usada pela área no tableau ou power bi:

OBS: Não deve-se colocar em ADD. Apenas coloque a informação no campo marcado e clique em OK.

Feito todos os passos acima, podemos testar clicando no botão TEST e verificar se deu sucesso através da exibição de uma mensagem conforme abaixo:

Caso apareça mensagem de falha, devemos revisar os passos acima afim de encontrar alguma diferença.

3. CONEXÃO COM O EXCEL

Uma vez realizado todos os procedimentos informados no passo 2, vamos realizar a conexão no excel através do power query.

Apos abri o excel, basta ir no menu Dados, após isto clicar em Obter Dados e em seguida selecionar De outras Fontes e após Do Microsoft Query

Feito os passos acima, aparecerá a tela para selecionar qual a fonte de dados queremos. No nosso caso, queremos a conexão que configuramos no passo 2.

Basta clicar na mesma e clicar em OK.

Apos isto aparecerá uma tela muito semelhante a que configuramos no passo 2, neste passo teremos que colocar o token novamente e aqui podemos trocar o database caso necessário:

Feito isto, aparecerá a tela para selecionar a(s) tabela(s) que queremos:

Para isto, basta selecionar a tabela que queremos, clicar na seta e os campos da tabela selecionada aparecerá na caixa a direita:

Com isto, basta clicar em avançar caso esteja tudo certo. Na próxima tela poderemos colocar filtros nos campos, caso queiramos. Se não for necessário nenhum filtro, podemos clicar em avançar mais uma vez.

Na tela em seguida podemos aplicar ordenação, caso não queiramos basta seguir mais uma vez.

E na última tela, clicar em Concluir:

Com isto, os dados serão obtidos, colocarmos na memória, e na tela em seguida podemos selecionar o que queremos fazer com eles:

Neste exemplo, eu quero apenas que os dados apareceram na planilha, por isto eu mantenho selecionado tabela e clico em ok.

Feito isto, os dados apareceram na planilha para serem usados conforme a gosto do freguês.

4. Considerações Finais

Qualquer dúvida ou problema a área de arquitetura de dados se coloca à disposição.