Catálogo de Dados
Objetivo - Com o catálogo de dados, é possível encontrar rapidamente as informações, acessar os metadados e iniciar a preparação e análise dos dados com eficiência e segurança. Sem a necessidade de contar com uma grande equipe de especialistas para realizar esse trabalho.
Layout - O catalogo deve estar no ambiente https://dbc-9570c746-ec11.cloud.databricks.com/?o=3606981051492833#files/3926445055831284, lembrando quem for fazer o catalogo para um projeto novo, criar a pasta como o nome e os schemas.
Coluna Descrição
FIELD Nome do campo
KEY É uma chave
NOT_NULL Não nulo
PARTITION Tem partição
ELEMENT É elemento
TYPE Tipo do dado
SIZE Tamanha do dado
DECIMALS É decimal
DESCRIPTION Descrição do dado
POSITION É dado posicional
Exemplo : (FIELD;KEY;NOT_NULL;PARTITION;ELEMENT;TYPE;SIZE;DECIMALS;DESCRIPTION;POSITION)
Os campos esta com o separador ( ; ), se caso não tiver o dado deixar o campo nulo, por exemplo se caso faltar algum campo.
exemplo falta de campo: (CBTTYPE;;;;FINS_CUSTBTTYPE;CHAR;4;0;Tipo transação comercial personalizado (ainda não utilizado)) como vê neste exemplo trouxe apenas 06 campos.
Exemplo de um catalogo feito:
SQL - temos um exemplo em SQL simples que com ele conseguiremos extrair o catalogo FULL de uma base SQL Server por exemplo. Ele ainda não está completo, mas com ele já é possível evoluir para quem estiver com demandas de SQL Server montar o catalogo de acordo com a origem que está sendo extraído.
SQL_CATALOGO = """
(select
TABLE_NAME as 'table',
COLUMN_NAME as field,
'' as 'key',
case WHEN IS_NULLABLE = 'YES' then 'X' else ' ' end as 'Not Null',
' ' as PARTITION,
' ' as ELEMENT,
DATA_TYPE as type,
CHARACTER_MAXIMUM_LENGTH as size,
NUMERIC_PRECISION as DECIMALS,
' ' as DESCRIPTION,
ORDINAL_POSITION as position
FROM INFORMATION_SCHEMA.Columns) as catalog
"""