Golden Batch Fase 2
O objetivo desse projeto é a implementação da metodologia Golden Batch desenvolvido durante a Fase 1. Automatizando o algorítimo para reprodução dos parâmetros de produção ótimos
O Golden Batch pode ser definido como um modo de produção ótimo ou ideal. Isto significa que neste modo, o processo de produção está perfeitamente balanceado e orientado a atingir o máximo lucro. Na definição do Golden Batch é considerado os três principais fatores que influenciam na lucratividade.
A Produtividade
A Qualidade do produto
O Custo do processo
O conceito de Golden Batch serve então para o sistema recriar as condições exatas que anteriormente produziram o lote ideal. Isso requer registrar os valores do processo ao longo do tempo e analisar os dados resultantes para determinar as variáveis críticas. À medida que cada lote é executado, o sistema compara as variáveis críticas com o perfil Golden Batch e faz ajustes para corresponder a esse perfil. Isso resulta em uma produção consistente de produtos de alta qualidade.
O objetivo se resume a encontrar os parâmetros de produção dos lotes mais produtivos e dentro da qualidade especificada e comparar com os demais. O Golden Batch é, portanto, a intersecção dos grupos 20% mais produtivos e dentro da especificação de qualidade.
Fontes de dados
Para a construção do modelo foram utilizados duas fontes de dados distintas, que estava armazenadas no Amazon S3 Storage.
Dados de produção
São dados que trazem as informações referentes ao processo produtivo de cada lote e pode ser verificada em Path: Caminho_para_dados_de_produção
.
Dados laboratório.
Contempla os dados coletados e analisados em laboratório, são, portanto, dados discretos coletados periodicamente. As informações podem ser verificadas na tabela Path: Caminho_para_dados_de_laboratório
.
Modelo construído
Foi construído um modelo capaz de identificar o Golden Batch e apontar suas características que distingue o grupo Golden Batch do Grupo Não Golden Bath.
Golden Batch
Por meio das métricas KS e Fold Change, podemos medir a significância e expressividade de cada parâmetro de produção e utilizar as estatísticas do grupo Golden Batch para construir o intervalo dos valores dos parâmetros de produção a serem adotados.
Deploy e arquitetura da solução
Os modelos e ETL foram desenvolvidos utilizando notebooks no databricks e encontram-se versionados no git do projeto. Os pipes foram criados utilizando o workflow do próprio databricks.