Please use this identifier to cite or link to this item: http://hdl.handle.net/10316/88794
Title: Monitorização e Previsão da Qualidade em Processos Descontínuos: Desenvolvimento de Metodologias de Elevada Granularidade
Other Titles: Batch Process Monitoring and Quality Prediction: Development of Coarse-Grained Data-Driven Methodologies
Authors: Rendall, Ricardo Alberto Reis Silva
Orientador: Reis, Marco Paulo Seabra dos
Keywords: Batch Processes; Data-Driven Methodologies; Feature-Oriented Methods; Processos Descontínuos; Abordagens baseadas em Dados
Issue Date: 13-Sep-2019
Project: SFRH/BD/123704/2016 
Place of publication or event: Coimbra
Abstract: As primeiras abordagens holísticas para análise de dados de processos descontínuos foram propostas há cerca de duas décadas e focavam-se essencialmente no controlo estatístico de processos e na previsão da qualidade. Desde então, novos métodos foram propostos, com diferentes níveis de sucesso e aceitação prática. Uma análise detalhada destas contribuições revela que elas possuem diferentes níveis de complexidade, tanto em termos dos graus de liberdade utilizados no desenvolvimento dos modelos (complexidade do modelo) como em termos do conhecimento necessário para aplicá-los autonomamente (complexidade de implementação). Estas dimensões contribuem decisivamente para o impacto de uma dada metodologia na indústria, no entanto, a literatura recente da análise de dados de processos descontínuos tende a favorecer métodos cada vez mais complexos. Esses métodos denominam-se por abordagens de baixa granularidade uma vez que a dimensão do tempo é explicitamente incorporada no modelo e requerem técnicas de pré- processamento complexas (alta complexidade de implementação) e conduzem a modelos com um elevado número de parâmetros (modelos complexos). Por outro lado, abordagens alternativas mais simples, mas que também são robustas e eficazes, têm sido em grande parte negligenciadas. Estes métodos sumariam a evolução do lote em algumas quantidades denominadas por features, compactando ou mesmo removendo a dimensão temporal. Assim sendo, eles denominam-se por abordagens de elevada granularidade e constituem o tema principal desta tese. Mais especificamente, um novo método, denominado por profile-driven features (PdF) foi desenvolvido, testado e comparado com abordagens alternativas. A comparação aborda muitas das tarefas típicas da análise de dados, nomeadamente a análise exploratória de dados, a monitorização de processos e a previsão da qualidade. É demonstrado que o método PdF extrai características específicas das trajetórias das variáveis e conduz a resultados similares ou superiores aos obtidos com métodos mais complexos. Os métodos baseados em features são também integrados e unificados numa plataforma analítica (designada FOBA, feature-oriented batch analytics framework) que demonstra como esses métodos podem ser utilizados para auxiliar profissionais em suas atividades diárias. Outro tópico discutido nesta tese refere-se à necessidade de aplicar métodos eficientes para a seleção de features. Esta necessidade advém do facto de muitas features conterem elevados níveis de ruído ou serem até irrelevantes num dado contexto de previsão. Assim sendo, uma nova abordagem para a seleção de features é proposta. Esta abordagem denomina-se por wide spectrum feature selection (WiSe). Na primeira etapa, várias métricas de importância são utilizadas para detetar e selecionar preditores relevantes. Na segunda etapa, métodos preditivos que também possuem mecanismos automáticos para a seleção de features são utilizados. Consequentemente, os modelos desenvolvidos tendem a ser mais parcimoniosos, robustos e com melhor desempenho na previsão. Estas vantagens são verificadas num conjunto de casos de estudos que demonstram a eficácia do método em diferentes cenários de aplicação. O último tópico discutido nesta tese aborda o desenvolvimento de uma plataforma de seleção métodos de previsão denominada predictive analytics comparison framework (PAC). As features calculadas a partir das trajetórias das variáveis de processo são frequentemente utilizadas na previsão de parâmetros de qualidade. No entanto, o desenvolvimento de modelos é frequentemente condicionado pela difícil tarefa de selecionar o melhor método para uma dada aplicação. Este processo de seleção é frequentemente dificultado por um escasso conhecimento prévio sobre as características e os mecanismos que geram os dados e, portanto, a escolha tende a ser subótima. Em tais cenários, o utilizador muitas vezes seleciona o seu método preferido sem uma análise prévia de outros métodos (e outras classes de métodos), potencialmente melhores. PAC é uma plataforma concebida para lidar com esses cenários, pois inclui uma ampla variedade de métodos e avalia os seus desempenhos utilizando métricas de comparação robustas baseadas em testes estatísticos de hipóteses. Além disso, a PAC produz resultados intuitivos, permitindo a identificação do melhor método e quais as features mais importantes que influenciam a resposta. Esta metodologia foi aplicada a uma variedade de casos de estudo, contemplando dados simulados e reais, e os resultados demonstraram que o processo de desenvolvimento do modelo é mais expedito e eficaz, e que em paralelo, permite obter mais informação relevante sobre o problema.
The first holistic approaches for batch data analysis were proposed around two decades ago, with an emphasis on statistical process control and quality prediction. In the subsequent years, more methods were proposed, with varying degrees of success and acceptance by practitioners. A detailed and comprehensive analysis of these contributions reveals different complexity levels, both in terms of the degrees of freedom used for setting up the techniques (modeling complexity) and the expertise/training required by practitioners to autonomously apply them in concrete real world applications (implementation complexity). Both dimensions decisively contribute to the impact of a given proposal in industry but, analyzing carefully the technical literature, it is possible to notice a rather clear trend towards increasingly complex batch data analysis methods. These methods are named fine-grained approaches since the time dimension is explicitly transposed and incorporated in the data-driven model. To this end, they require intricate pre-processing techniques (high implementation complexity) and a high number of model parameters (high modeling complexity). On the other hand, alternative approaches that are simpler, but also more robust and potentially effective have been largely overlooked. These methods often summarize the batch evolution in fewer quantities called features and compress or remove the time dimension from data-driven model building. Therefore, they are named coarse-grained approaches. Coarse-grained methods, and feature-oriented methods in particular, constitute the main focus of this thesis and an effort is made to develop and unify all the available methodologies belonging to this category. More specifically, a novel feature-oriented method, named profile-driven features (PdF), is developed, tested, and compared to benchmark alternatives. The comparison considers many of the important tasks that are routinely conducted in batch data analysis, such as exploratory data analysis, process monitoring, and quality prediction. It is shown that PdF extracts specific features from the trajectories of the process variables and can provide results that are either on par or better when compared to those obtained with more complex methods. Afterwards, feature-oriented methods are integrated and unified into a batch analytics framework called FOBA, demonstrating how these methods can be utilized in assisting practitioners with their daily activities. Furthermore, an extension of FOBA is also developed to increase the flexibility of feature-oriented methods and identify important periods of the batch evolution. Another topic discussed in this thesis refers to the need to employ efficient feature selection procedures when analyzing batch datasets. This stems from the fact that there can be many features available for data-driven model building; however, many of them are highly noisy or may be even irrelevant to the predictive task at hand. In this context, a new two-stage approach, called wide spectrum feature selection (WiSe), is proposed to remove noisy and irrelevant features. In the first stage of WiSe, various metrics of feature importance are employed in order to detect relevant predictors and select them. In the second stage, predictive methods that have built-in mechanisms for feature selection are utilized to further reduce the number of features. Consequently, the developed models tend to be more parsimonious, with the consequent advantages on increased robustness and improved prediction performance. This was confirmed by a series of case studies that -dimensional scenarios. The last topic discussed in this thesis covers the development of a predictive analytics comparison framework (PAC) for assessing the performance of predictive methods. The features computed from batch trajectories can be utilized for predicting important quality parameters; however, during data-driven model building, practitioners face the challenging task of selecting the best method for their application. This selection process is frequently constrained by limited a priori knowledge about the characteristics and mechanisms generating the data and, therefore, prone to be sub-optimal. In such scenarios, practitioners often choose their preferred method(s) without a proper assessment of other methods (and other classes of methods) that may bring predictive advantages. PAC is a platform for these scenarios since it considers a wide variety of methods and assesses their performance using robust comparison metrics based on statistical hypothesis testing. Furthermore, PAC provides output results in a user-friendly fashion, allowing the identification of the best method(s) and the most important features influencing quality. PAC was applied to a variety of case studies, covering simulated and real world datasets, and the results demonstrate its benefits in providing insights into the prediction problem at hand as well as speeding up the process of model screening and development.
Description: Tese no âmbito do Doutoramento em Engenharia Química e apresentada ao departamento de Engenharia Química da Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI: http://hdl.handle.net/10316/88794
Rights: openAccess
Appears in Collections:FCTUC Eng.Química - Teses de Doutoramento
UC - Teses de Doutoramento

Show full item record

Page view(s)

46
checked on Sep 21, 2020

Download(s)

29
checked on Sep 21, 2020

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons