Please use this identifier to cite or link to this item: http://hdl.handle.net/10316/100365
Title: Identificação e modelação de redes de reações químicas
Other Titles: Identification and modeling of chemical reaction networks
Authors: Vertis, Carolina dos Santos
Orientador: Oliveira, Nuno Manuel Clemente de
Bernardo, Fernando Pedro Martins
Keywords: Reaction networks; kinetic modeling; chemical reaction; network synthesis; experimental data treatment; Redes reacionais; modelação cinética; reação química; síntese de redes; tratamento de dados experimentais
Issue Date: 19-Apr-2022
Project: Conselho Nacional de Desenvolvimento Científico e Tecnológico, CNPq (scholarship 203592/2014-0) 
Place of publication or event: Coimbra, Portugal
Abstract: Kinetic models provide fundamental information about chemical systems, playing a fundamental role in the development of chemical products, and in the diagnosis and optimization of their respective processes. Despite their central role in Chemical Engineering, these models are sometimes derived based on a postulated set of reactions that supposedly explain observed transformations. One or more mechanistic models are usually suggested. However, the procedures adopted in this task can be based on heuristic aspects and qualitative analysis of the experimental data, producing results that might not be completely satisfactory (and questionable) from the points of view of the structural correctness (reaction network and corresponding kinetic expressions) and the precise/accurate description of the systems analyzed. A systematic methodology is proposed in this thesis for the identification of mathematical models that describe the kinetics of chemical reactions from chemical species concentration data collected in batch experiments. The methodology contemplates 7 steps in which the construction of the model is carried out sequentially, allowing for greater certainty and precision about the identified model. The proposed methodology steps are: (i) experimental data treatment incorporating time-invariant relationships for continuous approximation of discrete data and accurate computation of species fluxes, (ii) data dimension analysis for determining model dimension and thorough understanding of the reaction system topology, (iii) determination of the reaction network superstructure incorporating time-invariant and energetic constraints, and factor analysis for structural model identification, (iv) enumeration of reaction networks using discrete optimization, (v) selection/identification of the network structure using experimental data, (vi) systematic kinetic modeling of the several reaction steps, and (vii) proposal of additional experiment tests based on the model information. Through the incremental model development, the identification of the model structure is performed in an uncoupled manner, first elucidating the structure of the reaction network, and then the structures of the reaction kinetic expressions. Both structure identifications are supported by the differential method, in which linear optimization formulations are used to evaluate the rate of species concentration changes and reaction extents, ensuring the achievement of global optimal solutions. In the first case, from a superstructure of reaction networks, all connections between species are explored, guaranteeing that the best reaction network (composed of an independent set of chemical reactions), describing observed changes in the composition of several species, is found. Regarding chemical reaction kinetics, the identification of the kinetic expressions is performed individually for each reaction step. From a superstructure of reaction kinetic expressions built based on first-principles laws and qualitative analysis of the computed reaction rate profiles, the reaction kinetic expression is identified taking into account the best compromise between fit to experimental data quality and model complexity, according to the Bayesian information criterion Once the structural parts of the model have been identified, the nonlinear final adjustment of model parameters, supported by the integral method, is performed at the end of the methodology using nonlinear optimization, with the advantage of having as initial values for the parameters the ones obtained in the previous step of the methodology (based on the differential method). Thus, in the final phase, the optimal model parameters are obtained according to the maximum likelihood sense, in a simultaneous, bias-free, nonlinear regression procedure. The success of the model structure identification is dependent on good estimates of species fluxes and, consequently, reaction fluxes. For this, a robust data pre-processing method is proposed that incorporates time-invariant relationships as inter-profile constraints, increasing the data accuracy and leading to good fluxes estimates. However, when parts of the model are not satisfactorily identified, additional experimental tests are proposed to elucidate the complete structure of the reaction system under analysis. The development of the proposed methodology is illustrated with the application to four case studies from the literature: the thermal isomerization of alpha-pinene, the catalytic hydrogenation of succinic acid and maleic acid (two separated case studies), and the pharmaceutical case study from Pfizer company. On the basis of the results obtained, it can be concluded that: (i) a systematic model development is required for obtaining models with great confidence that are highly process descriptive and of lower complexity (simpler models) when compared to literature model proposals, (ii) experimental data with high uncertainty may compromise the complete identification of the model structure, requiring additional experiments for allowing a better description of the network structure, (iii) the use of energetic criteria to restrict the network superstructure enables a significant reduction in the number of generated networks, saving time and computational effort in the network synthesis step, (iv) the use of precedence constraints is required for generating consistently connected nonlinear reaction networks, (v) systematic methods for reaction kinetic modeling are essential for accurate model identification, avoiding excessive parameterization and obtaining narrow parameter confidence intervals, (vi) the use of time-invariant relationships in the data reconciliation procedure reduces the noise-to-signal ratio, and consequently increases model identifiability, and (vii) the incorporation of experimental data in the network generation phase to identify plausible structures reduce the number of alternative model candidates to be further analyzed, but at the cost of losing the incremental development of the model. The main contributions of this thesis are: (i) a novel method of data reconciliation, where data approximation is achieved with great accuracy by the incorporation of time-invariant relationships, (ii) mixed-integer linear programming formulations conceived to generate connected linear and nonlinear reaction networks (using precedence constraints), which can be applied to any process synthesis problem described by graphs, (iii) a systematic method for individual reaction kinetic modeling that follows a superstructure-based strategy, enabling the obtainment of parsimonious models, (iv) a methodology for validation of reaction invariants and determination of the data invariant space dimension, and (v) a method for building superstructures of reaction networks considering reaction invariant relationships, energetic criteria, and the checking the consistency of the model with the experimental data. In summary, the proposed methodology is able to identify robust models taking full advantage of experimental data and various optimization techniques. The obtained model increases process knowledge and facilitates process design, scale-up, monitoring, control, and optimization, which, naturally, may be used for improving safety, quality, productivity, and revenues of industrial processes.
Os modelos cinéticos fornecem informações fundamentais sobre os sistemas químicos, desempenhando um papel essencial no desenvolvimento de produtos químicos, bem como no diagnóstico e otimização dos respetivos processos. Apesar de seu papel central na Engenharia Química, esses modelos às vezes são construídos com base num conjunto postulado de reações que supostamente explicam transformações observadas. Normalmente, são sugeridos um ou mais modelos mecanísticos. No entanto, os procedimentos adotados nesta tarefa podem ser baseados em aspectos heurísticos e análise qualitativa dos dados experimentais, produzindo resultados que podem não ser completamente satisfatórios (e questionáveis) do ponto de vista da estrutura do modelo (rede de reações e correspondentes expressões cinéticas) e da descrição precisa/fiável dos sistemas analisados. Um método sistemático é proposto nesta Tese para a identificação de modelos matemáticos que descrevem a cinética das reacções químicas a partir de dados de concentração recolhidos em experiências em regime descontínuo. A metodologia contempla 7 etapas nas quais a construção do modelo é realizada de forma sequencial, permitindo maior certeza e precisão sobre o modelo identificado. As etapas propostas da metodologia são: (i) tratamento de dados experimentais incorporando relações invariantes no tempo para aproximação contínua de dados discretos e computação precisa de fluxos de espécies, (ii) análise de dimensão de dados para determinar a dimensão do modelo e obter uma compreensão completa da topologia do sistema de reação, (iii) determinação da superestrutura da rede de reação incorporando restrições energéticas e invariantes no tempo e análise fatorial para identificação do modelo estrutural, (iv) enumeração de redes de reação usando otimização discreta, (v) seleção/identificação da estrutura da rede usando dados experimentais, (vi) sistemática modelagem da cinética da reação, e (vii) propostas de experimentos adicionais com base nas informações obtidas através do modelo identificado. Através do desenvolvimento do modelo incremental, a identificação da estrutura do modelo é realizada de forma desacoplada, sendo primeiramente elucidada a estrutura da rede de reação e, a seguir, a estrutura da expressão cinética de cada passo reacional. Ambas as identificações estruturais são suportadas pelo método diferencial, no qual abordagens de otimização linear fazem parte do problema de avaliação de fluxos de espécies e reações, assegurando a obtenção de soluções ótimas globais. No primeiro caso, a partir de uma superestrutura de redes de reação, \emph{todas as conexões entre as espécies são exploradas}, garantindo que a melhor rede de reação (composta por um conjunto linearmente independente de reações químicas), que descreve as mudanças na composição de espécies observadas, seja encontrada. Em relação à cinética da reacção química, a identificação das expressões cinéticas é realizada individualmente para cada componente da rede. A partir de uma superestrutura de expressões cinéticas, construída com base em leis de primeiros princípios e análise qualitativa dos perfis de fluxo de reação observados, a expressão cinética é identificada apresentando o melhor compromisso entre qualidade de ajuste aos dados e complexidade do modelo, de acordo com o critério de informação Bayesiano. Uma vez identificadas as partes estruturais do modelo, o ajuste final não linear dos parâmetros do modelo, suportado pelo método integral, é realizado no final da metodologia utilizando otimização não linear, com a vantagem de usar como valores iniciais para os parâmetros aqueles obtidos na etapa anterior da metodologia (com base no método diferencial). O sucesso da identificação da estrutura do modelo depende de boas estimativas dos fluxos de espécies e, consequentemente, dos fluxos de reação. Para isso, é proposto um método robusto de aproximação de dados que incorpora relações invariantes no tempo como restrições entre perfis, aumentando a precisão dos dados e levando a boas estimativas de fluxos. No entanto, quando partes do modelo não são identificadas de forma satisfatória, testes experimentais adicionais são propostos para elucidar a estrutura completa do modelo em análise. O desenvolvimento da metodologia proposta é ilustrado com a aplicação a quatro casos de estudo a partir da literatura: a isomerização térmica de $\alpha$-pineno, as hidrogenações catalíticas de ácido succínico e ácido maleico (dois estudos de caso separados) e o estudo de caso farmacêutico da empresa Pfizer. Com base nos resultados obtidos, pode-se concluir que: (i) é necessário o sistemático desenvolvimento de um modelo para a obtenção de modelos com grande confiança, altamente descritivos do processo e de menor complexidade (modelos mais simples) quando comparados às propostas de modelos da literatura, (ii) dados experimentais com elevada incerteza podem comprometer a identificação completa da estrutura do modelo, exigindo experimentos adicionais para permitir uma melhor descrição da estrutura da rede, (iii) o uso de critérios energéticos para restringir a superestrutura da rede possibilita uma redução significativa do número de redes geradas, economizando tempo e esforço computacional na etapa de síntese da rede, (iv) o uso de restrições de precedência é necessário para gerar redes de reação não lineares que apresentam uma estrura conexa consistente, (v) métodos sistemáticos para modelagem da cinética de reação são fundamentais para a identificação precisa do modelo, por forma a evitar a parametrização excessiva e a obter intervalos de confiança estreitos de parâmetros do modelo, (vi) o uso de relações invariantes no tempo no procedimento de reconciliação de dados reduz o rácio ruído-sinal e, consequentemente, aumenta a identificabilidade do modelo, e (vii) a incorporação de dados experimentais na fase de geração da rede para identificar estruturas plausíveis reduz o número de candidatos a modelos alternativos a serem analisados posteriormente, mas ao custo de perder o desenvolvimento incremental do modelo. As principais contribuições desta tese são: (i) um novo método de reconciliação de dados, onde a aproximação de dados é obtida com grande precisão pela incorporação de relações invariantes no tempo, (ii) formulações de programação linear inteira mista concebidas para gerar redes de reação lineares e não lineares (usando restrições de precedência), que podem ser aplicadas a qualquer problema de síntese de processo descrito por grafos, (iii) um método sistemático para modelagem individual da cinética da reação com base numa superestrutura previamente definida, permitindo a obtenção de modelos parcimoniosos, (iv) uma metodologia para validação de invariantes de reação e determinação da dimensão do espaço das invariantes a partir de dados experimentais, e (v) um método para construir superestruturas de redes de reação considerando relações invariantes de reação, critérios energéticos e a verificação da consistência do modelo com os dados experimentais. Em resumo, a metodologia proposta é capaz de identificar modelos robustos aproveitando ao máximo os dados experimentais e várias técnicas de otimização. O modelo obtido aumenta o conhecimento do processo e facilita o projeto, dimensionamento, monitorização, controlo e otimização do processo, o que, naturalmente, pode ser usado para melhorar a segurança, a qualidade, a produtividade e as receitas de processos industriais.
Description: Tese de Doutoramento em Engenharia Química apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra.
URI: http://hdl.handle.net/10316/100365
Rights: embargoedAccess
Appears in Collections:FCTUC Eng.Química - Teses de Doutoramento
UC - Teses de Doutoramento

Files in This Item:
File Description SizeFormat Login
thesis-corrigido.pdf15.39 MBAdobe PDFEmbargo Access    Request a copy
Show full item record

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons