3. Modelagem de Máquinas rotativas
4.3. Expansão do Caos Polinomial
Métodos de Monte Carlo, geralmente, possuem implementação direta e, até certo ponto, fácil. No entanto, devido a necessidade de um número grande de amostras, o método está sujeito ao tempo de processamento de cada amostra. Se o algoritmo utilizado consumir um longo período de processamento, a aplicação de um método de Monte Carlo pode ser inviável. Wiener (1938) mostra que uma expansão de polinômios de Hermite pode aproximar um processo Gaussiano, chamado de Caos Homogêneo. Anos depois, Cameron e Martin (1947) provam que a expansão destes polinômios apresenta convergência ótima para processos Gaussianos. Estas expansões polinomiais são modelos substitutos (surrogate models, em
inglês) do problema estocástico e permitem que cálculos sejam feitos de forma mais rápida a partir deles.
Xiu e Karniadakis (2002) expandem a ideia de Wiener para outras famílias de polinômios. Os autores perceberam que alguns dos polinômios que pertencem ao esquema de Askey também podem ser utilizados para gerar uma base polinomial para aproximar a solução estocástica.
4.3.1. Esquema de Askey
O esquema de Askey classifica os polinômios hipergeométricos ortogonais e os relaciona. Os polinômios são separados em contínuos e discretos. As conexões entre os polinômios diferentes representam a fronteira entre cada um deles, desta forma, o polinômio mais baixo pode ser obtido pelo limite de um dos parâmetros do polinômio logo acima, como apresentado na Figura 4.2. Por exemplo o limite do polinômio de Jacobi 𝑃𝑛(𝛼,𝛽) é o polinômio de Hermite 𝐻𝑛(𝑥). lim 𝛼→∞𝛼 −12𝑛𝑃 𝑛(𝛼,𝛼)( 𝑥 √𝛼) = 𝐻𝑛(𝑥) 2𝑛𝑛! (4.12)
Os polinômios podem ser obtidos a partir da série hipergeométrica generalizada:
𝐹𝑟,𝑠(𝑎1, … 𝑎𝑟; 𝑏1, … 𝑏𝑠; 𝑧) = ∑(𝑎1)𝑘⋯ (𝑎𝑟)𝑘 (𝑏1)𝑘⋯ (𝑏𝑠)𝑘 ∙ 𝑧𝑘 𝑘! ∞ 𝑘=1 (4.13)
Sendo (𝑎)𝑛 o símbolo de Pochammer
(𝑎)𝑛 = {
1 𝑠𝑒 𝑛 = 0
Figura 4.2 – Esquema de Askey
Desta forma 𝑏𝑖 deve ser maior que zero, para garantir que o denominador não seja igual a zero. E se um parâmetro 𝑎𝑖 = −𝑛 for um inteiro negativo, a série termina no n-ésimo
termo e será um polinômio em 𝑧, com a forma:
𝐹𝑟,𝑠(−𝑛, … 𝑎𝑟; 𝑏1, … 𝑏𝑠; 𝑧) = ∑ (−n)𝑘⋯ (𝑎𝑟)𝑘 (𝑏1)𝑘⋯ (𝑏𝑠)𝑘 ∙𝑧 𝑘 𝑘! 𝑛 𝑘=1 (4.15)
Os polinômios contidos no esquema estão sujeitos as relações de ortogonalidade para polinômios contínuos, Equação (4.16), e discretos, (4.17), as quais também são o produto interno do espaço de polinômios. Estas equações também são o produto interno do espaço Hilbertiano em que os polinômios estão contidos. Nesta tese, serão consideradas apenas famílias de polinômios contínuos.
〈𝑄𝑛(𝜆), 𝑄𝑚(𝜆)〉 = ∫ 𝑄𝑛(𝜆)𝑄𝑚(𝜆)𝑤(𝜆)𝑑𝜆 𝑆 = ℎ𝑛2𝛿𝑚𝑛, 𝑚, 𝑛 ∈ ℕ (4.16) 〈𝑄𝑛(𝜆), 𝑄𝑚(𝜆)〉 = ∑ 𝑄𝑛(𝜆𝑖)𝑄𝑚(𝜆𝑖)𝑤(𝜆𝑖) 𝑀 𝑖=1 = ℎ𝑛2𝛿𝑚𝑛, 𝑚, 𝑛 ∈ ℕ (4.17)
O termo ℎ𝑛2 é dado por 〈𝑄𝑛(𝑥), 𝑄𝑛(𝑥)〉 e 𝛿𝑚𝑛 é o delta de Kronecker:
𝛿𝑚𝑛 = {0 , 𝑚 ≠ 𝑛
1, 𝑚 = 𝑛 (4.18)
4.3.2. Expansão do Caos Polinomial
Seja Pe(𝜆) um processo estocástico de segunda ordem, ou seja, com média e variância finitos. Este processo pode ser representado por uma soma infinita de polinômios, como mostrado na Equação (4.19).
𝑃𝑒(𝜆) = 𝑐0𝐼0+ ∑ 𝑐𝑖1𝐼1(𝜆𝑖1) ∞ 𝑖1=1 + ∑ ∑ 𝑐𝑖1𝑖2𝐼2(𝜆𝑖1, 𝜆𝑖2) 𝑖1 𝑖2=1 ∞ 𝑖1=1 + ∑ ∑ ∑ 𝑐𝑖1𝑖2𝑖3𝐼3(𝜆𝑖1, 𝜆𝑖2, 𝜆𝑖3) 𝑖2 𝑖3=1 𝑖1 𝑖2=1 ∞ 𝑖1=1 + ⋯ (4.19)
𝐼𝑛(𝜆𝑖1, … , 𝜆𝑛) denota o caos polinomial de ordem 𝑛 em termos do vetor aleatório 𝜆 = (𝜆𝑖1, … , 𝜆𝑛) . Diferente da expansão de Wiener, a expansão de Wiener-Askey não se restringe ao polinômio de Hermite, mas se aplica a todos os polinômios ortogonais do esquema de Askey. Por conveniência a Equação(4.19) pode ser reescrita como
𝑃𝑒(𝜆) = ∑ 𝑐̂𝑗Φ𝑗(𝜆) ∞
𝑗=0
na qual há correspondência direta entre as funções 𝐼n(𝜆𝑖1, … 𝜆𝑖n) e Φ𝑗(𝜆) . Os polinômios que constroem a base polinomial pertencem ao esquema de Askey, portanto respeitam a relação de ortogonalidade da Equação (4.16). Para fins de aplicação, a série deve ser truncada. Para o caso de apenas uma variável aleatória, a série é truncada no termo que contém o polinômio de grau 𝑃, mostrada na Equação (4.21) .
𝑃𝑒𝑃(𝜆) = ∑ 𝑐̂ 𝑗Φ𝑗(𝜆) 𝑃
𝑗=0
(4.21)
A função de ponderação destes polinômios 𝑤(𝜆), da Equação (4.16), são similares à função densidade de probabilidade de algumas variáveis aleatórias. Por exemplo, a função de ponderação presente na relação dos polinômios de Hermite é similar a função densidade de probabilidade de uma variável Gaussiana padrão, média igual a 0 e variância igual a 1, como mostra a Equação (4.22). Assim, é possível afirmar que os polinômios também são ortogonais ao espaço que contém as variáveis aleatórias, o que permite a utilização deles para a aproximação do processo estocástico. A Tabela 4.1 apresenta a relação entre algumas famílias de polinômios e variáveis aleatórias.
𝑤(𝜆) = 1 √𝜋𝑒 −𝜆2 (4.22) 𝑓(𝜆) = 1 √2𝜋𝑒 −𝜆 2 √2
Para o caso de um problema com 𝑁 variáveis aleatórias independentes, a base polinomial é construída a partir do produto tensorial de polinômios univariáveis, referentes a cada variável aleatória do problema.
Seja o multi-índice 𝑑𝑗 = {𝑑1, 𝑑2, … 𝑑𝑁}, composto pelos graus dos polinômios univariáveis, a base polinomial multivariável é construída através do produto tensorial:
{Φ} = ⊗
Cada elemento da base multivariável será o produto de 𝑁 polinômios com graus definidos por 𝑑𝑗. O processo estocástico multivariável será aproximado pela série truncada:
𝑃𝑒𝑁𝑃({𝜆}) = ∑ 𝑐̂𝑗Φ𝑗({𝜆}) 𝑀
𝑗=0
𝑀 = (𝑁 + 𝑃
𝑁 ) (4.24)
As bases multivariáveis ainda possuem as propriedades de ortogonalidade e são ortogonais à distribuição de probabilidade conjunta 𝜌({λ}) = 𝜌(𝜆1) ∙ 𝜌(𝜆2) ⋯ 𝜌(𝜆𝑁).
Tabela 4.1 – Correspondência entre o tipo da variável aleatória e o caos polinomial de Wiener-Askey (𝑁 ≥ 0 é um inteiro finito)
Variável aleatória 𝜁 Caos polinomial de
Wiener-Askey Φ(𝜁) Suporte Continua Gaussiana Hermite (−∞, ∞) Gama Laguerre [0, ∞) Beta Jacobi [𝑎, 𝑏] Uniforme Legendre [𝑎, 𝑏] Discreta Poisson Charlier {0,1,2, … } Binomial Krawtchouk {0,1,2, … , 𝑁}
Binomial negativa Meixner {0,1,2, … }
Hipergeométrica Hahn {0,1,2, … , 𝑁}
Por exemplo, para o caso de um processo com 2 variáveis aleatórias e com grau dos polinômios máximo 2. Para cada variável, a sua base será composta pelos polinômios: 𝜙0(𝜆),
𝜙1(𝜆) e 𝜙2(𝜆). Utilizando o produto tensorial da Equação (4.23), obtém-se a base para 2 variáveis com 6 termos:
{ 𝜙0(𝜆1) ∙ 𝜙0(𝜆2) 𝜙1(𝜆1) ∙ 𝜙0(𝜆2) 𝜙2(𝜆1) ∙ 𝜙0(𝜆2) 𝜙0(𝜆1) ∙ 𝜙1(𝜆2) 𝜙0(𝜆1) ∙ 𝜙2(𝜆2) 𝜙1(𝜆1) ∙ 𝜙1(𝜆2)}
Com a determinação da base polinomial, o problema passa ser a estimativa dos coeficientes de expansão 𝑐̂𝑗. O fluxo da Figura 4.3, apresenta o processo de solução do problema
Figura 4.3 – Fluxograma do processo de solução por Expansão Polinomial do Caos generalizado
Os métodos de Colocação estocástica e Galerkin estocástico podem ser utilizados para calcular os coeficientes de expansão. Vantagens e desvantagens de ambos os métodos serão discutidas a seguir.
4.3.3. Colocação estocástica
Assim como os métodos de Monte Carlo, esta forma de estimar os coeficientes de colocação precisa de um gerador de amostras e um algoritmo que possa resolver o problema determinístico. Métodos que utilizam estes algoritmos do problema determinístico são chamados de “não intrusivos”, pois não alteram a natureza do problema determinístico original. O método propõe a estimação dos coeficientes da expansão polinomial através da solução de um sistema linear, apresentado pela Equação (4.25). São geradas 𝑄 amostras de {𝜆}, resolve-se o problema determinístico 𝑆({𝑥}, {𝜆}𝑖) e cada termo da expansão polinomial Φ𝑗({𝜆}𝑖) para cada amostra. Utilizou-se o método de mínimos quadrados, Equação (4.26), para
a solução do sistema linear.
[ Φ1({𝜆}1) ⋯ Φ𝑀({𝜆}1) ⋮ ⋱ ⋮ Φ1({𝜆}𝑄) ⋯ Φ 𝑀({𝜆}𝑄) ] ∙ { 𝑐̂1 ⋮ 𝑐̂𝑀 } = { 𝑆({𝑥}, {𝜆}1) ⋮ 𝑆({𝑥}, {𝜆}𝑄) } (4.25) {𝑐̂𝑗} = ([Φ𝑗({𝜆}𝑖)]𝑇[Φ𝑗({𝜆}𝑖)])−1∙ [Φ𝑗({𝜆}𝑖)]𝑇∙ {𝑆({𝑥}, {𝜆}𝑖)} (4.26)
A diferença entre o método de colocação e Monte Carlo, está na escolha das amostras. Em ambos, é possível a utilização de escolhas aleatórias e hipercubo latino (em inglês, Latin Hypercube Space). Já o método de colocação permite a utilização de regras de
quadratura para a escolha das amostras. Outra vantagem do método em relação à Monte Carlo, é o número de amostras menor. Devido ao fato que se deseja estimar os coeficientes de expansão de uma série polinomial e não os dados estatísticos de um processo estocástico, geralmente, mais complexo. É recomendado um número de amostras de 2 a 3 vezes maior que o número de termos da expansão 𝑀. O método de grade esparsa, proposto por Ganapathysubramanian e Zabaras (2007), cuja teoria está presente no Anexo E, foi usado para a escolha de pontos para a solução do sistema linear da Colocação Estocástica.
No entanto, o método pode sofrer da maldição de dimensionalidade (em inglês,
Curse of dimensionality). Com o aumento do número de amostras aleatórias, o número de
termos necessários na expansão aumenta exponencialmente, fazendo, para problemas com um número elevado de variáveis aleatórias, o número de amostras necessárias para o método de colocação praticamente semelhante ao número que um método de Monte Carlo usaria.
4.3.4. Galerkin estocástico
O método de Galerkin estocástico é similar ao método de Galerkin determinístico. Buscam-se coeficientes de expansão que minimizem a diferença entre a solução e a série polinomial.
Diferente dos métodos de colocação estocástica e de Monte Carlo, o método de Galerkin estocástico é intrusivo. Ou seja, o método faz com que não seja possível utilizar algoritmos que calculam a solução do problema determinístico.
Seja a equação de movimento da Equação(4.27) representada com um operador derivativo ℒ, como na Equação (4.27), sendo 𝑥 as variáveis de entrada não aleatórias, 𝜆 as variáveis de entrada aleatórias, 𝑞 a solução, 𝑡 o tempo e {𝐹} o vetor de forças externas.
ℒ(𝑥, 𝜆, 𝑞; 𝑡) − {𝐹} = 0 (4.27)
Aproximando a solução por uma série e aplicando produto interno, tem-se:
∫ (ℒ (𝑥, 𝜆, ∑ 𝑐̂𝑗Φ𝑗({𝜆})
𝑀
𝑗=0
Desta forma, é obtido um sistema de equações parciais diferenciais acopladas. A solução são os coeficientes da expansão e, assim, a aproximação da resposta estocástica. No entanto, a solução do sistema obtido na Equação (4.28) não é trivial e, se o problema determinístico original possuir uma solução complexa, a solução do sistema pode ser impossível. Este é o caso de máquinas rotativas, modelos complexos de solução difícil.
Através de regras de quadratura, a integral da Equação (4.28) pode ser aproximada por uma soma. Desta forma, é possível a utilização de algoritmos de solução do problema determinístico 𝑆. São determinados 𝑄 pontos {𝜆}𝑖 e seus respectivos pesos de quadratura 𝛼𝑖 e os coeficientes de expansão podem ser estimado através da Equação (4.29). Estabelecendo, assim, um método de Galerkin não intrusivo.
𝑐̂𝑗 = ∑ 𝑆({𝑥}, {𝜆}𝑖) ∙ 𝑄
𝑖=1
Φ𝑗({𝜆}𝑖) ∙ 𝛼𝑖 (4.29)
4.3.5. Verificação de convergência da expansão polinomial
A verificação de convergência da expansão polinomial do caos generalizado varia com o método de estimação dos coeficientes escolhido. Para todos os métodos, é possível uma comparação com as funções de densidade de probabilidade, função cumulativa de probabilidade e dados estatísticos, como média e variância, estimados pelo método de Monte Carlo.
Para o caso da utilização do método de Galerkin intrusivo, não há necessidade de um método de verificação de convergência. A solução do método já é a ótima para o grau máximo do polinômio escolhido, o erro numérico estaria no método escolhido para a solução do sistema de equações. Apesar da convergência ótima, a aplicação do método de Galerkin em modelos estocásticos de máquinas rotativas é difícil, pois os modelos são complexos e a solução do sistema é impraticável.
No caso de métodos não intrusivos, os quais utilizam pontos predeterminados, é feita uma validação parecida com a de técnicas de machine learning. Escolhe-se parte dos pontos predeterminados que não serão utilizados para a estimação dos coeficientes. Após a estimação dos coeficientes de expansão, calcula-se o resultado da expansão polinomial e da solução determinística nos pontos separados anteriormente e estes resultados são comparados.
Após a validação, a expansão polinomial pode ser utilizada como uma aproximação do problema estocástico e dados estatísticos e outras análises podem ser feitas.
4.3.6. Informações estatísticas
Após a determinação dos coeficientes de expansão, informações estatísticas podem diretamente calculadas devido as propriedades ortogonais dos polinômios, como mostram as eqs. (4.30) e (4.31)para a média e variância, respectivamente.
𝔼[𝑃𝑒] ≈ 𝔼[𝑃𝑒𝑁𝑃] = ∫ ∑ 𝑐̂jΦ𝑗({𝜆}) 𝑀 𝑗=1 𝜌(𝜆)𝑑𝜆 = ⋯ ⋯ = ∫ (∑ 𝑐̂jΦ𝑗({𝜆}) 𝑀 𝑗=1 ) ∙ 1 ∙ 𝜌(𝜆)𝑑𝜆 = 𝑐̂1 (4.30) 𝑉𝑎𝑟(𝑃𝑒) = 𝔼[(𝑃𝑒 − 𝔼[𝑃𝑒])2] ≈ 𝔼[(𝑃𝑒𝑁𝑃− 𝔼[𝑃𝑒 𝑁𝑃])2] = ⋯ ⋯ = 𝔼[(𝑃𝑒𝑁𝑃− 𝑐̂ 1)2] = ∫ (∑ 𝑐̂jΦ𝑗({𝜆}) 𝑀 𝑗=1 − 𝑐̂1) 2 𝜌(𝜆)𝑑𝜆 = ⋯ ⋯ = ∫ (∑ 𝑐̂jΦ𝑗({𝜆}) 𝑀 𝑗=2 ) 2 𝜌(𝜆)𝑑𝜆 = ∑ 𝑐𝑗2 𝑀 𝑗=2 (4.31)
4.3.7. Implementação da Expansão do Caos Polinomial
A implementação da expansão foi feita em MATLAB. Optou-se por esta linguagem devido a familiaridade com ela. Para aproveitar as implementações de modelos de máquinas rotativas desenvolvidas no Laboratório de Máquinas Rotativas (LAMAR), optou-se por criar uma função que permite utilizar estas implementações já desenvolvidas. O algoritmo desta função é apresentado a seguir:
1. Entradas:
a. Modelo: Programa para a solução do problema determinístico; b. Variáveis de saída: Nome das variáveis de saída que se deseja
calcular a resposta estocástica c. Nível da grade de pontos d. Grau máximo dos Polinômios e. Número de variáveis aleatórias
f. Variáveis aleatórias
• Nome da variável no Modelo
• Tipo (gaussiana, uniforme, gama etc.) • Parâmetro 1 da distribuição
• Parâmetro 2 da distribuição
2. Gerar pontos/amostras a serem calculados pelo Modelo
3. Verificar se há conjunto de resultados para as entradas fornecidas a. Sim: Pular para 5
b. Não: Ir para 5
4. Calcular a solução para cada ponto/amostra utilizando o Modelo fornecido e armazenando as Varáveis de saída
5. Gerar base polinomial.
6. Calcular matriz dos polinômios 7. Resolver sistema linear
8. Calcular média e variância a partir dos coeficientes 9. Salvar resultados
A saída deste algoritmo são os pontos calculados, a base polinomial, os coeficientes de expansão, média e variância da resposta estocástica.
Os resultados dos polinômios podem ser obtidos através de somatórias. O polinômio de Hermite é mostrado na Equação (4.26), como exemplo. Assim, foi necessário armazenar apenas os graus de cada polinômio de cada termo da base polinomial e as somatórias. Não foi necessário armazenar cada polinômio em diferentes graus.
𝐻𝑛(𝑥) = 𝑛! ∙ ∑ −1 𝑚∙ (2𝑥)𝑛−2𝑚 𝑚! ∙ (𝑛 − 2𝑚)! ⌊𝑛2⌋ 𝑚=0 (4.32) onde ⌊𝑛
2⌋ é o arredondamento para o menor inteiro.
A partir dos coeficientes, a análise de sensibilidade pode ser realizada.