Expansão do Caos Polinomial - Modelagem de Máquinas rotativas

3. Modelagem de Máquinas rotativas

4.3. Expansão do Caos Polinomial

Métodos de Monte Carlo, geralmente, possuem implementação direta e, até certo ponto, fácil. No entanto, devido a necessidade de um número grande de amostras, o método está sujeito ao tempo de processamento de cada amostra. Se o algoritmo utilizado consumir um longo período de processamento, a aplicação de um método de Monte Carlo pode ser inviável. Wiener (1938) mostra que uma expansão de polinômios de Hermite pode aproximar um processo Gaussiano, chamado de Caos Homogêneo. Anos depois, Cameron e Martin (1947) provam que a expansão destes polinômios apresenta convergência ótima para processos Gaussianos. Estas expansões polinomiais são modelos substitutos (surrogate models, em

inglês) do problema estocástico e permitem que cálculos sejam feitos de forma mais rápida a partir deles.

Xiu e Karniadakis (2002) expandem a ideia de Wiener para outras famílias de polinômios. Os autores perceberam que alguns dos polinômios que pertencem ao esquema de Askey também podem ser utilizados para gerar uma base polinomial para aproximar a solução estocástica.

4.3.1. Esquema de Askey

O esquema de Askey classifica os polinômios hipergeométricos ortogonais e os relaciona. Os polinômios são separados em contínuos e discretos. As conexões entre os polinômios diferentes representam a fronteira entre cada um deles, desta forma, o polinômio mais baixo pode ser obtido pelo limite de um dos parâmetros do polinômio logo acima, como apresentado na Figura 4.2. Por exemplo o limite do polinômio de Jacobi 𝑃_𝑛(𝛼,𝛽) é o polinômio de Hermite 𝐻_𝑛(𝑥). lim 𝛼→∞𝛼 −1₂𝑛_𝑃 𝑛(𝛼,𝛼)( 𝑥 √𝛼) = 𝐻𝑛(𝑥) 2𝑛_𝑛! (4.12)

Os polinômios podem ser obtidos a partir da série hipergeométrica generalizada:

𝐹_𝑟,𝑠(𝑎₁, … 𝑎_𝑟; 𝑏₁, … 𝑏_𝑠; 𝑧) = ∑(𝑎1)𝑘⋯ (𝑎𝑟)𝑘 (𝑏₁)_𝑘⋯ (𝑏_𝑠)_𝑘 ∙ 𝑧𝑘 𝑘! ∞ 𝑘=1 (4.13)

Sendo (𝑎)𝑛 o símbolo de Pochammer

(𝑎)𝑛 = {

1 𝑠𝑒 𝑛 = 0

Figura 4.2 – Esquema de Askey

Desta forma 𝑏_𝑖 deve ser maior que zero, para garantir que o denominador não seja igual a zero. E se um parâmetro 𝑎𝑖 = −𝑛 for um inteiro negativo, a série termina no n-ésimo

termo e será um polinômio em 𝑧, com a forma:

𝐹𝑟,𝑠(−𝑛, … 𝑎𝑟; 𝑏1, … 𝑏𝑠; 𝑧) = ∑ (−n)_𝑘⋯ (𝑎_𝑟)_𝑘 (𝑏1)𝑘⋯ (𝑏𝑠)𝑘 ∙𝑧 𝑘 𝑘! 𝑛 𝑘=1 (4.15)

Os polinômios contidos no esquema estão sujeitos as relações de ortogonalidade para polinômios contínuos, Equação (4.16), e discretos, (4.17), as quais também são o produto interno do espaço de polinômios. Estas equações também são o produto interno do espaço Hilbertiano em que os polinômios estão contidos. Nesta tese, serão consideradas apenas famílias de polinômios contínuos.

〈𝑄𝑛(𝜆), 𝑄𝑚(𝜆)〉 = ∫ 𝑄𝑛(𝜆)𝑄𝑚(𝜆)𝑤(𝜆)𝑑𝜆 𝑆 = ℎ𝑛2𝛿𝑚𝑛, 𝑚, 𝑛 ∈ ℕ (4.16) 〈𝑄_𝑛(𝜆), 𝑄_𝑚(𝜆)〉 = ∑ 𝑄_𝑛(𝜆_𝑖)𝑄_𝑚(𝜆_𝑖)𝑤(𝜆_𝑖) 𝑀 𝑖=1 = ℎ_𝑛2𝛿_𝑚𝑛, 𝑚, 𝑛 ∈ ℕ (4.17)

O termo ℎ𝑛2 é dado por 〈𝑄𝑛(𝑥), 𝑄𝑛(𝑥)〉 e 𝛿𝑚𝑛 é o delta de Kronecker:

𝛿_𝑚𝑛 = {0 , 𝑚 ≠ 𝑛

1, 𝑚 = 𝑛 (4.18)

4.3.2. Expansão do Caos Polinomial

Seja Pe(𝜆) um processo estocástico de segunda ordem, ou seja, com média e variância finitos. Este processo pode ser representado por uma soma infinita de polinômios, como mostrado na Equação (4.19).

𝑃𝑒(𝜆) = 𝑐₀𝐼₀+ ∑ 𝑐_𝑖1𝐼₁(𝜆_𝑖₁) ∞ 𝑖1=1 + ∑ ∑ 𝑐_𝑖₁_𝑖₂𝐼₂(𝜆_𝑖₁, 𝜆_𝑖₂) 𝑖1 𝑖2=1 ∞ 𝑖1=1 + ∑ ∑ ∑ 𝑐_𝑖₁_𝑖₂_𝑖₃𝐼₃(𝜆_𝑖₁, 𝜆_𝑖₂, 𝜆_𝑖₃) 𝑖2 𝑖3=1 𝑖1 𝑖2=1 ∞ 𝑖1=1 + ⋯ (4.19)

𝐼_𝑛(𝜆_𝑖₁, … , 𝜆_𝑛) denota o caos polinomial de ordem 𝑛 em termos do vetor aleatório 𝜆 = (𝜆_𝑖₁, … , 𝜆_𝑛) . Diferente da expansão de Wiener, a expansão de Wiener-Askey não se restringe ao polinômio de Hermite, mas se aplica a todos os polinômios ortogonais do esquema de Askey. Por conveniência a Equação(4.19) pode ser reescrita como

𝑃𝑒(𝜆) = ∑ 𝑐̂𝑗Φ𝑗(𝜆) ∞

𝑗=0

na qual há correspondência direta entre as funções 𝐼_n(𝜆_𝑖₁, … 𝜆_𝑖_n) e Φ_𝑗(𝜆) . Os polinômios que constroem a base polinomial pertencem ao esquema de Askey, portanto respeitam a relação de ortogonalidade da Equação (4.16). Para fins de aplicação, a série deve ser truncada. Para o caso de apenas uma variável aleatória, a série é truncada no termo que contém o polinômio de grau 𝑃, mostrada na Equação (4.21) .

𝑃𝑒𝑃_{(𝜆) = ∑ 𝑐̂} 𝑗Φ𝑗(𝜆) 𝑃

𝑗=0

(4.21)

A função de ponderação destes polinômios 𝑤(𝜆), da Equação (4.16), são similares à função densidade de probabilidade de algumas variáveis aleatórias. Por exemplo, a função de ponderação presente na relação dos polinômios de Hermite é similar a função densidade de probabilidade de uma variável Gaussiana padrão, média igual a 0 e variância igual a 1, como mostra a Equação (4.22). Assim, é possível afirmar que os polinômios também são ortogonais ao espaço que contém as variáveis aleatórias, o que permite a utilização deles para a aproximação do processo estocástico. A Tabela 4.1 apresenta a relação entre algumas famílias de polinômios e variáveis aleatórias.

𝑤(𝜆) = 1 √𝜋𝑒 −𝜆2 (4.22) 𝑓(𝜆) = 1 √2𝜋𝑒 −𝜆 2 √2

Para o caso de um problema com 𝑁 variáveis aleatórias independentes, a base polinomial é construída a partir do produto tensorial de polinômios univariáveis, referentes a cada variável aleatória do problema.

Seja o multi-índice 𝑑_𝑗 = {𝑑₁, 𝑑₂, … 𝑑_𝑁}, composto pelos graus dos polinômios univariáveis, a base polinomial multivariável é construída através do produto tensorial:

{Φ} = ⊗

Cada elemento da base multivariável será o produto de 𝑁 polinômios com graus definidos por 𝑑_𝑗. O processo estocástico multivariável será aproximado pela série truncada:

𝑃𝑒_𝑁𝑃({𝜆}) = ∑ 𝑐̂𝑗Φ𝑗({𝜆}) 𝑀

𝑗=0

𝑀 = (𝑁 + 𝑃

𝑁 ) (4.24)

As bases multivariáveis ainda possuem as propriedades de ortogonalidade e são ortogonais à distribuição de probabilidade conjunta 𝜌({λ}) = 𝜌(𝜆1) ∙ 𝜌(𝜆2) ⋯ 𝜌(𝜆𝑁).

Tabela 4.1 – Correspondência entre o tipo da variável aleatória e o caos polinomial de Wiener-Askey (𝑁 ≥ 0 é um inteiro finito)

Variável aleatória 𝜁 Caos polinomial de

Wiener-Askey Φ(𝜁) Suporte Continua Gaussiana Hermite (−∞, ∞) Gama Laguerre [0, ∞) Beta Jacobi [𝑎, 𝑏] Uniforme Legendre [𝑎, 𝑏] Discreta Poisson Charlier {0,1,2, … } Binomial Krawtchouk {0,1,2, … , 𝑁}

Binomial negativa Meixner {0,1,2, … }

Hipergeométrica Hahn {0,1,2, … , 𝑁}

Por exemplo, para o caso de um processo com 2 variáveis aleatórias e com grau dos polinômios máximo 2. Para cada variável, a sua base será composta pelos polinômios: 𝜙0(𝜆),

𝜙₁(𝜆) e 𝜙₂(𝜆). Utilizando o produto tensorial da Equação (4.23), obtém-se a base para 2 variáveis com 6 termos:

{ 𝜙₀(𝜆₁) ∙ 𝜙₀(𝜆₂) 𝜙₁(𝜆1) ∙ 𝜙0(𝜆2) 𝜙₂(𝜆1) ∙ 𝜙0(𝜆2) 𝜙0(𝜆1) ∙ 𝜙1(𝜆2) 𝜙₀(𝜆₁) ∙ 𝜙₂(𝜆₂) 𝜙₁(𝜆₁) ∙ 𝜙₁(𝜆₂)}

Com a determinação da base polinomial, o problema passa ser a estimativa dos coeficientes de expansão 𝑐̂𝑗. O fluxo da Figura 4.3, apresenta o processo de solução do problema

Figura 4.3 – Fluxograma do processo de solução por Expansão Polinomial do Caos generalizado

Os métodos de Colocação estocástica e Galerkin estocástico podem ser utilizados para calcular os coeficientes de expansão. Vantagens e desvantagens de ambos os métodos serão discutidas a seguir.

4.3.3. Colocação estocástica

Assim como os métodos de Monte Carlo, esta forma de estimar os coeficientes de colocação precisa de um gerador de amostras e um algoritmo que possa resolver o problema determinístico. Métodos que utilizam estes algoritmos do problema determinístico são chamados de “não intrusivos”, pois não alteram a natureza do problema determinístico original. O método propõe a estimação dos coeficientes da expansão polinomial através da solução de um sistema linear, apresentado pela Equação (4.25). São geradas 𝑄 amostras de {𝜆}, resolve-se o problema determinístico 𝑆({𝑥}, {𝜆}𝑖) e cada termo da expansão polinomial Φ𝑗({𝜆}𝑖) para cada amostra. Utilizou-se o método de mínimos quadrados, Equação (4.26), para

a solução do sistema linear.

[ Φ1({𝜆}1) ⋯ Φ𝑀({𝜆}1) ⋮ ⋱ ⋮ Φ₁({𝜆}𝑄_{) ⋯ Φ} 𝑀({𝜆}𝑄) ] ∙ { 𝑐̂1 ⋮ 𝑐̂_𝑀 } = { 𝑆({𝑥}, {𝜆}1) ⋮ 𝑆({𝑥}, {𝜆}𝑄) } (4.25) {𝑐̂_𝑗} = ([Φ_𝑗({𝜆}𝑖)]𝑇[Φ_𝑗({𝜆}𝑖)])−1∙ [Φ_𝑗({𝜆}𝑖)]𝑇∙ {𝑆({𝑥}, {𝜆}𝑖)} (4.26)

A diferença entre o método de colocação e Monte Carlo, está na escolha das amostras. Em ambos, é possível a utilização de escolhas aleatórias e hipercubo latino (em inglês, Latin Hypercube Space). Já o método de colocação permite a utilização de regras de

quadratura para a escolha das amostras. Outra vantagem do método em relação à Monte Carlo, é o número de amostras menor. Devido ao fato que se deseja estimar os coeficientes de expansão de uma série polinomial e não os dados estatísticos de um processo estocástico, geralmente, mais complexo. É recomendado um número de amostras de 2 a 3 vezes maior que o número de termos da expansão 𝑀. O método de grade esparsa, proposto por Ganapathysubramanian e Zabaras (2007), cuja teoria está presente no Anexo E, foi usado para a escolha de pontos para a solução do sistema linear da Colocação Estocástica.

No entanto, o método pode sofrer da maldição de dimensionalidade (em inglês,

Curse of dimensionality). Com o aumento do número de amostras aleatórias, o número de

termos necessários na expansão aumenta exponencialmente, fazendo, para problemas com um número elevado de variáveis aleatórias, o número de amostras necessárias para o método de colocação praticamente semelhante ao número que um método de Monte Carlo usaria.

4.3.4. Galerkin estocástico

O método de Galerkin estocástico é similar ao método de Galerkin determinístico. Buscam-se coeficientes de expansão que minimizem a diferença entre a solução e a série polinomial.

Diferente dos métodos de colocação estocástica e de Monte Carlo, o método de Galerkin estocástico é intrusivo. Ou seja, o método faz com que não seja possível utilizar algoritmos que calculam a solução do problema determinístico.

Seja a equação de movimento da Equação(4.27) representada com um operador derivativo ℒ, como na Equação (4.27), sendo 𝑥 as variáveis de entrada não aleatórias, 𝜆 as variáveis de entrada aleatórias, 𝑞 a solução, 𝑡 o tempo e {𝐹} o vetor de forças externas.

ℒ(𝑥, 𝜆, 𝑞; 𝑡) − {𝐹} = 0 (4.27)

Aproximando a solução por uma série e aplicando produto interno, tem-se:

∫ (ℒ (𝑥, 𝜆, ∑ 𝑐̂_𝑗Φ_𝑗({𝜆})

𝑀

𝑗=0

Desta forma, é obtido um sistema de equações parciais diferenciais acopladas. A solução são os coeficientes da expansão e, assim, a aproximação da resposta estocástica. No entanto, a solução do sistema obtido na Equação (4.28) não é trivial e, se o problema determinístico original possuir uma solução complexa, a solução do sistema pode ser impossível. Este é o caso de máquinas rotativas, modelos complexos de solução difícil.

Através de regras de quadratura, a integral da Equação (4.28) pode ser aproximada por uma soma. Desta forma, é possível a utilização de algoritmos de solução do problema determinístico 𝑆. São determinados 𝑄 pontos {𝜆}𝑖 e seus respectivos pesos de quadratura 𝛼𝑖 e os coeficientes de expansão podem ser estimado através da Equação (4.29). Estabelecendo, assim, um método de Galerkin não intrusivo.

𝑐̂𝑗 = ∑ 𝑆({𝑥}, {𝜆}𝑖) ∙ 𝑄

𝑖=1

Φ𝑗({𝜆}𝑖) ∙ 𝛼𝑖 (4.29)

4.3.5. Verificação de convergência da expansão polinomial

A verificação de convergência da expansão polinomial do caos generalizado varia com o método de estimação dos coeficientes escolhido. Para todos os métodos, é possível uma comparação com as funções de densidade de probabilidade, função cumulativa de probabilidade e dados estatísticos, como média e variância, estimados pelo método de Monte Carlo.

Para o caso da utilização do método de Galerkin intrusivo, não há necessidade de um método de verificação de convergência. A solução do método já é a ótima para o grau máximo do polinômio escolhido, o erro numérico estaria no método escolhido para a solução do sistema de equações. Apesar da convergência ótima, a aplicação do método de Galerkin em modelos estocásticos de máquinas rotativas é difícil, pois os modelos são complexos e a solução do sistema é impraticável.

No caso de métodos não intrusivos, os quais utilizam pontos predeterminados, é feita uma validação parecida com a de técnicas de machine learning. Escolhe-se parte dos pontos predeterminados que não serão utilizados para a estimação dos coeficientes. Após a estimação dos coeficientes de expansão, calcula-se o resultado da expansão polinomial e da solução determinística nos pontos separados anteriormente e estes resultados são comparados.

Após a validação, a expansão polinomial pode ser utilizada como uma aproximação do problema estocástico e dados estatísticos e outras análises podem ser feitas.

4.3.6. Informações estatísticas

Após a determinação dos coeficientes de expansão, informações estatísticas podem diretamente calculadas devido as propriedades ortogonais dos polinômios, como mostram as eqs. (4.30) e (4.31)para a média e variância, respectivamente.

𝔼[𝑃𝑒] ≈ 𝔼[𝑃𝑒_𝑁𝑃] = ∫ ∑ 𝑐̂jΦ𝑗({𝜆}) 𝑀 𝑗=1 𝜌(𝜆)𝑑𝜆 = ⋯ ⋯ = ∫ (∑ 𝑐̂_jΦ_𝑗({𝜆}) 𝑀 𝑗=1 ) ∙ 1 ∙ 𝜌(𝜆)𝑑𝜆 = 𝑐̂₁ (4.30) 𝑉𝑎𝑟(𝑃𝑒) = 𝔼[(𝑃𝑒 − 𝔼[𝑃𝑒])2] ≈ 𝔼[(𝑃𝑒_𝑁𝑃_{− 𝔼[𝑃𝑒} 𝑁𝑃])2] = ⋯ ⋯ = 𝔼[(𝑃𝑒_𝑁𝑃_{− 𝑐̂} 1)2] = ∫ (∑ 𝑐̂jΦ𝑗({𝜆}) 𝑀 𝑗=1 − 𝑐̂₁) 2 𝜌(𝜆)𝑑𝜆 = ⋯ ⋯ = ∫ (∑ 𝑐̂_jΦ_𝑗({𝜆}) 𝑀 𝑗=2 ) 2 𝜌(𝜆)𝑑𝜆 = ∑ 𝑐_𝑗2 𝑀 𝑗=2 (4.31)

4.3.7. Implementação da Expansão do Caos Polinomial

A implementação da expansão foi feita em MATLAB. Optou-se por esta linguagem devido a familiaridade com ela. Para aproveitar as implementações de modelos de máquinas rotativas desenvolvidas no Laboratório de Máquinas Rotativas (LAMAR), optou-se por criar uma função que permite utilizar estas implementações já desenvolvidas. O algoritmo desta função é apresentado a seguir:

1. Entradas:

a. Modelo: Programa para a solução do problema determinístico; b. Variáveis de saída: Nome das variáveis de saída que se deseja

calcular a resposta estocástica c. Nível da grade de pontos d. Grau máximo dos Polinômios e. Número de variáveis aleatórias

f. Variáveis aleatórias

• Nome da variável no Modelo

• Tipo (gaussiana, uniforme, gama etc.) • Parâmetro 1 da distribuição

• Parâmetro 2 da distribuição

2. Gerar pontos/amostras a serem calculados pelo Modelo

3. Verificar se há conjunto de resultados para as entradas fornecidas a. Sim: Pular para 5

b. Não: Ir para 5

4. Calcular a solução para cada ponto/amostra utilizando o Modelo fornecido e armazenando as Varáveis de saída

5. Gerar base polinomial.

6. Calcular matriz dos polinômios 7. Resolver sistema linear

8. Calcular média e variância a partir dos coeficientes 9. Salvar resultados

A saída deste algoritmo são os pontos calculados, a base polinomial, os coeficientes de expansão, média e variância da resposta estocástica.

Os resultados dos polinômios podem ser obtidos através de somatórias. O polinômio de Hermite é mostrado na Equação (4.26), como exemplo. Assim, foi necessário armazenar apenas os graus de cada polinômio de cada termo da base polinomial e as somatórias. Não foi necessário armazenar cada polinômio em diferentes graus.

𝐻_𝑛(𝑥) = 𝑛! ∙ ∑ −1 𝑚_{∙ (2𝑥)}𝑛−2𝑚 𝑚! ∙ (𝑛 − 2𝑚)! ⌊𝑛₂⌋ 𝑚=0 (4.32) onde ⌊𝑛

2⌋ é o arredondamento para o menor inteiro.

A partir dos coeficientes, a análise de sensibilidade pode ser realizada.

No documento Estimação e quantificação de incertezas aplicados em modelos de falhas de máquinas rotativas (páginas 49-59)