Algoritmos Adaptativos para o Método dos Elementos Finitos UtilizandoaBiblioteca

Texto

(1)Algoritmos Adaptativos para o Método dos Elementos Finitos Utilizando a Biblioteca . José Jerônimo Camata. Dissertaça˜ o de Mestrado Programa de Pós-Graduaça˜ o em Informática Universidade Federal do Espirito Santo Vitória, Outubro de 2006.

(2)

(3) Aos meus pais, Gecelina e José, e ao meu irmão Felipe.

(4) Agradecimentos Expresso aqui meus sinceros agradecimentos aos responsáveis pela realizaça˜ o deste trabalho. A minha orientadora, Prof.a Andrea M. P. Valli que transmitiu seus conhecimentos e experiências, dedicaça˜ o e compreensão, e que, com certeza, contribuiu enormemente na minha formaça˜ o acadêmica e profissional. A Prof.a Lucia Catabriga pelo apoio dado ao longo deste trabalho, além de estar dispon´ıvel para a revisão do mesmo, meus sinceros agradecimentos. Agradeço a minha fam´ılia por ter me apoiado e me incentivado durante todo per´ıodo desta tarefa. Agradeço aos amigos que fiz ao longo desses u´ ltimos dois anos dentro do departamento de informática. Pela trocas de conhecimentos, experiências e afeto. Agradeço ao departamento de informática, que por meio do laboratório de computaça˜ o de alto desempenho (LCAD), viabilizou a infraestrutura adequada para a completa realizaça˜ o desse trabalho. Ao Prof. Graham F. Carey pela disponibilidade em ceder os recursos do laborátorio de dinâmicas de fluidos computacionais (CFDLab). A CAPES, uma vez que esse trabalho faz parte do projeto de colaboraça˜ o da Capes com a Universidade do Texas em Austin, CAPES/UT N . 11/04. Enfim, eu gostaria de agradecer a todos que direta ou indiretamente contribuiram para realizaça˜ o desse trabalho..

(5)

(6)

(7)

(8) ! $ % $% . +./. & %'(' ) &%+,-+ 0 & &( & 1 2

(9) 3 45'(' ) && 678//96 : %,-16; 6 < ;0 (366= 6 ;>

(10) 6 & 7 ! $ % ?

(11) @

(12) 6 +63( & 1 686A &(

(13) &4 0B &(

(14) 6C60 &

(15) & 6.6 $ &66= %0 (3666 %>

(16) 66 ! $ 6 ?

(17) @

(18) 6=6?! 6 ;//..

(19) Sumário. Lista de Figuras. p. vii. Lista de Tabelas. p. x. Resumo. p. xi. Abstract. p. xii. 1 Introduça˜ o. p. 1. 1.1. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 6. 1.2. Organizaça˜ o do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 7. 1.3. Recursos computacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 8. 2 Formulaça˜ o e Aproximaça˜ o. p. 9. 2.1. Formulaça˜ o SUPG para a equaça˜ o de transporte . . . . . . . . . . . . . . . .. p. 9. 2.2. Formulaça˜ o de Galerkin para as equaço˜ es de Navier-Stokes . . . . . . . . . .. p. 14. 2.3. : biblioteca para simulaço˜ es paralelas com refinamento adaptativo da malha de elementos finitos . . . . . . . . . . . . . . . . . . . . . . . . . .. 3 Métodos Iterativos Lineares. p. 18 p. 24. 3.1. Biblioteca PETSc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 24. 3.2. Métodos de soluça˜ o de sistemas baseados nos sub-espaços de Krylov . . . . .. p. 26. 3.2.1. Método dos res´ıduos m´ınimos generalizados (GMRES) . . . . . . . .. p. 26. 3.2.2. Método do gradientes bi-conjugados estabilizados (Bi-CGSTAB) . .. p. 31. Método das direço˜ es conjugadas a` esquerda (LCD) . . . . . . . . . . . . . .. p. 33. 3.3.

(20) 3.3.1. Implementaça˜ o no . . . . . . . . . . . . . . . . . . . . . .. 4 Adaptatividade na Biblioteca . p. 36 p. 38. 4.1. Refinamento adaptativo da malha . . . . . . . . . . . . . . . . . . . . . . . .. p. 38. 4.2. Seleça˜ o adaptativa do passo no tempo . . . . . . . . . . . . . . . . . . . . .. p. 45. 4.3. Adaptatividade no espaço e no tempo . . . . . . . . . . . . . . . . . . . . .. p. 51. 5 Experimentos Numéricos usando a Biblioteca 5.1. 5.2. p. 54. Eficiência computacional dos métodos iterativos . . . . . . . . . . . . . . . .. p. 54. 5.1.1. Problema de convecça˜ o-difusão . . . . . . . . . . . . . . . . . . . .. p. 54. 5.1.2. Problema de convecça˜ o dominante . . . . . . . . . . . . . . . . . . .. p. 59. 5.1.3. Principais conclusões . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 65. Adaptatividade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 66. 5.2.1. Problema da cavidade . . . . . . . . . . . . . . . . . . . . . . . . .. p. 67. 5.2.2. Problema do escoamento com alargamento do canal . . . . . . . . .. p. 74. 5.2.3. Principais conclusões . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 85. 6 Conclusão e Trabalhos Futuros. p. 87. Referências Bibliográficas. p. 90. Apêndices. p. 97. Apêndice A - SubMatrizes e Subvetores da Matriz Jacobiana . . . . . . . . . . . .. p. 97.

(21) Lista de Figuras 2.1. Hierarquia da classe . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 22. 3.1. Organizaça˜ o hierárquica entre as bibliotecas PETSc e . . . . . . . .. p. 25. 4.1. Exemplo de refinamento adaptativo da malha para um problema de convecça˜ odifusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 41. 4.2. Fluxo sobre as faces dos elementos . . . . . . . . . . . . . . . . . . . . . . .. p. 42. 4.3. Fluxograma do refinamento adaptativo da malha AMR . . . . . . . . . . . .. p. 43. 4.4. N´ıveis de Refinamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 44. 4.5. Controlador PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 46. 4.6. Seleça˜ o adaptativa do passo do tempo visto como um problema de controle retroalimentado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 48. 4.7. Algoritmo PID para a escolha do tamanho do passo no tempo . . . . . . . . .. p. 50. 4.8. Algoritmo do refinamento adaptativo no tempo e no espaço . . . . . . . . . .. p. 53. 5.1. Soluça˜ o do problema de convecça˜ o-difusão . . . . . . . . . . . . . . . . . .. p. 55. 5.2. Problema de convecça˜ o-difusão - Evoluça˜ o do res´ıduo (Iteraço˜ es para elementos TRI3 (esquerda) e TRI6 (direita), malha 64. 5.3. 5.4. 64 células . . .. Problema de convecça˜ o-difusão - Evoluça˜ o do res´ıduo (Iteraço˜ es para elementos TRI3 (esquerda) e TRI6 (direita), malha 128. p. 60. log r ). 128 células . .. Problema de convecça˜ o-difusão - Evoluça˜ o do res´ıduo (Iteraço˜ es para elementos TRI3 (esquerda) e TRI6 (direita), malha 256. log r ). p. 60. log r ). 256 células . .. p. 60. 5.5. Problema convecça˜ o dominante - Condiço˜ es de Contorno . . . . . . . . . . .. p. 61. 5.6. Problema convecça˜ o-dominante - Evoluça˜ o do res´ıduo (Iteraço˜ es para elementos TRI3 (esquerda) e TRI6 (direita) - Malha 64. 5.7. 64 células . .. Problema convecça˜ o-dominante - Evoluça˜ o do res´ıduo (Iteraço˜ es para elementos TRI3 (esquerda) e TRI6 (direita) - Malha 128. log r ) p. 64. log r ) 128 células .. p. 64.

(22) 5.8. Problema convecça˜ o-dominante - Evoluça˜ o do res´ıduo (Iteraço˜ es para elementos TRI3 (esquerda) e TRI6 (direita) - Malha 256. log r ) 256 células .. p. 64. Problema da cavidade - Condiço˜ es de fronteira . . . . . . . . . . . . . . . .. p. 67. 5.10 Distribuiça˜ o da velocidade u no topo da cavidade . . . . . . . . . . . . . . .. p. 68. 5.9. 5.11 Problema da cavidade - Reynolds 200 - Perfil das velocidades u (esquerda) e v (direita) no centro geométrico da cavidade - malha Fixa (40. 40) e AMR(20. 20,1,0.3,0.01,1) - com e sem PID . . . . . . . . . . . . . . . . . . . . . .. p. 70. 5.12 Problema da cavidade - Reynolds 1000 - Perfil das velocidades u (esquerda) e v (direita) no centro geométrico da cavidade - malha Fixa (80 AMR(20. 80) e. 20,2,0.3,0.01,2) - com e sem PID . . . . . . . . . . . . . . . . .. p. 70. 5.13 Problema da cavidade - Escolha do tamanho do passo ao longo do tempo para as malhas fixa e AMR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 72. 5.14 Problema da cavidade - Reynolds 200 - Configuraça˜ o final da malha . . . . .. p. 73. 5.15 Problema da cavidade - Reynolds 1000 - Configuraça˜ o final da malha . . . .. p. 73. 5.16 Problema da cavidade - Reynolds 200 - Linhas de corrente - Malha fixa e AMR p. 74 5.17 Problema da cavidade - Reynolds 1000 - Linhas de corrente - Malha fixa e AMR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 75. 5.18 Problema da cavidade - Reynolds 200 - Verificaça˜ o do regime permanente tempo vs. energia cinética . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 76. 5.19 Problema da cavidade - Reynolds 1000 - Verificaça˜ o do regime permanente tempo vs. energia cinética . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.20 Problema do escoamento com alargamento do canal - Condiço˜ es de fronteira. p. 77 p. 78. 5.21 Problema do escoamento com alargamento do canal - Escolha do tamanho do passo ao longo do tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 80. 5.22 Problema do escoamento com alargamento do canal - Número de nós . . . .. p. 81. 5.23 Problema do escoamento com alargamento do canal - Configuraça˜ o final da malha - AMR(64. 8,1,0.3,0.01,1) . . . . . . . . . . . . . . . . . . . . . . .. p. 81. 5.24 Problema do escoamento com alargamento do canal - Perfil da velocidade Malha fixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 82.

(23) 5.25 Problema do escoamento com alargamento do canal - Perfil da velocidade AMR(64. 8,1,0.3,0.01,1) . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 83. 5.26 Problema do escoamento com alargamento do canal - Linhas de corrente Malha fixa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 84. 5.27 Problema do escoamento com alargamento do canal- Linhas de corrente AMR(64. 8,1,0.3,0.01,1) . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 84. 5.28 Problema do escoamento com alargamento do canal - Energia Cinética . . . .. p. 85.

(24) Lista de Tabelas 5.1. Problema de convecça˜ o-difusão - Desempenho dos métodos GMRES, LCD and Bi-CGSTAB - Malha 64. 5.2. 128 células . . . . . . . . . . . . . . . . . .. 256 células . . . . . . . . . . . . . . . . . .. Problema de convecça˜ o-difusão - Custo das operaço˜ es - Malha 256. p. 62. 128 células . . . . . . . . . . . . . . . . . . .. p. 63. Problema convecça˜ o-dominante - Desempenho dos métodos GMRES, LCD e Bi-CGSTAB - Malha 256. 5.8. 64 células . . . . . . . . . . . .. Problema convecça˜ o-dominante - Desempenho dos métodos GMRES, LCD e Bi-CGSTAB - Malha 128. 5.7. p. 59. Problema convecça˜ o-dominante - Desempenho computacional dos métodos GMRES, LCD e Bi-CGSTAB - Malha 64. 5.6. p. 58. 256. células . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5. p. 57. Problema de convecça˜ o-difusão - Desempenho dos métodos GMRES, LCD and Bi-CGSTAB - Malha 256. 5.4. p. 56. Problema de convecça˜ o-difusão - Desempenho dos métodos GMRES, LCD and Bi-CGSTAB - Malha 128. 5.3. 64 células . . . . . . . . . . . . . . . . . . .. 256 células . . . . . . . . . . . . . . . . . . .. Problema convecça˜ o-dominante - Custo computacional - Malha 128. p. 65. 128. células . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 66. Problema da cavidade - Desempenho do PID para a malha fixa . . . . . . . .. p. 71. 5.10 Problema da cavidade - Desempenho do PID para a malha adaptativa . . . . .. p. 71. 5.9. 5.11 Problema do escoamento com alargamento do canal - Desempenho do PID Malha Fixa -. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. p. 79.

(25) Resumo Técnicas adaptativas de refinamento da malha de elementos finitos são importantes ferramentas na reduça˜ o do tempo de processamento da soluça˜ o, paralela ou sequencial, de problemas em engenharia que utilizam o método de elementos finitos. Além do mais, soluço˜ es aproximadas que utilizam malhas adaptativas são capazes de representar com uma maior precisão os fenômenos f´ısicos envolvidos. No entanto, a construça˜ o de uma plataforma em elementos finitos com essas caracter´ısticas demanda um enorme esforço e tempo de programaça˜ o. Sendo assim, foi adotada a biblioteca ibMesh em C++ para o estudo e implementaça˜ o de técnicas que podem melhorar a eficiência computacional de códigos em elementos finitos. Neste trabalho foi implementada uma estratégia de seleça˜ o do passo do tempo, baseada na teoria de controle, e a sua aplicabilidade testada quando utilizada em conjunto com a adaptividade espacial presente na ibMesh. Além do mais, método das direço˜ es conjugados a` esquerda (LCD) foi incluido na biblioteca via uma interface com a biblioteca PETSc, a fim de também fazer parte da biblioteca . Resultados comparativos com os métodos GMRES e BiCGSTAB mostraram a viabilidade da utilizaça˜ o desse método. Experimentos numéricos confirmaram a eficiência da estratégia do passo no tempo, para a obtença˜ o de soluço˜ es em regime permanente, quando são utilizadas malhas fixas e malhas adaptativas no espaço. Além disso, os custos computacionais para os processos de seleça˜ o do passo são desprez´ıveis, uma vez que involvem apenas o armazenamento de alguns vetores e o cálculo de normas..

(26) Abstract Adaptive mesh refinement (AMR) is an important technique in the reduction of the computational cost in numerical solution which uses finite element method. Moreover, approximate solutions that use adaptive mesh represents the physical phenomena with better precision. The implementation of an application with these characteristic to require a formidable software development effort. Thus, we adopted the library library as a tool to support in our studies. In this work, we implemented a timestep selection technique based on feedback control theory and your applicability was tested when used with spatial adaptivity in . In addition, we introduced the left conjugated directions method (LCD) for the solution of nonsymmetric systems of linear equations in the library. Comparative results with GMRES and Bi-CGSTAB methods showed the viability the LCD method. Numerical experiments confirmed the efficiency of the timestep selection strategy when used with fixed and adaptive mesh..

(27) 1. Introduça˜ o. Diferenças finitas, volumes finitos e elementos finitos são as principais técnicas numéricas utilizadas para resolver equaço˜ es diferenciais parciais que modelam problemas reais das mais variadas a´ reas do conhecimento humano. A vantagem do método dos elementos finitos relativamente a outros métodos existentes reside na sua versatilidade e generalidade, além da sua flexibilidade em resolver problemas envolvendo dom´ınios com geometrias complexas e condiço˜ es de contorno diversas. Desta forma, o método de elementos finitos e´ adotado neste trabalho e a sua utilizaça˜ o na biblioteca [5] e´ analisada, em conjunto com diversos métodos de resoluça˜ o de sistemas lineares e técnicas adaptativas da malha. Os modelos matemáticos para os problemas tratados nesse trabalho, e utilizados para testar as técnicas numéricas e computacionais estudadas, são baseados nas equaço˜ es bidimensionais do transporte convectivo-difusivo e nas equaço˜ es bidimensionais de Navier-Stokes. Dentre as principais formulaço˜ es em elementos finitos para escoamentos incompress´ıveis estão as formulaço˜ es mistas [24, 69] e penalizadas [94, 69, 22, 23, 24], as formulaço˜ es estabilizadas, como, por exemplo, a formulaça˜ o SUPG (Steamline-Upwind/Petrov-Galerkin) [54, 19, 33, 85], a formulaça˜ o Galerkin/Least-Squares (GSL) [55, 25, 40], a formulaça˜ o PressureStabilizing/Petrov-Galerkin (PSPG) [84, 31] e as formulaço˜ es baseadas em passos fracionados [16, 32]. Também podemos encontrar formulaço˜ es baseadas nas funço˜ es de corrente e vorticidade [24, 14]. Neste trabalho e´ utilizado uma formulaça˜ o estabilizada SUPG (StreamlineUpwind/Petrov-Galerkin) [19] para o problema de transporte com o objetivo de contornar poss´ıveis instabilidades numéricas gerada pela formulaça˜ o padrão de Galerkin. Para a equaça˜ o de NavierStokes, escritas em variáveis primitivas, e´ utilizada a formulaça˜ o tradicional de Galerkin, com o método de Newton e uma discretizaça˜ o no tempo pelo tradicional método θ [24]. O método dos elementos finitos necessita da geraça˜ o da malha correspondente a discretizaça˜ o do dom´ınio do problema, no qual a soluça˜ o aproximada e´ estimada. O espaçamento entre os pontos da malha está relacionado com a precisão com que a soluça˜ o numérica e´ obtida e com o tamanho do sistema que e´ preciso resolver. Quanto maior o número de pontos ou nós da malha, maior e´ o sistema linear resultante. Quanto maior for o sistema linear, mais elevado.

(28) 2. e´ o tempo de computaça˜ o ou processamento. Mais ainda, em geral os problemas de interesse em engenharia são transientes, não lineares, definidos em 2 ou 3 dimensões e envolvem malhas com centenas de milhares de pontos. Isso significa que sistemas lineares de grande porte esparsos precisam ser resolvidos várias vezes dentro de um passo no tempo, o que acarreta em um volume enorme de operaço˜ es para a obtença˜ o da soluça˜ o aproximada final. Neste trabalho e´ discutido formas de implementaço˜ es numéricas capazes de reduzir o tempo de processamento da soluça˜ o em uma plataforma em C++ para a resoluça˜ o, paralela ou sequencial, de problemas em engenharia, utilizando o método de elementos finitos e técnicas adaptativas da malha. Um dos fatores importante para a melhoria do tempo de processamento e´ a escolha do método de soluça˜ o de sistemas lineares a ser empregado. Esses métodos podem ser diretos, como eliminaça˜ o de Gauss e decomposiça˜ o LU, ou iterativos, tais como, Jacobi e Gauss-Seidel. Os métodos diretos possuem um inconveniente quando resolvemos sistemas de grande porte pois acarretam em erros de arredondamento e em um tempo de processamento muito alto. Por estas razões, este tipo de método não e´ muito utilizado na soluça˜ o de sistemas oriundos da discretizaça˜ o por elementos finitos. Assim, os métodos iterativos constituem numa opça˜ o mais interessante, principalmente, os métodos não-estacionários baseados nos subespaços de Krylov [77, 89, 93]. Esses métodos, quando comparados com outros métodos iterativos, possuem uma taxa de convergência bem mais alta, principalmente quando algum precondicionamento e´ aplicado ao sistema. O método dos res´ıduos m´ınimos generalizados, também conhecido como GMRES [77], e´ o método usualmente utilizado na resoluça˜ o de sistemas lineares não-simétricos. Para contornar certos problemas com requerimentos de memória, a sua variaça˜ o mais bem sucedida e sugerida por Saad e Schultz [77] utiliza a técnica de rein´ıcio (”restart”) do processo a cada ciclo de m iteraço˜ es. Outro método, também muito empregado, e´ o método dos gradientes bi-conjugados estabilizados (Bi-CGSTAB) [89]. Esse método foi desenvolvido para resolver a freqüente irregularidade de convergência do métodos dos gradientes conjugados quadrados (CGS). Além desses dois já citados, há vários outros métodos baseados nos subespaços de Krylov, tais como, o método do res´ıduo quasi-m´ınimo (QMR), método do res´ıduo quasi-minino livre de transposiça˜ o (TFQMR) e gradientes conjugados (GC). Em 1994, Yuan et al. [93] introduziram um novo algoritmo para resolver sistemas lineares não-singulares e não-simétricos, o método das direço˜ es conjudadas a` esquerda (LCD) baseado no conceito de vetores conjugados a` esquerda e a` direita. Algumas vantagens teóricas foram verificadas para este método, tais como, a propriedade de terminaça˜ o finita e a reduça˜ o de falhas (breakdown) para matrizes gerais. Além disso, existe uma conexão entre LCD e a.

(29) 3. decomposiça˜ o LU, o que facilita a sua compreensão. Catabriga et al [28, 29] aperfeiçoaram esse método introduzindo a técnica do restart e executaram testes comparativos com o GMRES. Foi observado que, em algumas casos, o LCD apresentou um desempenho melhor que o GMRES. No entanto, estudos comparativos com outros métodos continua sendo uma a´ rea de interesse para uma melhor compreensão das capacidades computacionais deste método. Um outro importante fator que afeta consideravelmente o desempenho computacional e´ o tamanho da malha oriunda da discretizaça˜ o por elementos finitos. Em diversos problemas e´ poss´ıvel utilizar uma malha uniforme, ou seja, uma malha que utiliza um mesmo espaçamento entre os diversos nós existentes. Entretanto, existem classes de problemas onde um fenômeno f´ısico de interesse acontece em uma determinada região do dom´ınio que pode, além disso, mudar com o decorrer do tempo. Em geral, para que um fenômeno f´ısico possa ser estimado com precisão e´ definida uma malha suficientemente refinada nas regiões onde a soluça˜ o e´ mais dif´ıcil de ser estimada ou onde a soluça˜ o muda mais rapidamente com o tempo. A utilizaça˜ o de uma malha uniforme nestes casos acarreta em um número elevado de pontos nodais, ou seja, em um alto custo computacional. Para reduzir o tamanho do sistema linear resultante ou o número de pontos nodais envolvidos no problema, e´ poss´ıvel utilizar uma malha não uniforme que considere um refinamento maior nas regiões que necessitam de alta precisão, deixando outras parte do dom´ınio com um número reduzido de pontos. Sendo assim, e´ poss´ıvel obter a precisão necessária para a soluça˜ o aproximada sem aumentar muito o tamanho do sistema resultante, como no caso da malha uniforme. No entanto, para a utilizaça˜ o de uma malha não uniforme e´ preciso definir estratégias automáticas de geraça˜ o que levem em consideraça˜ o a precisão desejada ou o fenômeno f´ısico que se deseja capturar [65, 26, 86, 92]. Umas das ferramentas utilizadas para a implementaço˜ es de algoritmos adaptativos e´ a biblioteca [5]. Seu desenvolvimento iniciou em março de 2002 pelas Universidade do Texas em Austin e a Universidade de Hamburg na Alemanha, com o objetivo de dar suporte ao refinamento adaptativo de malhas. Implementada em C++, essa biblioteca e´ um framework para simulaça˜ o numérica de equaço˜ es diferenciais parciais usando o método de elementos finitos. Permite o desenvolvimento de códigos tanto para máquinas seriais quanto paralelas de modo fácil e rápido. Ou seja, a biblioteca foi criada para facilitar simulaço˜ es em elemento finitos de problemas multif´ısicos, multi-escala, e utilizando processos adaptativos e em paralelo, de modo confiável e que possa ser reutilizável. Um dos principais objetivos da biblioteca e´ fornecer uma plataforma de pesquisa para algoritmos adaptativos e paralelos. Grande parte do esforço adotado no desenvolvimento.

(30) 4. de um software, que suporta simulaço˜ es baseadas em malhas não estruturadas e em paralelo, pode ser evitado quando e´ utilizado, sempre que poss´ıvel, tecnologias independentes da f´ısica e outras bibliotecas existentes. Desta forma, usuários podem concentrar-se na aplicaça˜ o f´ısica de interesse sem precisar se preocupar com a complexidade adicional envolvida pela adaptatividade e pelo processo paralelo. Na biblioteca , o conceito de separar algumas caracter´ısticas f´ısicas da infraestrutura de paralelismo do processo de refinamento da malha foi influenciado pelo projeto NASA HPC, sobre qual foi desenvolvido um código multif´ısico paralelo para uma grande faixa de aplicaço˜ es [90]. Alguns projetos de bibliotecas de alto desempenho que influenciaram o desenvolvimento do são [10, 20, 15, 41, 66]. Como deal.II. 1. [10, 11], foi projetada, desde. o in´ıcio, para o uso das caracter´ısticas avançadas da linguagem de programaça˜ o C++. Dentre elas, a possibilidade de implementaço˜ es de sobreposiça˜ o de operadores, heranças e polimorfismos, facilitando a estruturaça˜ o dos objetos e a extensibilidade da biblioteca. Na biblioteca não existe nenhum recurso que utilize linguagens procedurais, tais como, C e FORTRAN. Isso e´ diferente do que acontece em outras bibliotecas como, por exemplo, Cactus 2 [2] ou ParFUM 3 [68]. foi desenhada de forma a deixar dispon´ıvel as classes e os templates aos usuários, o que pode, segundo os desenvolvedores [5], facilitar a extensibilidade. Essas caracter´ısticas no desenvolvimento da biblioteca foram consideradas mais importantes do que a inter-operabilidade entre várias linguagens. A metodologia de simulaça˜ o na biblioteca emprega a discretizaça˜ o padrão baseada em células, discutida em muitos textos introdutórios de elementos finitos [43]. Diferentes formulaço˜ es de elementos finitos podem ser aplicadas, incluindo os métodos de Galerkin, Petrov-Galerkin e Galerkin descont´ınuo. Para o processo de refinamento, a biblioteca utiliza a técnica de subdivisão de elementos. Em problemas evolutivos, em particular, o processo de desrefinamento e´ desejável e a` s vezes essencial para obter soluço˜ es eficientes.. implementa um processo simultâneo de refinamento e desrefinamento para. aplicaço˜ es dependentes no tempo. O foco na biblioteca está na subdivisão local do elemento (h-refinamento) com desrefinamento local por h restituiço˜ es de subelementos. Além disso, também permite refinamento h com elementos de graus elevados. A versão do que está em desenvolvimento suporta refinamento p e hp para alguns tipos de elementos. Um fator importante ao processo de refinamento e desrefinamento são os indicadores de 1 http://www.dealii.org/ 2 www.cactuscode.org 3 http://charm.cs.uiuc.edu/research/ParFUM/.

(31) 5. erro a posteriori responsáveis em guiar o processo adaptativo. O indicador do erro utilizado pelo está focado nos indicadores locais que são essencialmentes independentes da f´ısica. Isto torna a biblioteca mais flex´ıvel permitindo seu uso em diversas aplicaço˜ es. De uma maneira geral, um estimador para o erro deveria ser capaz de colher apenas informaço˜ es sobre o elemento finito e uma funça˜ o definida na malha e retornar n´ıveis de aproximaço˜ es para o erro em cada elemento. Sendo assim, a implementaça˜ o escolhida para o indicador do erro na biblioteca baseia-se na discontinuidade do fluxo que atravessa a face entre dois elementos [65]. Apesar de não ser um indicador rigoroso para uma grande classe de problemas, na prática eles provaram ser largamente aplicáveis. Existe na literatura um extenso número de trabalhos dedicados a obtença˜ o de estimativas a posteriori e indicadores de erros mais confiáveis e precisos que são estreitamente ligados aos operadores e equaço˜ es que governam a aplicaça˜ o do problema. Atualmente, indicadores de refinamento baseados nas contribuiço˜ es residuais no elemento local são a forma mais comum de indicadores encontrado na literatura [12, 36, 35, 61, 37]. Apesar de serem indicadores de erros bastante precisos, requerem o trabalho adicional de resolver um problema dual relacionado que e´ dif´ıcil de incluir em uma biblioteca flex´ıvel, sem comprometer a independência f´ısica. Como o indicador do erro utilizado pela está focado nos indicadores locais, eles são essencialmentes independentes da f´ısica. A biblioteca disponibiliza para o usuário uma grande variedades de métodos de soluça˜ o de equaço˜ es lineares atráves da utilizaça˜ o da biblioteca de alto desempenho PETSc. A biblioteca PETSc e´ formada por um conjunto de rotinas que permitem a implementaça˜ o de códigos seriais e paralelos para a soluça˜ o de sistemas algébricos. Dentre essas rotinas, encontram-se os métodos de soluça˜ o de sistema lineares baseados nos subespaços de Krylov. Os métodos GMRES, CG, e Bi-CGSTAB são alguns exemplos dessas rotinas dispon´ıveis nesta biblioteca. Desta forma, uma variedade de sistemas lineares impl´ıcitos em paralelo podem ser utilizados na biblioteca via uma interface com a biblioteca PETSc. O paralelismo na biblioteca e´ realizado usando técnicas de decomposiça˜ o de dom´ınio [26] através do particionamento da malha, na qual cada processo contém uma cópia da malha global, mas em geral somente um subconjunto particular e´ computado. Para processos de refinamento e desrefinamento, onde a soluça˜ o em regime permanente e´ de interesse, e´ comum considerar incialmente uma malha grossa que vai sendo progressivamente refinada até obter uma malha próxima da o´ tima. E´ o´ bvio que uma partiça˜ o inicialmente balanceada pode rapidamente torna-se muito desbalanceada causando ineficiências computacionais. Conseqüentemente, a malha tipicamente requer frequentes reparticionamentos durante o processo.

(32) 6. de refinamento. O desenvolvimento de esquemas o´ timos de reparticionamento, que consigam tirar vantagens de uma partiça˜ o a priori, em processos de refinamentos paralelos ainda e´ um campo aberto para pesquisa [59]. Na ibMesh a decomposiça˜ o de dom´ınio e´ realizada através de uma interface com duas bibliotecas externas: a METIS e a ParMETIS. Mais detalhes acerca das questões de paralelismo podem ser vistos em [5]. Finalmente, um outro importante fator que afeta consideravelmente o desempenho computacional de problemas transientes e´ a escolha adaptativa do passo no tempo. Existem classes de problemas de interesse que são dependentes do tempo, e que demandam um grande per´ıodo de processamento. Uma forma de melhorar seu desempenho e´ empregar estratégias de seleça˜ o adaptativa do passo no tempo. Esse processo de seleça˜ o geralmente utiliza parâmetros caracter´ısticos da soluça˜ o, como, por exemplo, uma estimativa do erro de truncamento local, para identificar em qual momento o passo no tempo deve ser aumentado ou diminuido. Como exemplo, algoritmos padrões de seleça˜ o do passo de tempo que usam estimativas para o erro de truncamento local são mostrado nos esquemas sugeridos em [62, 73, 17, 38, 21]. Gresho et al. [74] usam um esquema preditor-corretor com estimativas para o erro de truncamento local na seleça˜ o do passo. Gustafsson et al. [50] mostraram que o problema de seleça˜ o automática do passo no tempo pode ser visto como um problema de controle retroalimentado, o que motivou o desenvolvimento de um algoritmo usando o conceito de controle proporcional-integral-derivativo (PID) [52]. Mais tarde, Coutinho e Alves [34] usaram essas idéias no trabalho de simulaça˜ o numérica pelo método dos elementos finitos em meios porosos. Valli et al. [88, 3] desenvolveram dois algoritmos adaptativos na seleça˜ o do passo no tempo, um baseado em controlar uma estimativa para o erro de truncamento local e outro baseado em controlar as mudanças na energia cinética e a taxa de convergência das iteraço˜ es sucessivas. Recentemente, Sördelind [82] desenvolveu uma completa estrutura de controle para seleça˜ o adaptativa do passo, usando teoria de filtros digitais. Neste trabalho, será considerado estratégias de controle do passo no tempo baseadas na teoria de controle conforme desenvolvido em [88, 3]. A idéia e´ implementar uma dessas estratégias de controle do passo no tempo na biblioteca e analisar a sua eficiência em conjunto com os processos de refinamento de malha AMR.. 1.1 Objetivos Primeiro, realizar uma análise comparativa dos principais métodos de soluça˜ o de sistemas lineares e implementar, na biblioteca via PETSc, um método recente e não usual.

(33) 7. como o LCD. Segundo, analisar as principais técnicas adaptativas para o método dos elementos finitos, aplicado a problemas de Mecânica dos Fluidos Computacional. Analisar, em particular, a estratégia adaptativa no espaço utilizada na biblioteca . Introduzir na biblioteca uma estratégia de seleça˜ o do passo do tempo baseada na teoria de controle e avaliar a sua aplicabilidade e seus efeitos quando conjugada com a adaptividade espacial.. 1.2 Organizaça˜ o do texto A organizaça˜ o do texto segue a descriça˜ o dada a seguir. No Cap´ıtulo 2 são descritas duas formulaço˜ es de elementos finitos. Primeiro, e´ apresenta a formulaça˜ o estabilizada de elementos finitos, conhecida como SUPG, para a equaça˜ o de transporte convectivo-difusivo. Segundo, e´ descrito a equaça˜ o governante da equaça˜ o transiente de Navier-Stokes bem com sua formulaça˜ o numérica por elementos finitos. Além disso, e´ apresentado nesse cap´ıtulo as principais caracteristicas da biblioteca . O Cap´ıtulo 3 apresenta as principais caracter´ısticas da biblioteca PETSc e sua utilizaçaˆ o dentro da biblioteca , além de descrever alguns dos métodos numéricos de soluça˜ o de sistemas lineares presentes na biblioteca. Além disso, e´ descrito o método das direço˜ es conjugadas a` esquerda (LCD), não presente ao conjunto de rotinas do PETSc, e detalhes da sua inclusão na biblioteca. O Cap´ıtulo 4 trata do estudo e implementaça˜ o de técnicas adaptativas para o método dos elementos finitos. Na primeira seça˜ o e´ discutido o esquema adaptativo implementado na biblioteca , seguido pela estudo de uma técnica de seleça˜ o adaptativa do passo no tempo usando conceitos de controle automático. Finalmente, na u´ ltima seça˜ o e´ discutida a implementaça˜ o conjunta das adaptatividades espaciais e temporais na biblioteca . O Cap´ıtulo 5 está dividido em duas partes. Na primeira e´ realizado um estudo de desempenho e esforço computacional dos métodos GMRES, Bi-CGSTAB e LCD para a soluça˜ o de sistemas de equaço˜ es não simétricos obtidos na discretizaça˜ o por elementos finitos de problemas de convecça˜ o-difusão. Na segunda parte e´ analisado o desempenho computacional do algoritmo de seleça˜ o do passo no tempo, na obtença˜ o de soluço˜ es em regime permanente, quando aplicados em discretizaço˜ es por malhas fixas uniformes e, principalmente, seu desempenho quando aplicado ao processo de refinamento uniforme de malhas. Finalmente, no Cap´ıtulo 6 são apresentadas as conclusões, consideraço˜ es finais e propostas de trabalhos futuros..

(34) 8. 1.3 Recursos computacionais Todos os códigos implementados foram compilados usando os compiladores gnu gcc e g++ (versão 3.4) em ambiente linux. Os testes realizados para a análise de desempenho dos métodos iterativos foram realizados em uma máquina Intel Pentium 4 de 2.26GHZ, 512k de cache L2 e 512 MB de memória RAM. No avaliaça˜ o da implementaça˜ o do algoritmo de seleça˜ o do passo no tempo foi utilizada uma máquina Intel Pentium 4 de 3GHz, 1M de cache L2 e 1GB de memória RAM. Os recursos computacionais utilizados neste trabalho estão dispon´ıveis no Laboratório de Computaça˜ o de Alto Desempenho - LCAD4 , da universidade federal do Espirito Santo, e no Laboratório de Dinâmicas de Flu´ıdos Computacionais - CFDlab5 da universiade do Texas em Austin, EUA.. 4 http://www.lcad.inf.ufes.br 5 http://www.cfdlab.ae.utexas.edu/.

(35) 2. Formulaça˜ o e Aproximaça˜ o. Nesse cap´ıtulo são apresentadas as formulaço˜ es de elementos finitos implementadas na biblioteca para as equaço˜ es advecça˜ o-difusão e Navier-Stokes. Além disso, na u´ ltima seça˜ o e´ apresentada uma descriça˜ o das principais caracter´ısticas da biblioteca. . Serão apre-. sentadas duas formulaço˜ es de elementos finitos. A primeira delas e´ a formulaça˜ o para a equaça˜ o do transporte convectivo-difusivo. Nesse caso, devido a poss´ıveis instabilidades numéricas geradas pelo termo convectivo, será usada a formulaça˜ o estabilizada de elementos finitos conhecida como formulaça˜ o streamline-upwind/Petrov-Galerkin (SUPG). A segunda formulaça˜ o que será apresentada e´ a tradicional formulaça˜ o de Galerkin para as equaço˜ es de Navier-Stokes. Neste caso, foi utilizado o método de Newton-Raphson para a resoluça˜ o dos sistemas não lineares e o método θ de integraça˜ o no tempo.. 2.1 Formulaça˜ o SUPG para a equaça˜ o de transporte A equaça˜ o de convecça˜ o-difusão bidimensional em regime permanente pode ser definida pela equaça˜ o. β ∇u ∇ κ ∇u . f. em Ω. (2.1). onde Ω e´ uma região de IR2 , u e´ a variável a ser transportada (temperatura, concentraça˜ o, etc),. β βx βy T e´ o campo de velocidade do fluido, f e´ o termo fonte e κ e´ a difusividade volumétrica dada por. κ. kx 0 0. ky. . (2.2). Na equaça˜ o, β ∇u e´ o termo convectivo, no qual afeta a distribuiça˜ o da quantidade transportada. na direça˜ o do escoamento, e ∇ κ ∇u e´ o termo difusivo, no qual afeta a distribuiça˜ o da quan-. tidade transportada em todas as direço˜ es. Nos experimentos o campo de velocidade do fluido e´ considerado com divergência nula, ou seja, ∇ β 0. E´ necessário ainda definir as condiço˜ es.

(36) 10. de fronteira para o problema. Neste trabalho serão consideradas as seguintes condiço˜ es u g em Γg . (2.3). κ ∇u n 0 em Γh . (2.4). onde g e´ uma funça˜ o conhecida de x x y T , Γ Γg Γh e´ o contorno do dom´ınio e n . nx ny T o vetor normal externo de Γ.. O método de Galerkin e´ a formulaça˜ o geralmente utilizada na discretizaça˜ o espacial dos problemas predominantemente difusivos. Entretanto, na presença de escoamentos predominantemente convectivos, esta formulaça˜ o não gera bons resultados, apresentando oscilaço˜ es espúrias, que não pertencem ao problema f´ısico, mas que são devidas a` s instabilidades da formulaça˜ o utilizada. Como forma de diminuir essas oscilaço˜ es, Brooks e Hughes [19] apresentaram uma formulaça˜ o estabilizada de elementos finitos denominada Streamline/Upwind Petrov-Galerkin, SUPG. A idéia básica do método e´ introduzir difusão (ou viscosidade) somente na direça˜ o do escoamento. O método de Galerkin, extendido com a formulaça˜ o PetrovGalerkin, e´ modificado adicionando uma pertubaça˜ o na direça˜ o das linhas de corrente. A equaça˜ o (2.1) se encontra na sua forma forte. Para definir a formulaça˜ o fraca ou variacional do problema define-se dois conjuntos de funço˜ es. O primeiro conjunto, denominado de , corresponde ao conjunto das funço˜ es de teste u, que satisfazem as condiço˜ es de contorno e são quadrado integráveis. A segundo conjunto são as funço˜ es peso w, denominado , que são similares a funço˜ es de teste, porém, satisfazem condiço˜ es nulas no contorno. De modo geral, essas funço˜ es são aproximadas por funço˜ es de dimensão finita definidas por: φ h φ h H h φ h g em Γg . (2.5). h wh wh H h wh 0 em Γg . (2.6). h. e. onde H h e´ o conjunto de funço˜ es quadrado integráveis admiss´ıveis para o problema (2.1) no espaço de dimensão finita. No método de Galerkin usual, as funço˜ es peso são consideradas cont´ınuas ao longo das fronteiras entre os elementos. A formulaça˜ o SUPG, entretanto, requer funço˜ es pesos descont´ınuas da forma w˜ w p . (2.7). onde, w e´ uma funça˜ o peso cont´ınua e p e´ a contribuiça˜ o descont´ınua SUPG. Ambos, w e p são assumidos suáveis no interior dos elementos..

(37) 11 nel . Considerando uma discretizaça˜ o por elemento finitos do dom´ınio Ω em nel elementos, Ωe , e 1 2. nel , tal que, Ω . e 1. Ωe e Ωi Ω j 0, / a formulaça˜ o estabilizada SUPG para o. problema (2.1) e´ dada por . h. w˜ β ∇u ∇ κ ∇u dΩe h. ∑. Ωe. e. h. h. Substituindo (2.7) em (2.8) e tomando p τ duyar, Liou e Behr [83], tem-se, . . Ωe. . . . e. Ωe. w˜ h f dΩe. (2.8). β ∇w, por exemplo, segundo estudos de Tez β. Galerkin. Ωe. e. ∑. wh β h ∇uh ∇ κ ∇uh dΩe . . ∑. . τ. h. ∇wh β h ∇uh ∇ κ ∇uh dΩe β . β. h. . Petrov Galerkin. wh τ. Ωe. h. ∇wh f dΩe β . β. (2.9). h. Fonte. Integrando por partes o termo de Galerkin, obtém-se . . Ωe. . w β ∇u dΩe h h. τ. ∑ β h e. . . Ωe. . h. . Ωe. ∇wh κ ∇uh dΩe . Galerkin. β ∇w β ∇u dΩe h. Ωe. h h. . h. Ωe. β h ∇wh ∇ κ ∇uh dΩe . Petrov Galerkin. wh τ. h. β h . β. ∇wh f dΩe . (2.10). Fonte. O parâmetro de estabilizaça˜ o SUPG τ presente na equaça˜ o (2.10) possui várias definiço˜ es. Neste trabalho e´ utilizada a definiça˜ o dada em [83]:. τ. α h˜ 2. (2.11).

(38) 12. com. h˜ . 2A Pe α min 1 3 ˜ β h Pe k˜ βT βT κ k˜ β β. (2.12) (2.13) (2.14) (2.15). onde A e´ a´ rea do elemento, h˜ e´ o tamanho caracter´ıstico do elemento, β e´ o vetor velocidade e Pe e´ o número de Peclet do elemento local. Considerando uma base φ j , j 1 2. N, para o espaço das aproximaço˜ es. h,. φ h pode. ser representada da seguinte forma: uh x . N. ∑ u jφ j. (2.16). x. j 1. onde N e´ o número de nós na malha de elementos finitos e u j , j 1 2. N, são os valores da. soluça˜ o aproximada nos nós da malha. Substituindo a equaça˜ o (2.16) em (2.10) e considerando wh φi para i 1 2. N, obtem-se um sistema de equaço˜ es lineares da forma: Ku F. sendo, K uma matriz de ordem N. (2.17). N conhecida como matriz de rigidez, u e´ o vetor da soluça˜ o. aproximada e F e´ o termo fonte. A principal caracter´ıstica do método de elementos finitos e´ que tanto K quanto F podem ser calculados por uma soma inteligente das contribuiço˜ es de cada elemento num processo chamado de assembling. Esse processo e´ indicado abaixo: nel K F . A Ke. (2.18). A Fe. (2.19). e 1 nel. e 1. onde A indica o assembling das contribuiço˜ es de cada elemento. No n´ıvel do elemento, Ke e Fe são formados pelas contribuiço˜ es do método de Galerkin e Petrov-Galerkin. Além disso, na matriz de rigidez Ke essas contribuiça˜ o são divididas pelos termos convectivo e difusivo. Dessa forma, a obtença˜ o de Ke e Fe pode ser representada pelos.

(39) 13. seguintes somatórios: e e e Ke KeD G KC G KD PG KC PG. (2.20). Fe FeG FePG. (2.21). e. onde os sub-´ındices D e C indicam os termos difusivos e convectivos, respectivamente. Já os sub-´ındices G e PG correspondem, respectivamente, as contribuiço˜ es de Galerkin e PetrovGalerkin. Cada termo do somatório está apresentado em detalhe abaixo: . Termo difusivo de Galerkin KeD G KeD G i j . e KC G. e KC G. i j . Ωe. KeD PG. τ i j β. τ β. FeG. FeG. i . Termo fonte de Petrov-Galerkin FePG. e PC PG. ∇φiT β ∇ κ ∇φ j dΩe. (2.24). ∇φiT β T β ∇φ j dΩe. (2.25). Ωe. . Termo fonte de Galerkin. (2.23). Ωe. Termo convecça˜ o de Petrov-Galerkin e KeD PG KC PG i j . φi β T ∇φ j dΩe. . Termo difusivo de Petrov-Galerkin KeD PG. (2.22). Ωe. . Termo convectivo de Galerkin. ∇φiT κ ∇φ j dΩ. τ i β. Ωe. φi f dΩe. Ωe. β T ∇φi f dΩe. (2.26). (2.27). Uma vez gerado o sistema de equaço˜ es (2.17), este deve ser resolvido por um método eficiente de resoluça˜ o de sistema linear de grande porte. Tais métodos serão discutidos no Cap´ıtulo 3. A seguir será apresentada a formulaça˜ o de elementos finitos para as equaço˜ es de Navier-Stokes..

(40) 14. 2.2 Formulaça˜ o de Galerkin para as equaço˜ es de Navier-Stokes Considerando um fluido viscoso e incompress´ıvel ocupando uma região Ω

(41) IR2 , com contorno. ∂ Ω, as equaço˜ es de Navier-Stokes transientes podem ser expressas por du 1 u ∇u ν ∇2 u ∇p f dt ρ ∇ u 0. em Ω. (2.28). em Ω. (2.29). onde u u v e´ campo de velocidades, p e´ a pressão, f e´ o termo fonte, ρ e´ a densidade do fluido e ν e´ a viscosidade. A equaça˜ o (2.28) representa a equaça˜ o de momento e a equaça˜ o (2.29) representa a equaça˜ o de conservaça˜ o da massa, que e´ muito freqüentemente chamada de equaça˜ o da continuidade. Estas equaço˜ es estão sujeitas a condiça˜ o de contorno de Dirichlet imposta, dado por u g em ∂ Ω. (2.30). e a condiça˜ o inicial u x 0 u0 x . Realizando as seguintes substituiço˜ es u . u U v x y p t t v x y p 2 U U L L ρU L. onde U e L são, respectivamente, a velocidade e o tamanho de referência, chega-se na formulaça˜ o adimensional das equaço˜ es de Navier-Stokes, conforme apresentada abaixo, 1 2 du u ∇u ∇ u ∇p f dt Re ∇ u 0 sendo Re . LU ν. em Ω. (2.31). em Ω. (2.32). o número de Reynolds.. A formulaça˜ o fraca ou variacional do problema pode ser descrita como [24]: encontrar . u satisfazendo as condiço˜ es essenciais de contorno e p tal que Ω. . 1 du w u ∇ u w ∇u : ∇w ∇p w dΩ dt Re f w dΩ . Ω. (2.33). Ω. ∇ u q dΩ 0. (2.34). w admiss´ıvel, com w 0 em ∂ Ω, e q admiss´ıvel, onde e são as classes de funço˜ es testes para a velocidade e pressão, respectivamente. Seja h e h aproximaço˜ es para os espaços de funço˜ es e , respectivamente. A.

(42) 15. formulaça˜ o de Galerkin para as equaço˜ es (2.33) e (2.34) pode ser escrita como: encontrar uh h. . satisfazendo as condiço˜ es de fronteira e ph h , tal que Ω. . duh h 1 w uh ∇ uh wh ∇uh : ∇wh ∇p wh dΩ dt Re f wh dΩ . Ω. (2.35). Ω. ∇ uh qh dΩ 0. (2.36). wh h admiss´ıvel, com wh 0 em ∂ Ω, e qh h . Introduzindo uma discretizaça˜ o por elementos finitos e escolhendo funço˜ es bases apropriadas que satisfaz a condiça˜ o de estabilidade de Ladyzhenskaya, Babuska e Brezzi (LBB) [67, 6, 18], as funço˜ es uh e ph podem ser aproximadas por: N. ∑ u jφ j. uh x . x. (2.37). x. (2.38). j 1 M. ∑ pl ψl. ph x . l 1. Considerando a funça˜ o de peso wh φr 0 , r 1. N, e substituindo as expressões (2.37). e (2.38) nas equaço˜ es (2.35) e (2.36), obtem-se um sistema de equaço˜ es diferenciais ordinárias não-linear da forma . 1 dU U U P dt Re T U 0. onde U uT vT , com uT u1 u2 uN , vT M 0 A 0 M 0. . com M mi j . mi j . Bx bx il . Ωh. . φi φ j dΩ i j 1. ai j bx il . By by il Fx Fx i . (2.40). v1 v2 vN e PT p1 p2 pM T e Fx 0 Bx e Fy By A. . A ai j . (2.39). Ωh. Ωh. ∇φi ∇φ j dΩ. . φi x ψl dΩ l 1. by il Fx i . N. . Ωh. Ωh. (2.41). (2.42) (2.43). M. (2.44). φi y ψl dΩ. (2.45). fx φi dΩ. (2.46).

(43) . Fy Fy i e uh . Ωh. Fy i . 16. Ωh. fy φi dΩ. uh ∇ uh wh dΩ. (2.47). (2.48). e´ o termo não linear da equaça˜ o (2.39). Integrando implicitamente no tempo usando o método tradicional θ , a cada passo no tempo . 1 n n θ U U P Re. 1 n 1 n 1 n 1 U P 1 θ U Re. tn e´ preciso resolver n. U Un 1 ∆t. n. θ n 1 θ n 1 0. (2.49). T Un 0. (2.50). Uma vez que U e´ uma funça˜ o não linear de U, e´ preciso resolver a cada passo no tempo, tn, um sistema não linear da forma g rn 0. (2.51). com rT UT PT . Linearizando (2.51) pelo método de Newton, obtem-se um sistema linear da forma J rnk rnk 1 g rnk 1 . a ser resolvido a cada passo k 1 2 por. J

(44). 1 M ∆t θ Re A. 0 Bx T. (2.52). do proceso iterativo, sendo J, a matriz jacobiana dada ∂ i 1 M ∆t θ Re A ∆t θ By ∂rj By T 0 0. ∆t θ Bx. (2.53). e g rnk 1 M ∆t θ Unk 1 ∆t θ BPnk 1 ∆t θ D Unk 1 I. (2.54). com 1 n 1 A Uk 1 Re n 1 1 1 θ ∆tB Pk 1 1 θ ∆t D Un k 1 . I M 1 θ ∆t. θ ∆tF n 1 θ ∆tF n 1. (2.55). (2.56).

(45) 17 . Sabendo que o termo não linear U pode ser escrito como . i U . Ωh. N i U o cálculo da sua derivada. ∂ i ∂rj. Ωh. . ∂ uh ∂u φi vh h φi dΩ e ∂x ∂y ∂ vh ∂v uh φi vh h φi dΩ ∂x ∂y uh. (2.57) (2.58). e´ dado a seguir. ∂ i ∂uj ∂ i ∂vj ∂ i ∂ pl ∂ N i ∂uj ∂ N i ∂vj ∂ N i ∂ pl. . . Ωh. Ωh. uh ∇φ j φi . φi φ j. . ∂ uh φi φ j dΩ ∂x. ∂ uh dΩ ∂y. 0 . . Ωh. Ωh. (2.59) (2.60) (2.61). φi φ j. ∂ vh dΩ ∂x. uh ∇φ j φi . (2.62). ∂ vh φi φ j dΩ ∂y. 0. (2.63) (2.64). Desta forma, o jacobiano final pode ser representado pela seguinte matriz. ∂ i 1 i θ θ B ∆t ∆t A ∂∂ M ∆t θ Re x u1j ∂ u2j. . ∂ N i ∂ N i 1 J ∆t θ ∂ u1 M ∆t θ Re A ∂ u2 ∆t θ By

(46) j j T T Bx By 0. (2.65). Na implementaça˜ o padrão utilizada pela biblioteca , a cada passo no tempo e´ preciso resolver uma sequência de sistemas lineares, até uma precisão fornecida, da seguinte forma K rnk F. (2.66). onde K J rnk 1 e F J rnk 1 rnk 1 g rnk 1 . Avaliando o lado direito do sistema, obtém-se F J Uk 1 ∆t θ Unk 1 ∆t θ Pnk 1 ∆t θ Unk 1 I. (2.67). Simplificando, chega-se em F ∆t θ f˜ I. (2.68).

(47) 18 . onde f˜ f˜x f˜y 0 T com f˜x i f˜y i . h. uh ∇uh φi dΩ. (2.69). Ω. uh ∇vh φi dΩ. (2.70). Ωh. A sobreposiça˜ o das contribuiçoes nodais de cada elemento conduz na formaça˜ o da matriz K global assim como os vetor F, sendo então nel K F . A Ke. (2.71). A Fe. (2.72). e 1 nel. e 1. A matriz Ke e o vetor Fe , por sua vez, são formados por submatrizes e subvetores, relacionados com o sistema jacobiando inicial e com as seguinte estrutura:. Kuu Kuv Kup . Ke

(48) Kvu Kvv Kvp e Fe K pu K pv K pp. . Fv

(49) Fp Fu. (2.73). O cálculo de cada uma dessas submatrizes e subvetores e´ apresentado no Apêndice A. Os sistemas são resolvidos utilizando os métodos de resoluça˜ o linear apresentados no Cap´ıtulo 3. Nos testes númericos apresentados na Seça˜ o 5.2 e´ utilizado o método de Euler impl´ıcito (θ 1) para a integraça˜ o no tempo. A razão dessa decisão e´ que o método de segunda ordem CrankNicolson e´ notoriamente oscilatório para problemas com dados iniciais descont´ınuos, tais como, o problema da cavidade e alargamento de canal. Na próxima seça˜ o serão apresentadas as caracter´ısticas principais da biblioteca ibMesh utilizada para a implementaça˜ o das formulaço˜ es de elementos finitos apresentadas aqui.. 2.3. : biblioteca para simulaço˜ es paralelas com refinamento adaptativo da malha de elementos finitos. Um dos principais objetivos da biblioteca e´ oferecer uma plataforma de pesquisa para algoritmos adaptativos e paralelos, fornecendo um ambiente para simulaço˜ es em elementos finitos de problemas com multif´ısicas e multiescala de modo confiável e reutilizável [5]. A sua criaça˜ o foi poss´ıvel por dois fatores principais. O primeiro e´ a existência de uma infraestrutura paralela robusta tanto de software quanto de hardware, que inclui cluster de PC’s rodando.

(50) 19. linux e implementaço˜ es de alto desempenho usando o padrão MPI. O segundo e´ a evoluça˜ o da metodologia de malhas adaptativas, de algoritmos de decomposiça˜ o de dom´ınio e técnicas de reparticionamento eficientes. A biblioteca foi originalmente projetada para fornecer uma estrutura de dados poderosa que apoiasse o refinamento adaptativo de malhas não estruturadas surgidas nas simulaço˜ es de elementos finitos. Esforços subseqüentes foram realizados no desenvolvimento da biblioteca com intuito de promever melhorias no desempenho, suporte a um números maior de elementos finitos e na implementaça˜ o de algoritmos para problemas transientes e não-lineares. Dentro desses esforços, sem dúvida nenhuma, o mais importante foi a implementaça˜ o de técnicas paralelas no processo de refinamento adaptativo. Os recursos dispon´ıveis na biblioteca permite ao usuário final da biblioteca focar, na maior parte do tempo, na modelagem do problema ao invés da codificaça˜ o da aplicaça˜ o. O objetivo de combinar adaptatividade e paralelismo e´ claramente agrupar os benef´ıcios de ambas técnicas em resolver os problemas de forma mais eficiente. No paralelismo, pela reduça˜ o do custo computacional quando comparado ao tempo de processamento em plataformas seriais. No refinemento, por permitir obter soluça˜ o em malhas mais grossas porém mais bem projetadas com grau de exatidão comparável a uma malha padrão não-adaptativa. E´ claro que, quando utilizados refinamento adaptativo e paralelismo, camadas adicionais de complexidade são adicionadas na análise do problema, na metodologia, nos algoritmos e nas estruturas de dados utilizados. Além disso, há um custo adicional associado com a implementaça˜ o de ambos e esses fatores devem ser levados em conta. Entretanto, fica claro que cada uma dessas estratégias oferecem uma capacidade computacional a mais aos usuários finais. Experiências com outras bibliotecas paralelas de alto desempenho usando a linguagem de programaça˜ o C++, influenciaram no projeto da biblioteca. . O suporte a orientaça˜ o. a objetos em C++ permite que os desenvolvedores escrevam seus códigos usando interfaces com classes abstratas as quais definem, por exemplo, em tempo de compilaça˜ o ou em tempo de execuça˜ o, o tipo de elemento finito a ser usado e/ou a regra de quadratura a ser usada no processo de integraça˜ o numérica. Para reduzir o custo das chamadas das funço˜ es virtuais das classes abstratas, os desenvolvedores do decidiram usar poucas chamadas de funço˜ es que desempenham grandes operaço˜ es, ao invés, de chamar muitas funço˜ es que executam poucas operaço˜ es. Embora a escrita de códigos eficientes em C++ possa ser dif´ıcil, a linguagem suporta diferentes estilos de programaça˜ o, facilitando a escrita de códigos de diferentes complexidades e na manutença˜ o dos mesmos, uma vantagem quando comparados com as linguagens de n´ıveis.

(51) 20. mais baixo, tal como, C e Fortran. As linguagens C e Fortran são rápidas e mais populares para a análise numérica, mas não possui a metodologia adequada de orientaça˜ o objetos requeridas pelos desenvolvedores da biblioteca . Além disso, o C++ provê um mecanismo natural de encapsulamento para as interface com as bibliotecas de terceiros através de uma interface comum, e a orientaça˜ o objeto permite um ajuste adequado nas camadas de complexidades introduzidas pela combinaça˜ o entre o paralelismo e a adaptatividade. A facilidade de ligaça˜ o dos códigos C, Fortran e Assembler dentro de aplicaço˜ es C++ também permitem a biblioteca fazer o uso de bibliotecas existentes escritas na linguagens de n´ıveis mais baixo. A existência de compiladores de alta qualidades com suporte a diferentes hardwares mantém a biblioteca portável em diferentes plataformas. A maior parte do desenvolvimento da biblioteca foi realizado em máquinas rodando Linux usando a coleça˜ o de compiladores GNU, mas outras platafomas também são suportadas. A biblioteca faz um uso extensivo das bibliotecas padrões do C++, essenciais para a utilizaça˜ o em múltiplos compiladores, evitando a construça˜ o de códigos espec´ıficos para determinados compiladores. O suporte aos compiladores nativos no e´ voltado principalmente para a geraça˜ o de códigos otimizados. Em arquiteturas, tal como o IBM Power 5 e Intel Itanium II, há um grande número de instruço˜ es complexas espec´ıficas para elas. Os compiladores desenvolvidos para essas plataformas tratam essas instruço˜ es de modo mais otimizado. Para essas razões, a biblioteca tem sempre sido testada com uma variedade de compiladores, antes dos lançamentos oficiais das novas plataformas. Um efeito dessa técnica e´ que a biblioteca foi posteriormente transportada para arquiteturas adicionais tal como OSX e Windows com pouca dificuldade. Outra caracter´ıstica presente no e´ o investimento, sempre que poss´ıvel, em bibliotecas existentes que possam agregar funcionalidades a` mesma, evitando que tarefas necessárias na simulaça˜ o que já foram implementadas, sejam codificadas novamente. Dentre essas bibliotecas há aquelas responsáveis pela geraça˜ o de malhas, tais como, Triangle [79], responsável pela triangularizaça˜ o de Delaunay e o TetGen [80], um gerador de malhas 3D com tetraedros. A biblioteca usa as bibliotecas METIS [63] e ParMETIS [64] para a decomposiça˜ o de dom´ınio. Esquemas de particionamento adicionais podem ser inseridos na biblioteca com bastante facilidade através de subclasses em C++. A biblioteca providencia uma classe base abstrata

(52)

(53) que define a interface de particionamento e classes derivadas podem servir como empactadores de bibliotecas externas de particionamento. O paradigma de classes abstratas/derivadas também e´ usado para criar uma interface com pacotes de algebra linear. Neste caso, a biblioteca ibMesh disponibiliza as classes abstratas

(54) ,

(55) , e . Classes derivadas são então implementadas de acordo com o pacote linear utilizado. Dentre esse pacotes, tem o LasPack[81] para máquinas seriais e a.

(56) 21. biblioteca PETSc [7] para plataformas seriais e paralelas. Considerando o paradigma de orientaça˜ o a objetos, as principais estruturas de dados usados na biblioteca são implementados através de classes. As principais delas são apresentadas a seguir e o foco da discussão baseia-se nas funcionalidades básicas e nas razões sustentadas em diretrizes do projeto. Malha A classe e´ a principal estrutura da biblioteca . Ela provê uma representaça˜ o discreta de um dom´ınio no espaço d-dimensional, onde d e´ 1,2 ou 3. Essa discretizaça˜ o e´ composta por dois tipos de dados armazenados na malha: os elementos e os nós. Esses dados, por sua vez, são encapsulados em objetos abstratos que permitem a implementaça˜ o de malhas não estruturadas e com elementos de diferentes formas sem grande impacto na implementaça˜ o. Nós Cada objeto da classe armazena a localizaça˜ o x y z no espaço, bem como, informaço˜ es adicionais, tais como, o número de identificaça˜ o u´ nica global (ID) e os ´ındices do grau de liberdade. Várias operaço˜ es triviais sobre a malha, tal como, escalonamento, translaça˜ o e rotaça˜ o são executadas diretamente sobre os nós. Durante o processo de refinamento, novos nós podem ser adicionados a malha. Quando dois elementos adjacentes são refinados, nós comuns passam a existir na interface entre esses elementos. Para resolver essa situaça˜ o e´ utilizada uma discretizaça˜ o válida que não gere nenhum nó duplicado. Um novo nó e´ criado como uma combinaça˜ o linear dos nós existentes e uma chave hash e´ criada baseada nas informaço˜ es dos nós pais. Se essa chave já existe no mapeamento de chaves hash, o novo nó e´ duplicado e deve ser rejeitado. Similarmente, no processo de desrefinamento pode ocorrer a criaça˜ o de nós orfãos, ou nós que não estão conectados em nenhum elemento. Depois de desrefinamento, a biblioteca simplesmente conta o número de elementos conectados em cada nó e remove aqueles nós que não estão conectados em nenhum elemento. Elementos define a classe abstrata que implementa a interface para um elemento geométrico. Diversos tipos de elementos estão presentes na biblioteca através de classes derivadas da classe . Nesse contexto, tem-se como exemplo as classes Tri3 e Tet10, correspondente as implementaço˜ es para o elemento triangular linear com 3 nós e o tetraedro com 10 nós, respectivamente. A coleça˜ o de todos os tipos geométricos de elementos finitos implementados na biblioteca inclui quadriláteros, triangulos, hexaedros, tetraedos, prismas e pirâmides, bem como, um coleça˜ o de elementos infinitos. A lista completa de todos os tipos de elementos está apresentada.

(57) 22. na Figura 2.1.. Figura 2.1: Hierarquia da classe Conectividade Nodal A conectividade dos elementos e´ armazenada através de um ponteiro para os nós. Essa técnica e´ uma variaça˜ o da estrutura de dados clássica de elementos finitos, na qual a conectividade e´ definida em termos de ´ındices nodais [43]. Por armazenar os ponteiros dos nós, os elementos podem determinar sua conectividade geométrica diretamente. Isto simplifica muitas funço˜ es no código por requerer, do usuário, apenas o elemento ao invés do elemento e a localizaça˜ o nodal. Sistema A classe

(58) na biblioteca corresponde a um sistema de equaço˜ es diferenciais.

(59) 23. parciais de uma ou mais equaço˜ es, que e´ resolvida em uma dada malha. Há suporte a sistemas expl´ıcitos, impl´ıcitos, dependente do tempo, linear e não linear. Um objeto

(60) armazena os valores da soluça˜ o para os graus de liberdade em uma simulaça˜ o, que podem ser tantos reais ou complexos. Além disso, o sistema pode conter informaço˜ es adicionais tal como a matriz esparsa necessária para a estratégia impl´ıcita de soluça˜ o. A classe

(61) provê uma interface genérica e customizada que permite ao usuário especificar as partes dependentes da f´ısica do problema. Por exemplo, no caso de um sistema impl´ıcito, o usuário pode definir uma funça˜ o que realiza o assembler da matriz ou derivar sua própria classe e sobrepor o operador do assembler original. Similarmente, para problemas transientes o usuário pode definir suas próprias funço˜ es de inicializaça˜ o ou sobrepor o operador de inicializaça˜ o da biblioteca..

(62) 3. Métodos Iterativos Lineares. Nesse cap´ıtulo e´ discutido o papel da biblioteca PETSc [7, 8, 9] dentro da biblioteca juntamente com a descriça˜ o de alguns dos métodos numéricos de soluço˜ es de sistemas lineares presentes na biblioteca. Dois desses métodos numéricos serão comentados com maior detalhe, método dos res´ıduos m´ınimos generalizados (GMRES) [77] e método dos gradientes bi-conjugados estabilizados (Bi-CGSTAB) [89]. Por fim, será descrito o método das direço˜ es conjugadas a` esquerda (LCD) [93], não presente ao conjunto de rotinas do PETSc, e sua inclusão na biblioteca.. 3.1 Biblioteca PETSc A biblioteca PETSc e´ uma ferramenta, constitu´ıda de rotinas que permitem a implementaça˜ o de códigos paralelos ou seriais para a soluça˜ o de sistemas algébricos. Ela foi desenvolvido pelo Laboratório Nacional de Argonne 1 , com o intuito de prover algoritmos eficientes para a soluça˜ o numérica de equaço˜ es diferenciais. Embora seja escrito nas linguagens C e Fortran, a biblioteca foi constru´ıda usando o paradigma de orientaça˜ o a objetos. Pode ser facilmente utilizada em códigos de aplicaço˜ es cient´ıficas de grande escala. PETSc provê para a biblioteca todas as estruturas necessárias para o armazenamento, manipulaça˜ o de vetores e matrizes e métodos de soluça˜ o de sistemas lineares e não lineares. A Figura 3.1 mostra a organizaça˜ o hierárquica entre as bibliotecas e PETSc com os principais componentes da biblioteca PETSc utilizados pela biblioteca . Na base da hierarquia apresentada pela Figura 3.1 encontra-se o conjunto de rotinas da biblioteca MPI (do inglês, Message Passing Interface) [45]. Essa biblioteca dá o suporte necessário para o desenvolvimento de aplicaço˜ es paralelas atráves do protocolo de troca de mensagens entre processos. A utilizaça˜ o do paradigma de troca de mensagens e´ atrativa porque permite o desenvolvimento de códigos mais portáveis e escaláveis, além de ser compat´ıvel tanto em multicomputadores com memória distribu´ıda, quanto em multiprocessos com memória com1 http://www.anl.com.