• Nenhum resultado encontrado

Redes gerativas adversárias convolucionais aplicadas na reconstrução de padrões de conectividade de reservatórios

N/A
N/A
Protected

Academic year: 2021

Share "Redes gerativas adversárias convolucionais aplicadas na reconstrução de padrões de conectividade de reservatórios"

Copied!
134
0
0

Texto

(1)

Rodrigo Exterkoetter

REDES GERATIVAS ADVERS ´ARIAS

CONVOLUCIONAIS APLICADAS NA RECONSTRUC¸ ˜AO DE PADR ˜OES DE CONECTIVIDADE DE

RESERVAT ´ORIOS

Florian´opolis 2019

(2)
(3)

REDES GERATIVAS ADVERS ´ARIAS

CONVOLUCIONAIS APLICADAS NA RECONSTRUC¸ ˜AO DE PADR ˜OES DE CONECTIVIDADE DE

RESERVAT ´ORIOS

Disserta¸c˜ao submetida ao Programa de P´os-Gradua¸c˜ao em Ciˆencia da Com-puta¸c˜ao para a obten¸c˜ao do Grau de Mestre em Ciˆencia da Computa¸c˜ao. Orientador

Universidade Federal de Santa Cata-rina: Prof. Dr. Mauro Roisenberg

Florian´opolis 2019

(4)

Exterkoetter, Rodrigo

Redes Gerativas Adversárias Convolucionais Aplicadas na Reconstrução de Padrões de Conectividade de Reservatórios / Rodrigo

Exterkoetter ; orientador, Mauro Roisenberg, 2019. 132 p.

Dissertação (mestrado) - Universidade Federal de Santa Catarina, Centro Tecnológico, Programa de Pós Graduação em Ciência da Computação, Florianópolis, 2019.

Inclui referências.

1. Ciência da Computação. 2. Redes Gerativas Adversárias Convolucionais. 3. Geoestatística Multipontos. 4. Caracterização de Reservatórios. 5. Reconstrução de Padrões de Conectividade. I. Roisenberg, Mauro. II. Universidade Federal de Santa Catarina. Programa de Pós-Graduação em Ciência da Computação. III. Título.

(5)
(6)
(7)

Agrade¸co `a Coordena¸c˜ao de Aperfei¸coamento de Pessoal de N´ıvel Superior - Brasil (CAPES) pela bolsa de estudos CAPES/DS com o c´odigo de financiamento 1633133, ao CENPES/PETROBRAS pelo su-porte financeiro e disponibilidade durante os projetos de pesquisa e desenvolvimento executados ao decorrer da minha forma¸c˜ao, ao meu orientador e aos meus colegas do L3C pelo excelente ambiente de tra-balho e aprendizado constante.

(8)
(9)

Na ind´ustria de explora¸c˜ao de petr´oleo, a modelagem de um reser-vat´orio de ´oleo e g´as inclui o desenvolvimento de um modelo geol´ogico que represente o espa¸co f´ısico e seus atributos de rochas. Uma quest˜ao cr´ıtica ´e determinar a arquitetura interna do reservat´orio e conectivi-dade, com o objetivo de encontrar um canal de fluxo para a perfura¸c˜ao dos po¸cos produtores e injetores. Uma das t´ecnicas utilizadas para a modelagem do reservat´orio ´e a invers˜ao s´ısmica. Devido `as limita¸c˜oes f´ısicas e `a baixa resolu¸c˜ao dos dados s´ısmicos, os padr˜oes de conectivi-dade s˜ao dif´ıceis de serem identificados. Para lidar com este problema, o estado da arte prop˜oe uma combina¸c˜ao de invers˜ao s´ısmica com ge-oestat´ıstica multipontos, que imp˜oe padr˜oes de conectividade durante a otimiza¸c˜ao do processo de caracteriza¸c˜ao de reservat´orios. No en-tanto, esta abordagem tem um alto custo computacional e depende de uma avalia¸c˜ao emp´ırica do int´erprete profissional sobre os modelos estimados. Neste trabalho, propomos um modelo de redes gerativas advers´arias convolucionais para reconstru¸c˜ao do padr˜ao de conectivi-dade do reservat´orio de petr´oleo aplicada aos resultados de t´ecnicas tradicionais de invers˜ao s´ısmica. Os resultados mostram que o modelo proposto ´e capaz de aprender os padr˜oes de conectividade do reser-vat´orio de petr´oleo a partir dos dados e reproduzi-los em imagens de f´acies p´os-invers˜ao.

Palavras-chave: Redes Gerativas Advers´arias Convolucionais, Invers˜ao S´ısmica, Geoestat´ıstica Multipontos, Caracteriza¸c˜ao de Reservat´orios, Padr˜oes de Conectividade

(10)
(11)

In the petroleum exploration industry, the modeling of an oil and gas reservoir includes the development of a geological model that repre-sents the physical space and its rock attributes. The critical issue is determining the internal reservoir architecture and connectivity, aiming to find a flow channel for drilling the injector and the producer wells. One of the techniques used for the reservoir modeling is the seismic inversion. Due to physical limitations, and the seismic data being of low resolution, connectivity patterns are difficult to be identified. To tackle this problem, the state-of-the-art methods proposes a combina-tion of seismic inversion with multi-point geostatistics, which imposes connectivity patterns during the optimization of the reservoir charac-terization process. However, this approach has a high computational cost and depends on a professional interpreter empirical evaluation to analyze the results obtained. In this work, we propose a deep convo-lutional generative adversarial network model for petroleum reservoir connectivity pattern reconstruction applied at the results of traditional seismic inversion techniques. Results show that our approach is able to learn the petroleum reservoir connectivity patterns from the data and reproduce them in post inversion facies images.

Keywords: Convolutional Generative Adversarial Networks, Seismic Inversion, Multi-point Geostatistics, Reservoir Characterization, Con-nectivity Patterns

(12)
(13)

Figura 1 Ilustra¸c˜ao da aquisi¸c˜ao de dados s´ısmicos offshore (aquisi¸c˜ao em ´aguas do mar). Adaptada de Odland (2012). . . 33 Figura 2 Ilustra¸c˜ao das trajet´orias das ondas s´ısmicas refletidas no mesmo ponto da subsuperf´ıcie (CMP) para quatro afastamentos entre a fonte e o receptor (SANCEVERO et al., 2008). . . 34 Figura 3 Exemplo de dados s´ısmicos submetidos aos processos de An´alise de Velocidade, Normal Moveout (NMO) e empilhamento. Velocidade modelada para horizontalizar os eventos de reflex˜ao em A; tra¸cos medidos de um CMP para diferentes afastamentos entre fonte e receptor em B; e tra¸cos corrigidos por NMO em C (SEN, 2006). . . 35 Figura 4 Exemplo de uma se¸c˜ao s´ısmica empilhada com 199 CMP’s. 36 Figura 5 Compara¸c˜ao entre a se¸c˜ao S´ısmica (a) e resultado da invers˜ao s´ısmica para a propriedade Impedˆancia sendo comparada com as informa¸c˜oes dos logs de po¸cos (b). . . 38 Figura 6 Dados de porcentagem da porosidade coletados de acordo com a distˆancia entre pontos cardeais (a) e o variograma correspon-dente (b). A medida que a distˆancia ou lag aumenta, a variabilidade tamb´em ´e maior. Adaptada de Hunter (2007). . . 39 Figura 7 A imagem de treinamento de Strebelle (2002), onde a cor amarela representa o reservat´orio e a cor azul representa n˜ ao-reservat´orio. Adaptado de Caers e Zhang (2004). . . 40 Figura 8 Variogramas semelhantes obtidos de trˆes imagens de trei-namento totalmente diferentes (CAERS; ZHANG, 2004). . . 41 Figura 9 Ilustra¸c˜ao do funcionamento da metodologia GMP raster path adaptada de Caers e Zhang (2004). . . 42 Figura 10 Exemplo do resultado para modelo de f´acies utilizando a invers˜ao s´ısmica tradicional. Neste caso o ru´ıdo na s´ısmica gera diversas descontinuidades entre os padr˜oes de conectividade. . . 43 Figura 11 Exemplo do resultado esperado da invers˜ao s´ısmica com a abordagem geoestat´ıstica multipontos, com os padr˜oes de conectivi-dade recuperados de acordo com os padr˜oes encontrados na imagem de treinamento utilizada. . . 44 Figura 12 Ilustra¸c˜ao da produ¸c˜ao de petr´oleo utilizando po¸cos inje-tores e po¸cos produtores conectados por um canal de fluxo.

(14)

Adap-presenta¸c˜ao em uma matriz de valores entre 0, para branco e 1, para preto (direita). Adaptado de Goodfellow, Bengio e Courville (2016). . . 46 Figura 14 Exemplo de representa¸c˜ao da matriz de parˆametros 3 × 3 chamada de kernel. Adaptado de Goodfellow, Bengio e Courville (2016). . . 47 Figura 15 Ilustra¸c˜ao do in´ıcio da opera¸c˜ao convolu¸c˜ao (a) e o mapa de caracter´ıstica obtido ao final ap´os aplicar o kernel por toda a imagem (b). Da esquerda para a direita: pesos da imagem de en-trada, kernel e o mapa de caracter´ısticas. Adaptado de Goodfellow, Bengio e Courville (2016). . . 48 Figura 16 Exemplo dos mapas de caracter´ısticas obtidos a partir de diferentes kernels. Adaptado de Goodfellow, Bengio e Courville (2016). . . 48 Figura 17 Aplica¸c˜ao de n kernels de tamanho k × k × 3 em uma entrada de tamanho w × h × 3. O resultado s˜ao n mapas de carac-ter´ısticas de tamanho w × h. . . 49 Figura 18 Opera¸c˜ao de Pooling utilizando a fun¸c˜ao de m´aximo. . . 51 Figura 19 Exemplo de uma estrutura de uma Rede Neural Convo-lucional. Adaptada de Albelwi e Mahmood (2017). . . 51 Figura 20 Compara¸c˜ao entre a fun¸c˜ao Tangente Hiperb´olica e a fun¸c˜ao Sigm´oide. . . 52 Figura 21 Exemplo de um modelo de Rede Autocodificadora. . . 53 Figura 22 Exemplo de um modelo de Rede Autocodificadora Con-volucional aplicada para o reconhecimento de f´acies em dados s´ısmicos. Adaptado de Qian et al. (2017). . . 54 Figura 23 Exemplo do funcionamento da camada Deconvolucional de uma RNC com campos receptivos retangulares. . . 56 Figura 24 Ilustra¸c˜ao de uma compara¸c˜ao entre a opera¸c˜ao de Po-oling (esquerda) e a opera¸c˜ao Unpooling (direita). Adaptada de Zeiler e Fergus (2014). . . 56 Figura 25 Compara¸c˜ao entre uma Rede Neural Convolucional para classifica¸c˜ao (a) e uma Rede Totalmente Convolucional utilizada para a segmenta¸c˜ao da imagem (b). Enquanto a RNC classifica a imagem que cont´em um gato (de mesmo tamanho das imagens utilizadas no treinamento), a RTC ´e capaz de localizar a posi¸c˜ao do gato em uma imagem de qualquer dimens˜ao. Adaptada de Long,

(15)

volucional com convolu¸c˜oes sim´etricas (codificadora) e deconvolu¸c˜ao (decodificadora). Para cada conex˜ao, os mapas de caracter´ısticas da camada convolucional s˜ao espelhados e operados (e.g. somados, multiplicados) com os mapas de caracter´ısticas da camada decon-volucional. Adaptado de Mao, Shen e Yang (2016). . . 60 Figura 27 Arquitetura das Redes Gerativas Advers´arias. Adaptada de Goodfellow, Bengio e Courville (2016). . . 62 Figura 28 Compara¸c˜ao entre a Context-Encoder proposta por Pathak et al. (2016) e o PatchMatch utilizando duas entradas diferentes. Da esquerda para a direita: imagem de entrada, Context-Encoder e o PatchMatch. Adaptado de Pathak et al. (2016). . . 67 Figura 29 Modelo da Rede Gerativa Advers´aria Convolucional pro-posta neste trabalho. . . 73 Figura 30 Imagem de Treinamento original de Strebelle (a), Ima-gem de Treinamento modificada com descontinuidades inseridas sin-teticamente (b) e as amostras janeladas em 32x32 extra´ıdas (b) para serem utilizadas como entrada da Rede Gerativa Advers´aria Con-volucional. . . 75 Figura 31 Fluxograma da gera¸c˜ao dos conjuntos de dados de en-trada e sa´ıda para o treinamento da Rede Gerativa Advers´aria Con-volucional. . . 76 Figura 32 Resultado esperado pela metodologia de reconstru¸c˜ao de padr˜oes de conectividade de reservat´orio. (a) Modelo de f´acies real, (b) Modelo de f´acies com descontinuidade e (c) Reconstru¸c˜ao dos padr˜oes de conectividade pela RGAC. A conectividade ´e restaurada com ind´ıcios de um padr˜ao se formando na esquerda da imagem e os padr˜oes de conectividade presentes na imagem s˜ao preservados. Para cada ponto reconstru´ıdo, ´e fornecido a probabilidade de existir os padr˜oes de conectividade entre as f´acies reservat´orio. . . 77 Figura 33 Resultado esperado pela metodologia de reconstru¸c˜ao de padr˜oes de conectividade de reservat´orio. (a) Modelo de f´acies real, (b) Modelo de f´acies com descontinuidade e (c) Reconstru¸c˜ao dos padr˜oes de conectividade pela RGAC. Neste caso os canais apa-recem desconectados quase totalmente, por´em o padr˜ao de conec-tividade que os interliga ´e reconstru´ıdo. Al´em disso, nas bordas onde houve a reconstru¸c˜ao ´e fornecido uma probabilidade inferior de ocorrer a f´acies reservat´orio. . . 78 Figura 34 Exemplos de amostras extra´ıdas e pr´e-processadas com

(16)

esquerda para a direita: amostras sint´eticas descont´ınuas e as amos-tras extra´ıdas da imagem de treinamento original. . . 82 Figura 35 Resultado do treinamento da RGAC para amostras de tamanho 64 × 64. `A esquerda o loss que representa o erro de G e `a direita a acc que ´e acur´acia de D durante o treinamento. . . 84 Figura 36 Reconstru¸c˜ao dos padr˜oes de conectividade do reser-vat´orio utilizando amostras de tamanho 64 × 64 como entrada, onde (a) ´e a imagem com descontinuidade, (b) a reconstru¸c˜ao feita pela RGAC e (c) as f´acies originais. . . 85 Figura 37 Resultado do treinamento da RGAC para amostras 32 × 32. `A esquerda o loss que representa o erro de G e `a direita a acc que ´e acur´acia de D durante o treinamento. . . 85 Figura 38 Reconstru¸c˜ao dos padr˜oes de conectividade do reser-vat´orio utilizando amostras de tamanho 32 × 32 como entrada, onde (a) ´e a imagem com descontinuidade, (b) a reconstru¸c˜ao feita pela RGAC e (c) as f´acies originais. . . 86 Figura 39 Resultados obtidos para as duas RGAC treinadas com a fun¸c˜ao sigmoide e tanh. Da esquerda para a direita: loss que represnta o erro do modelo G e a acc que ´e a acur´acia do modelo D. . . 89 Figura 40 Reconstru¸c˜ao dos padr˜oes de conectividade de reser-vat´orio com as fun¸c˜oes de sa´ıda Sigmoide e Tangente Hiperb´olica, onde (a) ´e a reconstru¸c˜ao utilizando Sigmoide, (b) a Tangente Hi-perb´olica e (c) ´e a amostra da imagem de treinamento original. . . . 90 Figura 41 Resultado da reconstru¸c˜ao dos padr˜oes de conectividade de reservat´orio da Rede Gerativa Advers´aria Convolucional pro-posta neste trabalho. Compara¸c˜ao entre a Imagem de Treinamento real (a), Imagem de Treinamento modificada com descontinuidades (b), reconstru¸c˜ao dos padr˜oes de conectividade pela RGAC (c), a reconstru¸c˜ao onde p > 0.5 para a f´acies reservat´orio (d) e a com-para¸c˜ao entre os falsos negativos (vermelho) e os falsos positivos (azul) (e). . . 91 Figura 42 Resultado da reconstru¸c˜ao dos padr˜oes de conectividade de reservat´orio da RGAC proposta neste trabalho para casos extre-mos de descontinuidades. Compara¸c˜ao entre a Imagem de Treina-mento real (a), Imagem de TreinaTreina-mento modificada com desconti-nuidades extremas (b), reconstru¸c˜ao dos padr˜oes de conectividade pela RGAC (c), a reconstru¸c˜ao onde p > 0.5 para a f´acies

(17)

reser-Figura 43 Resultado da reconstru¸c˜ao dos padr˜oes de conectividade de reservat´orio da Rede Gerativa Advers´aria Convolucional com 0, 1, 5 e 10 retro inferˆencias respectivamente. Teste em um cen´ario de descontinuidade mediana. . . 94 Figura 44 Resultado da reconstru¸c˜ao dos padr˜oes de conectividade de reservat´orio da Rede Gerativa Advers´aria Convolucional com 0, 1, 5 e 10 retro inferˆencias respectivamente. Teste em um cen´ario de descontinuidade extrema. . . 95 Figura 45 M´edia e desvio padr˜ao das fun¸c˜oes de conectividade ob-tidas a partir das 1000 imagens de treinamentos para os eixos X em (a) e Y em (b). A IT modificada com descontinuidade (azul), IT Original (cinza) e IT reconstru´ıda (vermelha) pela Rede Gerativa Advers´aria Convolucional. . . 98 Figura 46 Erro m´edio da quantidade de f´acies associadas a f´acies reservat´orio (Phase) (a) e propor¸c˜ao de f´acies (b), em rela¸c˜ao aos padr˜oes de conectividade de reservat´orios presentes na imagem de treinamento original. . . 99 Figura 47 M´edia e desvio padr˜ao das fun¸c˜oes de conectividade ob-tidas a partir de 4 retro inferˆencias feita pela Rede Gerativa Ad-vers´aria Convolucional. Fun¸c˜ao de conectividade obtida em rela¸c˜ao os eixos X em (a) e Y em (b). A IT modificada com descontinuidade (azul), IT Original (cinza) e IT reconstru´ıda com 4 retro inferˆencias (vermelha). . . 100 Figura 48 Resultado da reconstru¸c˜ao dos padr˜oes de conectividade de reservat´orio utilizando o m´etodo SNESIM. Compara¸c˜ao entre a Imagem de Treinamento real (a), Imagem de Treinamento modifi-cada com descontinuidades extremas (b), reconstru¸c˜ao dos padr˜oes de conectividade com o SNESIM (c) e a compara¸c˜ao entre os falsos negativos (vermelho) e os falsos positivos (azul) (d). . . 102 Figura 49 Compara¸c˜ao entre a reconstru¸c˜ao da imagem de treina-mento com SNESIM e a Rede Gerativa Advers´aria Convolucional: Imagem de Treinamento real (a), Imagem de Treinamento modifi-cada com descontinuidades extremas (b), reconstru¸c˜ao dos padr˜oes de conectividade com o SNESIM (c) e a reconstru¸c˜ao realizada pela Rede Gerativa Advers´aria Convolucional. . . 104 Figura 50 Compara¸c˜ao entre as fun¸c˜oes de conectividades obtidas a partir dos resultados da reconstru¸c˜ao das imagens de treinamento do conjunto de testes com o SNESIM e a Rede Gerativa Advers´aria

(18)

com descontinuidade (azul), IT Original (cinza), IT reconstru´ıda com a Rede Gerativa Advers´aria Convolucional (vermelha) e IT reconstru´ıda com o SNESIM (magenta). . . 105 Figura 51 Modelo estratigr´afico do Stanford VI-E (superior esquerda) com as f´acies argila (azul), barra de sedimento (azul claro), areia de canal (amarelo) e borda de argila (vermelho). Primeira camada de canais (superior direita), segunda camada (inferior esquerda) e a terceira camada (inferior direita). Adaptado de Lee e Mukerji (2012). . . 107 Figura 52 Ilustra¸c˜ao dos tipos de canais presentes no Stanford VI-E (RENARD; ALLARD, 2013). . . 108 Figura 53 Dados s´ısmicos calculados a partir da propriedade de impedˆancia do StanfordVI-E (a) e a inser¸c˜ao de do ru´ıdo gaussiano para simular as descontinuidades geralmente presentes em dados s´ısmicos reais (b). . . 109 Figura 54 A estrutura do modelo de f´acies original presente em Stanford VI-E (a) e o resultado da invers˜ao s´ısmica para f´acies reservat´orio (b). . . 109 Figura 55 Ilustra¸c˜ao do processo de extra¸c˜ao das amostras para o treinamento da Rede Gerativa Advers´aria Convolucional. Sendo z = 67 uma se¸c˜ao do eixo z, o resultado da Invers˜ao em (a) com as amostras 32 × 32 correspondentes em (b) e o Stanford VI-E em (c) com as amostras correspondentes em (d). . . 111 Figura 56 Erro do modelo Gerativo (a) e a acur´acia do modelo Dis-criminativo (b) durando o treinamento da Rede Gerativa Advers´aria Convolucional para a reconstru¸c˜ao de padr˜oes de conectividade de canais sinuosos. . . 111 Figura 57 Erro do modelo Gerativo (a) e a acur´acia do modelo Dis-criminativo (b) durando o treinamento da Rede Gerativa Advers´aria Convolucional para a reconstru¸c˜ao de padr˜oes de conectividade de canais meandros. . . 112 Figura 58 Se¸c˜ao da invers˜ao s´ısmica em z = 61 (a) e z = 78 (b), resultado da reconstru¸c˜ao dos padr˜oes de conectividade pela Rede Gerativa Advers´aria (c) e (d) e os canais sinuosos de referˆencia do reservat´orio Stanford VI-E (e) e (f). . . 113 Figura 59 Se¸c˜ao da invers˜ao s´ısmica em z = 16 (a) e z = 33 (b), resultado da reconstru¸c˜ao dos padr˜oes de conectividade pela Rede Gerativa Advers´aria (c) e (d) e os canais meandros de referˆencia do

(19)

tidas a partir das se¸c˜oes de teste dos canais sinuosos para os eixos X em (a) e Y em (b). A se¸c˜ao da invers˜ao com descontinuidade (azul), Stanford VI-E (cinza) e a reconstru´ıda pela Rede Gerativa Advers´aria Convolucional (vermelha). . . 115 Figura 61 M´edia e desvio padr˜ao das fun¸c˜oes de conectividade ob-tidas a partir das se¸c˜oes de teste dos canais meandros para os eixos X em (a) e Y em (b). A se¸c˜ao da invers˜ao com descontinuidade (azul), Stanford VI-E (cinza) e a reconstru´ıda pela Rede Gerativa Advers´aria Convolucional (vermelha). . . 116

(20)
(21)

Tabela 1 Trabalhos Relacionados . . . 70

Tabela 2 Resultados com diferentes configura¸c˜oes e combina¸c˜oes de camadas . . . 87

Tabela 3 Camadas do Modelo Gerativo . . . 88

Tabela 4 Camadas do Modelo Discriminativo . . . 89

Tabela 5 Resultados CONNEC3D. . . 97

Tabela 6 Resultados para o Erro Percentual M´edio . . . 101

Tabela 7 Resultados CONNEC3D RGAC e SNESIM . . . 106

Tabela 8 Erro Percentual M´edio RGAC e SNESIM . . . 106

Tabela 9 Resultados CONNEC3D para Canais Sinuosos . . . 117

(22)
(23)

GMP Geoestat´ıstica Multipontos IT Imagem de Treinamento RGA Rede Gerativa Advers´aria

RGAC Rede Gerativa Advers´aria Convolucional RNA Rede Neural Artificial

RNC Rede Neural Convolucional CONV Camada Convolucional RA Rede Autocodificadora

RAC Rede Autocodificadora Convolucional DECONVCamada Deconvolucional

(24)
(25)

1 INTRODUC¸ ˜AO . . . 25 1.1 JUSTIFICATIVA . . . 28 1.2 OBJETIVO GERAL . . . 29 1.3 OBJETIVOS ESPEC´IFICOS . . . 29 1.4 ORGANIZAC¸ ˜AO . . . 30 2 FUNDAMENTAC¸ ˜AO TE ´ORICA . . . 31 2.1 CARACTERIZAC¸ ˜AO DE RESERVAT ´ORIOS . . . 31 2.1.1 Invers˜ao S´ısmica . . . 32 2.1.2 Geoestat´ıstica . . . 37 2.1.3 Geoestat´ıstica Multipontos . . . 40 2.1.4 Padr˜oes de Conectividade de Reservat´orios . . . 43 2.2 REDES NEURAIS . . . 44 2.2.1 Redes Neurais Convolucionais . . . 46 2.2.1.1 Camada Convolucional . . . 49 2.2.1.2 Camada Pooling . . . 50 2.2.2 Fun¸c˜oes de Ativa¸c˜ao . . . 52 2.2.3 Redes Autocodificadoras Convolucionais . . . 53 2.2.3.1 Camada Deconvolucional . . . 55 2.2.3.2 Camada Unpooling . . . 56 2.2.4 Redes Totalmente Convolucionais . . . 56 2.2.4.1 Pular Conex˜oes . . . 59 2.2.5 Redes Gerativas Advers´arias Convolucionais . . . 61 3 TRABALHOS RELACIONADOS . . . 65 3.1 PLANEJAMENTO DA REVIS ˜AO . . . 65 3.2 RECONSTRUC¸ ˜AO DE IMAGENS . . . 66 3.3 RECONSTRUC¸ ˜AO DE PADR ˜OES DE CONECTIVIDADE

DE RESERVAT ´ORIOS . . . 68 4 METODOLOGIA PROPOSTA . . . 71 4.1 MODELO DE REDE NEURAL . . . 71 4.2 CONJUNTO DE DADOS . . . 73 4.3 IMPLEMENTAC¸ ˜AO EM KERAS . . . 76 5 EXPERIMENTOS E RESULTADOS . . . 81 5.1 PR ´E-PROCESSAMENTO DOS DADOS . . . 81 5.2 TREINAMENTO . . . 83 5.2.1 Amostras de tamanho 64 × 64 . . . 84 5.2.2 Amostras de tamanho 32 × 32 . . . 85 5.3 PAR ˆAMETROS EXPERIMENTAIS . . . 86

(26)

5.4 RETRO INFER ˆENCIA . . . 92 5.5 VALIDAC¸ ˜AO . . . 96 5.5.1 Fun¸c˜ao de Conectividade . . . 96 5.5.2 Erro Percentual M´edio . . . 101 5.6 SNESIM E RGAC . . . 101 5.7 RESERVAT ´ORIO STANFORD VI-E . . . 106 5.7.1 Pr´e-processamento do Stanford VI-E . . . 108 5.7.2 Treinamento . . . 110 5.7.3 Valida¸c˜ao . . . 110 5.8 DISCUSS ˜AO . . . 117 6 CONCLUS ˜AO . . . 121 REFER ˆENCIAS . . . 125

(27)

1 INTRODUC¸ ˜AO

A modelagem de reservat´orios ´e um processo importante na ind´ustria de petr´oleo e g´as, sendo aplicada para gerar modelos da sub-superf´ıcie do campo explorado e fornecer uma melhor compreens˜ao do reservat´orio (SANCEVERO et al., 2008). A modelagem de reservat´orio se d´a a partir de dados do subsolo adquiridos na superf´ıcie, que permitem obter as propriedades da rocha e as f´acies geol´ogicas. As f´acies s˜ao definidas por diferentes tipos de rochas, sendo elas relacionadas com as caracter´ısticas sedimentares e condi¸c˜oes deposicionais (TARANTOLA, 2005). Todas essas informa¸c˜oes sobre o reservat´orio s˜ao importantes para a gest˜ao de campo, especialmente no processo de tomada de de-cis˜ao para definir as melhores posi¸c˜oes de perfura¸c˜ao dos po¸cos injetores e produtores. Para que estas posi¸c˜oes sejam bem definidas, ´e necess´ario identificar um canal de fluxo no reservat´orio que conecte estes po¸cos de modo a permitir a extra¸c˜ao do hidrocarboneto (CAERS; ZHANG, 2004).

Nas ´ultimas d´ecadas, houve uma melhoria significativa nos m´etodos de modelagem de reservat´orios devido ao desenvolvimento da geoes-tat´ıstica (TAHMASEBI; SAHIMI; CAERS, 2014). A geoestat´ıstica incor-pora distribui¸c˜oes estat´ısticas e correla¸c˜ao espacial entre as amostras da subsuperf´ıcie, permitindo o uso de m´etodos estoc´asticos no processo de modelagem de reservat´orios. Al´em disso, a geoestat´ıstica pode ser uma forma de incorporar conhecimento do especialista de forma a regu-larizar os resultados obtidos a partir da invers˜ao s´ısmica (FIGUEIREDO et al., 2017).

A invers˜ao s´ısmica, ´e uma etapa importante no processo de ca-racteriza¸c˜ao de reservat´orios para estimar as propriedades da rocha a partir dos dados s´ısmicos. Os dados s´ısmicos s˜ao reflex˜oes da subsu-perf´ıcie adquiridas a partir dos sism´ografos localizados na superf´ıcie. As reflex˜oes s˜ao obtidas a partir da interface e diferen¸ca das proprie-dades (e.g. impedˆancia) de dois tipos diferentes de rocha. Entretanto, somente atrav´es dos dados s´ısmicos, ´e dif´ıcil de identificar padr˜oes de conectividade e diferenciar o tipo de rocha que cont´em petr´oleo, pois ela pode apresentar uma impedˆancia semelhante com a rocha que cont´em ´

agua (PYRCZ; DEUTSCH, 2014). A geoestat´ıstica, ajuda no processo de invers˜ao a diferenciar estes tipos de rocha, por´em, n˜ao fornece in-forma¸c˜oes suficientes para a defini¸c˜ao dos padr˜oes de conectividade do reservat´orio (MARIETHOZ; CAERS, 2014), sendo necess´aria outra alter-nativa, como a geoestat´ıstica multipontos.

(28)

TAH-MASEBI; SAHIMI; CAERS, 2014;GARDET; RAVALEC; GLOAGUEN, 2016), ´e um m´etodo proposto recentemente baseado no uso de imagens de treinamento e utilizado juntamente com a invers˜ao s´ısmica (GONZ ´ALEZ; MUKERJI; MAVKO, 2007). Uma imagem de treinamento (IT) ´e basica-mente um banco de dados de padr˜oes geol´ogicos (PYRCZ; DEUTSCH, 2014). A IT cont´em informa¸c˜oes sobre as estruturas, geometria e rela¸c˜ao entre as categorias geol´ogicas que podem ser encontradas no reservat´orio. Estas categorias podem representar modelos de f´acies, onde as f´acies s˜ao estimadas a partir da truncagem de propriedades cont´ınuas ou atrav´es de algoritmos de classifica¸c˜ao. Segundo Pyrcz e Deutsch (2014), um bloco da imagem de treinamento ´e equivalente a um bloco do reservat´orio simulado, mantendo as caracter´ısticas e padr˜oes na mesma escala em rela¸c˜ao ao seu tamanho.

Entretanto, de acordo com Mariethoz e Caers (2014), a mode-lagem de reservat´orios com a geoestat´ıstica multipontos integrada `a invers˜ao s´ısmica possui trˆes principais limita¸c˜oes: (1) ´E dif´ıcil obter mais de uma solu¸c˜ao para se estimar a probabilidade associada a cada tipo de f´acies do reservat´orio; (2) A GMP exige a defini¸c˜ao de diver-sos parˆametros emp´ıricos, sendo que cada um deles tˆem um impacto significativo no resultado final; (3) A GMP demanda um alto custo computacional, pois para cada uma das diversas itera¸c˜oes durante a simula¸c˜ao, se faz uma busca exaustiva de padr˜oes geol´ogicos presentes na IT conceitual.

Por outro lado, as Redes Neurais (RN) tˆem sido objeto de es-tudo em diversas ´areas, principalmente nas ´areas de vis˜ao computaci-onal e processamento de imagens (VINCENT et al., 2010; MOSTAJABI; YADOLLAHPOUR; SHAKHNAROVICH, 2015;KRIZHEVSKY; SUTSKEVER; HINTON, 2012). J´a na ind´ustria de petr´oleo, as RN vˆem sendo utili-zadas para processar grande quantidade de dados gerados a partir da aquisi¸c˜ao s´ısmica e perfura¸c˜ao de po¸cos (KORJANI et al., 2016). Exem-plos de aplica¸c˜oes s˜ao: classifica¸c˜ao, filtragem e compress˜ao de dados s´ısmicos. As Redes Neurais tˆem-se mostrado uma solu¸c˜ao promissora, pois geralmente os resultados est˜ao mais ligados `as pr´oprias informa¸c˜oes presentes nos dados e n˜ao s´o condicionados `as interpreta¸c˜oes feitas a partir do know-how de especialistas (RAEESI et al., 2012).

Diversos tipos e arquiteturas de redes neurais foram propostas nos ´ultimos anos (BENGIO, 2009;LECUN; BENGIO; HINTON, 2015;GUO et al., 2016; MIOTTO et al., 2017; GARCIA-GARCIA et al., 2017; ZHU et al., 2017), mas as Redes Gerativas Advers´arias (RGA) (GOODFELLOW et al., 2014) tˆem se consagrado como um t´opico avan¸cado no estado da arte em rela¸c˜ao `as Redes Neurais para a gera¸c˜ao e reconstru¸c˜ao

(29)

de imagens. Diferente das redes tradicionais, a RGA ´e uma estrutura composta por duas Redes Neurais, a Rede Gerativa e a Rede Discri-minativa. Segundo Goodfellow et al. (2014), o principal diferencial da RGA em rela¸c˜ao `as outras redes neurais, est´a no treinamento da Rede Gerativa. A Rede Gerativa aprende os parˆametros da distribui¸c˜ao de probabilidade dos dados de entrada durante o treinamento e tem como finalidade, gerar novos dados. Estes novos dados ser˜ao avaliados pela Rede Discriminativa, que fornece a probabilidade do novo dado ser, ou n˜ao, um dado real presente no conjunto de treinamento. Dessa forma, o conceito da RGA se baseia em uma competi¸c˜ao entre ambas as Redes Advers´arias, onde o objetivo da Rede Gerativa ´e maximizar a probabi-lidade da Rede Discriminativa em cometer o erro em diferenciar o dado gerado em rela¸c˜ao ao dado real (GOODFELLOW et al., 2014).

Segundo Goodfellow et al. (2014), outra vantagem das Redes Gerativas Advers´arias, est´a no fato destas redes poderem ser usadas para gerar uma grande quantidade de amostras em problemas onde se tem poucos dados classificados. A grande quantidade de dados ´e ´

util para estabilizar diversos algoritmos de aprendizado de m´aquina (PAPERNOT et al., 2016). Al´em disso, a RGA ´e capaz de gerar imagens mais realistas do que outros modelos de redes neurais, que normalmente geram imagens borradas, e a pr´opria performance na gera¸c˜ao dos dados, pois ´e necess´ario somente uma ´unica inferˆencia pela Rede Gerativa Advers´aria para reconstruir ou gerar uma nova imagem (GOODFELLOW et al., 2014).

Atualmente, diversos novos tipos ou varia¸c˜oes da Rede Gera-tiva Advers´aria surgiram, como a SRGAN (LEDIG et al., 2017), Pix2Pix (ISOLA et al., 2017) e as Redes Gerativas Advers´arias Convolucionais (RGAC) (RADFORD; METZ; CHINTALA, 2015). A RGAC ´e capaz de representar as caracter´ısticas espacialmente correlacionadas que est˜ao presentes na imagem de entrada, com um desempenho superior em rela¸c˜ao a Rede Gerativa Advers´aria proposta originalmente. Da mesma maneira, as imagens de treinamento para a representa¸c˜ao de mode-los de f´acies de reservat´orio, possuem diversas caracter´ısticas espaci-almente correlacionadas, com informa¸c˜oes sobre os padr˜oes geol´ogicos que podem ser gerados ou reproduzidos no processo de modelagem do reservat´orio.

Inspirado em diversas aplica¸c˜oes e casos de sucesso da Rede Ge-rativa Advers´aria Convolucional, este trabalho prop˜oe uma metodologia alternativa ao uso da invers˜ao s´ısmica com a Geoestat´ıstica Multipon-tos. Os resultados mostram que o modelo baseado em Redes Gerati-vas Advers´arias Convolucionais pode ser utilizado na reconstru¸c˜ao dos

(30)

padr˜oes de conectividade em modelos de f´acies de reservat´orios gera-dos pela invers˜ao s´ısmica tradicional. A RGAC tem a capacidade de extrair e representar, caracter´ısticas espacialmente correlacionadas das imagens de treinamento e reconstruir os padr˜oes de conectividades de reservat´orio faltantes no m´etodo de invers˜ao tradicional.

Neste trabalho, a proposta ´e oferecer uma alternativa em rela¸c˜ao `

a Geoestat´ıstica Multipontos para a reconstru¸c˜ao dos padr˜oes de co-nectividade utilizando o conceito da Rede Gerativa Advers´aria Con-volucional. Dentre as vantagens est˜ao o desempenho computacional, processo de inferˆencia entre as f´acies reservat´orio e n˜ao reservat´orio e automatiza¸c˜ao da reconstru¸c˜ao dos padr˜oes de conectividade. Al´em disso, a proposta deste trabalho foi publicada em formato de artigo em uma conferˆencia internacional de inteligˆencia computacional.

1.1 JUSTIFICATIVA

A modelagem de reservat´orio ainda depende muito das inter-preta¸c˜oes emp´ıricas de especialistas, o que geralmente n˜ao ´e sufici-ente para processar a grande quantidade de dados adquiridos do re-servat´orio. Diversas tecnologias tˆem sido desenvolvidas, para auxiliar os profissionais e empresas a reduzirem riscos e aumentar a produ-tividade dos reservat´orios de ´oleo e/ou g´as explorados (MARIETHOZ; CAERS, 2014).

Por´em, segundo Nunes et al. (2017), as metodologias atuais de invers˜ao s´ısmica com geoestat´ıstica multipontos ainda dependem da su-pervis˜ao humana, tanto para a constru¸c˜ao das imagens de treinamento, quanto para parametrizar o processo de caracteriza¸c˜ao de reservat´orios. Al´em disso, elas exigem um retrabalho sobre todo o fluxo da invers˜ao, onde os resultados obtidos previamente s˜ao descartados, demandando um alto custo computacional para a gera¸c˜ao de poss´ıveis cen´arios do reservat´orio.

As Rede Gerativas Advers´arias Convolucionais tˆem a capacidade de extrair as caracter´ısticas espacialmente correlacionadas do conjunto de dados (e.g. imagens de treinamento) no processo de treinamento (LECUN et al., 1989), que podem ser automaticamente reproduzidos em modelos de reservat´orios. Esta reprodu¸c˜ao ´e feita condicionada aos da-dos de entrada, ou seja, dada uma amostra com dois canais desconec-tados, a RGAC reproduz a mesma informa¸c˜ao da imagem de entrada e ainda fornece a probabilidade de existˆencia de padr˜oes de conectividade entre estes canais.

(31)

Goodfellow, Bengio e Courville (2016) demonstram que, al´em de ser uma abordagem diferente, existem diversas vantagens no uso das Redes Gerativas Advers´arias comparada `a outras arquiteturas de Re-des Neurais do estado da arte como: NADE (LAROCHELLE; MURRAY, 2011), PixelRNN (OORD; KALCHBRENNER; KAVUKCUOGLU, 2016), Wa-veNet (OORD et al., 2016) e SRCNN (DONG et al., 2016). Entre as vanta-gens est˜ao: maior desempenho computacional na gera¸c˜ao de amostras, a capacidade de trabalhar melhor com amostras de alta dimensionali-dade e de possuir uma segunda Rede Neural, o Discriminador, que ´e respons´avel por fornecer uma compara¸c˜ao entre as amostras geradas e as amostras reais. Essa compara¸c˜ao ´e utilizada como uma informa¸c˜ao extra para gerar amostras mais realistas pela rede Gerativa.

Al´em disso, a Rede Gerativa Advers´aria Convolucional pode for-necer, para cada ponto do reservat´orio, a probabilidade da ocorrˆencia entre as f´acies reservat´orio e n˜ao reservat´orio. Diferente da abordagem da Geoestat´ıstica Multipontos, onde seria necess´ario gerar diversas si-mula¸c˜oes para obter uma abordagem probabil´ıstica, na RGAC pode-mos definir a fun¸c˜ao de sa´ıda (e.g.Sigm´oide) da rede para fornecer a probabilidade diretamente no processo de inferˆencia.

Portanto, o uso da RGAC pode ser uma alternativa `a ser apli-cada em resultados obtidos pela invers˜ao tradicional para recuperar os padr˜oes de conectividade de reservat´orios, sem a necessidade do uso da Geoestat´ıstica Multipontos, provendo tamb´em maior desempenho durante a reconstru¸c˜ao dos canais de reservat´orio.

1.2 OBJETIVO GERAL

O objetivo principal deste trabalho ´e propor um modelo de Rede Gerativa Advers´aria Convolucional para a reconstru¸c˜ao dos padr˜oes de conectividade de reservat´orio de petr´oleo.

1.3 OBJETIVOS ESPEC´IFICOS

Para atingir o objetivo principal, os seguintes objetivos espec´ıficos dever˜ao ser atingidos:

• Obter um conjunto de dados com padr˜oes de conectividades de reservat´orio, para serem utilizados no treinamento da Rede Ge-rativa Advers´aria Convolucional;

(32)

Convolucional em imagens de treinamento an´alogos aos modelos de f´acies de reservat´orio;

• Comparar os resultados de reconstru¸c˜ao dos padr˜oes de conecti-vidade da Rede Gerativa Advers´aria Convolucional com o modelo de f´acies original e os resultados do SNESIM;

• Propor uma alternativa aos m´etodos de Geoestat´ıstica Multipon-tos pra a reconstru¸c˜ao dos padr˜oes de conectividade de reser-vat´orios.

1.4 ORGANIZAC¸ ˜AO

Esta disserta¸c˜ao est´a organizada nos seguintes cap´ıtulos: • Cap´ıtulo 2 - Levantamento bibliogr´afico do processo de

carac-teriza¸c˜ao de reservat´orio, m´etodos de geoestat´ıstica e Redes Neu-rais;

• Cap´ıtulo 3 - Compara¸c˜ao dos trabalhos realizados com Geoes-tat´ıstica Multipontos e Redes Gerativas Advers´arias para a re-constru¸c˜ao de imagens e conectividade de reservat´orios;

• Cap´ıtulo 4 - Apresenta¸c˜ao da metodologia proposta neste tra-balho;

• Cap´ıtulo 5 - Os experimentos realizados com a Rede Gera-tiva Advers´aria Convolucional proposta, resultados segundo as m´etricas utilizadas e uma discuss˜ao sobre os mesmos;

• Cap´ıtulo 6 - ´E mostrada as conclus˜oes preliminares obtidas neste trabalho.

(33)

2 FUNDAMENTAC¸ ˜AO TE ´ORICA

Neste cap´ıtulo, ser˜ao apresentados conceitos b´asicos sobre ca-racteriza¸c˜ao de reservat´orios, invers˜ao s´ısmica, geoestat´ıstica, seguido por uma breve revis˜ao da metodologia de geoestat´ıstica multipontos relacionada com os trabalhos mais atuais e conceitos sobre padr˜oes de conectividade de reservat´orio. Em seguida, ser´a feita uma revis˜ao sobre redes neurais e ser´a abordada em mais detalhes as Redes Generativas Advers´arias Convolucionais, utilizadas para o desenvolvimento deste trabalho.

2.1 CARACTERIZAC¸ ˜AO DE RESERVAT ´ORIOS

Segundo Sancevero et al. (2008), o processo de caracteriza¸c˜ao de reservat´orios pode ser definido como a determina¸c˜ao tridimensi-onal e quantitativa do reservat´orio incluindo seus limites, estruturas geol´ogicas, volumes, suas heterogeneidades internas e a correspondente distribui¸c˜oes das propriedades de rocha e fluidos. O objetivo desse processo ´e gerar um modelo capaz de prever como o campo ser´a explo-rado, maximizando a produ¸c˜ao e minimizando os custos por meio da determina¸c˜ao ´otima da localiza¸c˜ao dos po¸cos.

Ma et al. (2005), afirmam que a caracteriza¸c˜ao de reservat´orios ´e um pr´e-requisito crucial, para se entender e prever o potencial econˆomico de um campo de petr´oleo, assim como a necessidade de examinar di-ferentes cen´arios de produ¸c˜ao. Esse processo, compreende a deter-mina¸c˜ao da arquitetura do reservat´orio, o estabelecimento das tendˆencias de fluxo dos fluidos e a constru¸c˜ao de modelos capazes de identificar o potencial da reserva.

Para gerar modelos confi´aveis onde o processo de caracteriza¸c˜ao possa ser realizado de maneira eficiente, a modelagem de reservat´orios pode ser feita de maneira determin´ıstica ou realizada a partir de uma abordagem probabil´ıstica. Historicamente, o ge´ologo e o geof´ısico cri-avam seus pr´oprios modelos que eram posteriormente integrados para um modelo comum do prospecto, campo ou da bacia. Atualmente, existem esfor¸cos para que esta integra¸c˜ao seja feita desde o come¸co do processo, onde os dados de s´ısmicos e de po¸cos s˜ao interpretados conjuntamente (SANCEVERO et al., 2008).

Na pr´atica, segundo Sancevero et al. (2008), o modelo do re-servat´orio usado no processo de caracteriza¸c˜ao, possui de maneira

(34)

inte-grada, diversas informa¸c˜oes de diferentes fontes, como os dados de po¸cos (e.g. porosidade, permeabilidade, f´acies, etc.), dados de produ¸c˜ao, da-dos s´ısmicos, ideias conceituais de especialistas e qualquer outra in-forma¸c˜ao que auxilie no entendimento do campo.

Integrar todas estas informa¸c˜oes ´e uma tarefa matematicamente complexa, devido `as diferen¸cas na escala e o fato de a disponibilidade dos dados serem provenientes de diversas fontes (SANCEVERO et al., 2008). Para que se possa gerar estes modelos integrados, s˜ao necess´arias t´ecnicas ou metodologias avan¸cadas que possibilitem a inser¸c˜ao de al-gum fator de incerteza e condicionamento dos resultados para estas diferentes informa¸c˜oes. Um exemplo ´e a invers˜ao s´ısmica.

2.1.1 Invers˜ao S´ısmica

A teoria da invers˜ao ´e utilizada em diversas ´areas na inferˆencia dos valores de parˆametros relacionados com processos importantes a partir dos dados medidos, os chamados dados experimentais. Segundo Figueiredo et al. (2017), o problema inverso pode ser descrito como o processo de obter informa¸c˜oes de um sistema parametrizado, a partir de dados observ´aveis das rela¸c˜oes te´oricas destes dados observ´aveis com os parˆametros n˜ao observ´aveis e do conhecimento a priori sobre os dados n˜ao observ´aveis.

A literatura oferece diversos m´etodos para a solu¸c˜ao de proble-mas inversos (TARANTOLA, 2005;SEN, 2006). A maioria dos trabalhos prop˜oem a rela¸c˜ao de um modelo m aos dados experimentais d atrav´es de um operador direto g (tamb´em conhecido como forward model ):

d = g(m) + ed (2.1)

onde ed representa os erros, ru´ıdos ou incertezas envolvidas na

mode-lagem.

O operador direto g ´e, em geral, um operador n˜ao linear baseado em teoria e leis f´ısicas que possibilitam calcular as medidas experimen-tais, dado a configura¸c˜ao de um sistema f´ısico parametrizado. Enquanto a teoria permite que o operador simule os dados observ´aveis a partir de um modelo, o problema inverso procura justamente o caminho inverso, ou seja, obter os parˆametros a partir dos dados experimentais.

No contexto da ind´ustria de petr´oleo e g´as, existe o problema in-verso da invers˜ao de dados s´ısmicos, ou simplesmente invers˜ao s´ısmica (TARANTOLA, 2005;FIGUEIREDO et al., 2017). A invers˜ao s´ısmica pro-cura obter as propriedades das rochas que comp˜oem a subsuperf´ıcie

(35)

atrav´es de aquisi¸c˜oes s´ısmicas (dados observ´aveis) e das rela¸c˜oes te´oricas de propaga¸c˜ao de ondas ac´usticas (modelo).

O m´etodo de aquisi¸c˜ao s´ısmica, utiliza pulsos s´ısmicos de uma fonte artificial controlada e registra a resposta em fun¸c˜ao do tempo. Neste sistema, cada interface entre os dois tipos de rochas diferentes gera reflex˜ao e refra¸c˜ao do pulso s´ısmico, como mostrado na Figura 1.

Figura 1 – Ilustra¸c˜ao da aquisi¸c˜ao de dados s´ısmicos offshore (aquisi¸c˜ao em ´aguas do mar). Adaptada de Odland (2012).

O registro das amplitudes das ondas refletidas, ´e chamado de tra¸co s´ısmico. O tra¸co s´ısmico pode ser, por exemplo, representado por um vetor coluna de uma matriz 2D, onde um conjunto de tra¸cos s´ısmicos lado-a-lado ´e chamado de imagem ou se¸c˜ao, que no caso de um levantamento 3D, se transformam em um cubo s´ısmico.

Ap´os a aquisi¸c˜ao s´ısmica, o dado s´ısmico ´e submetido ao pro-cessamento s´ısmico, que envolve uma s´erie de t´ecnicas de filtragens e corre¸c˜oes, nas quais efeitos indesej´aveis, como reflex˜oes m´ultiplas, dis-tor¸c˜oes e ru´ıdos s˜ao retirados, resultando em se¸c˜oes s´ısmicas coerentes com a geologia da subsuperf´ıcie (SANCEVERO et al., 2008).

O pr´oximo passo ´e a separa¸c˜ao do dado s´ısmico pela t´ecnica CMP (Common MidPoint ), selecionando os tra¸cos referentes ao mesmo ponto da subsuperf´ıcie, por´em com afastamentos diferentes entre a fonte e o receptor conforme ilustrado na Figura 2. Ent˜ao, os dados extra´ıdos s˜ao submetidos para uma pr´oxima etapa de processamento.

A Figura 3 mostra uma cole¸c˜ao de tra¸cos s´ısmicos referentes um ´

(36)

Figura 2 – Ilustra¸c˜ao das trajet´orias das ondas s´ısmicas refletidas no mesmo ponto da subsuperf´ıcie (CMP) para quatro afastamentos entre a fonte e o receptor (SANCEVERO et al., 2008).

(37)

de refletividade t s˜ao maiores quanto mais o afastamento entre a fonte e o receptor (offset ), mostrando uma dependˆencia da velocidade de propaga¸c˜ao da onda das camadas da subsuperf´ıcie. Esta dependˆencia pode ser definida, de forma aproximada e para afastamentos pequenos, pela equa¸c˜ao de Dix (SEN, 2006):

t2= t20+  x

Vrms

2

(2.2) na qual t0 ´e o tempo de ocorrˆencia da refletividade com afastamento

nulo, x ´e o afastamento entre a fonte e o receptor e Vrms´e a velocidade

m´edia quadr´atica de propaga¸c˜ao da onda.

Figura 3 – Exemplo de dados s´ısmicos submetidos aos processos de An´alise de Velocidade, Normal Moveout (NMO) e empilhamento. Ve-locidade modelada para horizontalizar os eventos de reflex˜ao em A; tra¸cos medidos de um CMP para diferentes afastamentos entre fonte e receptor em B; e tra¸cos corrigidos por NMO em C (SEN, 2006).

O ajuste dos valores de velocidade em certos intervalos de tempo, a equa¸c˜ao 2.2 ´e utilizada para corrigir o tempo das amplitudes corres-pondentes `a ocorrˆencia dos eventos de refletividades. Este procedi-mento ´e denominado an´alise de velocidades e NMO (Normal Moveout ) (SEN, 2006) e seu objetivo ´e horizontalizar as refletividades referentes aos mesmos pontos refletores da subsuperf´ıcie.

Um exemplo de tra¸cos de um CMP submetidos a este processo ´e mostrado na Figura 3C. As velocidades ajustadas para alcan¸car este

(38)

re-sultado s˜ao mostradas na Figura 3A em preto e a velocidade quadr´atica m´edia em amarelo.

A seguir, os tra¸cos horizontalizados s˜ao empilhados (somados), resultando em apenas um tra¸co referente a um ´unico CMP. Esta t´ecnica ´e aplicada para diversos CMPs, e a visualiza¸c˜ao destes tra¸cos corrigi-dos e empilhacorrigi-dos por NMO para tocorrigi-dos os CMPs ´e chamada de sec¸c˜ao empilhada ou do inglˆes post-stack representada na Figura 4. Esta se¸c˜ao representa aproximadamente os tra¸cos s´ısmicos de medida feitas com afastamento nulo, ou seja, de incidˆencia normal. Todo este processa-mento aumenta a raz˜ao sinal-ru´ıdo e reduz significativamente o volume de dados.

Figura 4 – Exemplo de uma se¸c˜ao s´ısmica empilhada com 199 CMP’s.

Para uma an´alise mais coerente da subsuperf´ıcie, outra informa¸c˜ao importante s˜ao os dados de po¸cos. Os dados de po¸cos s˜ao observados durante o processo de perfura¸c˜ao, formando os chamados logs de po¸cos. Os logs de po¸cos s˜ao informa¸c˜oes consideradas os mais pr´oximos da re-alidade do campo explorado e cada log pode ser representado em uma estrutura de dados similar ao tra¸co s´ısmico.

Diversas propriedades de rochas e estat´ısticas podem ser calcu-ladas a partir dos logs de po¸cos, ajudando os especialistas a desenvol-verem uma an´alise inicial para aquela pequena parte do reservat´orio onde o po¸co foi perfurado. Exemplos de propriedades que podem ser observadas em logs de po¸cos s˜ao: impedˆancia, porosidade, densidade e permeabilidade. Estas propriedades s˜ao essenciais para distinguir a

(39)

rocha que possui ´oleo (rocha reservat´orio) das demais, pois cada rocha apresenta diferentes medidas. Por´em, os logs s˜ao observados em uma pequena parte do reservat´orio, geralmente na escala de cent´ımetros na regi˜ao onde o po¸co ´e perfurado.

Segundo Figueiredo et al. (2017), a invers˜ao s´ısmica consiste no processamento dos dados s´ısmicos para a inferˆencia das propriedades das rochas para todo o campo explorado. O resultado da invers˜ao s´ısmica ´e ent˜ao analisado por um especialista, que geralmente compara as propriedades inferidas no processo com os dados de po¸cos. Esta an´alise serve para verificar se, naquela pequena regi˜ao que se conhece as informa¸c˜oes reais via os logs de po¸cos, as propriedades s˜ao condi-zentes. A Figura 5 ilustra uma compara¸c˜ao entre uma se¸c˜ao s´ısmica e o resultado da inferˆencia pela invers˜ao s´ısmica para a propriedade impedˆancia.

Al´em da invers˜ao s´ısmica para as propriedades de rocha, a ca-racteriza¸c˜ao de reservat´orios requer a integra¸c˜ao de diferentes tipos de m´etodos para o processamento dos dados e a interpreta¸c˜oes feitas por profissionais, enquanto incorpora a rela¸c˜ao espacial das heterogeneida-des do reservat´orio (BOSCH; MUKERJI; GONZALEZ, 2010). A rela¸c˜ao espacial serve para entender a aleatoriedade dos dados de um reser-vat´orio, mas com poss´ıvel estrutura¸c˜ao espacial.

2.1.2 Geoestat´ıstica

Segundo Matheron (1989), a geoestat´ıstica ´e um ramo da es-tat´ıstica que integra a teoria de vari´aveis aleat´orias com a teoria de vari´aveis regionalizadas, com o objetivo de estudar a correla¸c˜ao espa-cial entre estas vari´aveis. A correla¸c˜ao espacial permite calcular algum valor de interesse condicionado aos dados existentes, incorporando a distribui¸c˜ao estat´ıstica dos dados no espa¸co (KRIGE, 1981).

A modelagem geoespacial permite a descri¸c˜ao quantitativa e qua-litativa da variabilidade espacial dos atributos de interesse, sobre uma determinada ´area ou subsuperf´ıcie, e a estimativa n˜ao tendenciosa da variˆancia m´ınima de valores desses atributos em locais n˜ao amostrados. Diversos m´etodos geoestat´ısticos s˜ao utilizados no processo de gera¸c˜ao de mapas e estruturas geol´ogicas da subsuperf´ıcie.

Os m´etodos geoestat´ısticos se baseiam, principalmente, no uso dos variogramas. O variograma representa a variˆancia das amostras de acordo com a distˆancia espacial entre elas, sendo calculado por:

(40)

(a) S´ısmica

(b) Impedˆancia

Figura 5 – Compara¸c˜ao entre a se¸c˜ao S´ısmica (a) e resultado da in-vers˜ao s´ısmica para a propriedade Impedˆancia sendo comparada com as informa¸c˜oes dos logs de po¸cos (b).

(41)

2γ(h) = 1 N (h) N (h) X i=1 [Z(xi) − Z(xi+ h)]2 (2.3)

onde N (h) ´e o n´umero de pares de valores medidos, Z(xi) e Z(xi+ h),

separados por um vetor de distˆancia h. A Figura 6 ilustra o variograma calculado a partir de um conjunto de dados espacialmente correlacio-nados.

(a) Dados (b) Variograma

Figura 6 – Dados de porcentagem da porosidade coletados de acordo com a distˆancia entre pontos cardeais (a) e o variograma correspondente (b). A medida que a distˆancia ou lag aumenta, a variabilidade tamb´em ´

e maior. Adaptada de Hunter (2007).

Na ind´ustria de petr´oleo e g´as, a geoestat´ıstica ´e utilizada na constru¸c˜ao de um modelo geol´ogico conceitual que procura representar a realidade da heterogeneidade do reservat´orio. A partir de algumas informa¸c˜oes a priori, a geoestat´ıstica fornece um conjunto de ferramen-tas para ajudar os profissionais de geociˆencias na defini¸c˜ao dos modelos de estruturas geol´ogicas entre os dados observados, como por exemplo, os canais que possam estar interligados entre as mesmas f´acies de re-servat´orio.

Portanto, a invers˜ao s´ısmica com m´etodos geoestat´ısticos per-mite inferir a distribui¸c˜ao espacial das propriedades f´ısicas da subsu-perf´ıcie, contribuindo com a defini¸c˜ao de cen´arios mais realistas do reservat´orio. Por´em, como mencionado anteriormente, a geoestat´ıstica tradicional se limita somente entre rela¸c˜ao de duas amostras atrav´es dos variogramas para inferir as estruturas geol´ogicas. Entretanto, se-gundo Bosch, Mukerji e Gonzalez (2010), os variogramas n˜ao possuem informa¸c˜ao suficiente para modelar corpos geol´ogicos complexos, estru-turas e padr˜oes de conectividade de canais de reservat´orio. Para lidar com esta limita¸c˜ao, novas metodologias foram propostas e denominadas

(42)

geoestat´ıstica multipontos.

2.1.3 Geoestat´ıstica Multipontos

A geoestat´ıstica multipontos (GMP) (CAERS; ZHANG, 2004; CHI-ARELLI et al., 2015), surgiu para lidar com as limita¸c˜oes da geoes-tat´ıstica tradicional. Enquanto a geoesgeoes-tat´ıstica tradicional ´e baseada somente no variograma calculado a partir de dois pontos e n˜ao for-nece informa¸c˜oes suficientes para modelar corpos geol´ogicos comple-xos, a GMP utiliza o conceito de imagem de treinamento (STREBELLE, 2002). Uma imagem de treinamento (IT) ´e uma descri¸c˜ao de padr˜oes geom´etricos e variabilidade geol´ogica, com informa¸c˜oes suficientes (e.g. padr˜oes de conectividade de modelos de f´acies de reservat´orio) para fornecer um novo conjunto de ferramentas para modelar corpos e am-bientes geol´ogicos complexos (CAERS; ZHANG, 2004). Um exemplo de imagem de treinamento ´e mostrado na Figura 7.

Figura 7 – A imagem de treinamento de Strebelle (2002), onde a cor amarela representa o reservat´orio e a cor azul representa n˜ ao-reservat´orio. Adaptado de Caers e Zhang (2004).

Para ilustrar e comparar as limita¸c˜oes da geoestat´ıstica tradicio-nal, a Figura 8 mostra trˆes imagens de treinamento, na parte superior, com diferentes representa¸c˜oes de modelos de f´acies e identificadas com os n´umeros 1 (azul), 2 (vermelho) e 3 (preto). A primeira imagem (1)

(43)

representa uma textura estratificada, a segunda (2) um conjunto de for-mas el´ıpticas e a terceira (3) um conjunto de forfor-mas fluviais. Para cada imagem de treinamento foram calculados seus respectivos variogramas nas dire¸c˜oes norte e sul (NS ), oeste e leste (EW ).

Figura 8 – Variogramas semelhantes obtidos de trˆes imagens de treina-mento totalmente diferentes (CAERS; ZHANG, 2004).

Visualmente, as trˆes imagens de treinamento s˜ao completamente diferentes, mas os variogramas obtidos para cada uma delas (azul, ver-melho e preto) s˜ao similares. Portanto, assim como Caers e Zhang (2004) afirmam, somente com base em variogramas, ´e dif´ıcil de se ob-ter um modelo fiel que represente modelos geol´ogicos complexos e as estruturas internas do reservat´orio.

Os m´etodos baseados na abordagem GMP presentes no traba-lho de Caers e Zhang (2004), permitem a modelagem de elementos geol´ogicos como canais, recifes, cortes ou f´acies com diferentes ori-enta¸c˜oes, a partir do condicionamento das informa¸c˜oes encontradas na IT. Por´em, em um dos m´etodos apresentados chamado raster path, por

(44)

exemplo, a cada itera¸c˜ao ´e feita uma busca exaustiva por padr˜oes em pequenas janelas da imagem de treinamento original, demandando um alto custo computacional.

O raster path utiliza uma janela deslizante patk que condiciona

a reconstru¸c˜ao de canais de acordo com uma pequena parte do reser-vat´orio sobreposto em determinada regi˜ao onde ela se localiza (a). As-sim que a busca ´e realizada na imagem de treinamento (e) de referˆencia iniciado com k = 1, onde k ´e a quantidade de movimentos da janela, os canais s˜ao reconstru´ıdos e a janela ´e movida para o lado k = k + 1 (b), iniciando novamente o processo em busca dos padr˜oes de conectividade (c) e (d). A Figura 9 mostra o funcionamento do raster path.

Figura 9 – Ilustra¸c˜ao do funcionamento da metodologia GMP raster path adaptada de Caers e Zhang (2004).

Outro trabalho proposto por Strebelle (2002), utiliza uma ima-gem de treinamento para estimar a probabilidade condicional de uma vari´avel aleat´oria, dadas as suas vari´aveis vizinhas. Com isso, a GMP expressa a variabilidade conjunta de mais de dois locais ao mesmo tempo a partir de dados de uma IT.

Supondo que uma se¸c˜ao s´ısmica 2D seja utilizada no processo de invers˜ao s´ısmica tradicional para inferir as f´acies reservat´orio e n˜ao reservat´orio. Al´em de n˜ao fornecer informa¸c˜oes suficientes sobre os corpos geol´ogicos, os dados s´ısmicos podem conter ru´ıdos decorrente do processo de aquisi¸c˜ao, como mostrado nas Figuras 10 e 11. Esses ru´ıdos se propagam durante a invers˜ao s´ısmica causando a gera¸c˜ao de

(45)

descontinuidade entre as f´acies reservat´orio, ou seja, prejudicando a identifica¸c˜ao dos padr˜oes de conectividade de reservat´orio de petr´oleo. Caers e Zhang (2004) afirmam que, com o uso da GMP no pro-cesso de invers˜ao s´ısmica, as imagens de treinamentos podem ser utili-zadas para recuperar ou definir os padr˜oes de conectividade de reser-vat´orio no resultado final da invers˜ao. Sendo assim, a descontinuidade provocada pelo ru´ıdo na s´ısmica ´e amenizada e a melhor defini¸c˜ao des-tes canais podem ajudar na redu¸c˜ao de riscos da explora¸c˜ao do reser-vat´orio. Na Figura 10, ´e mostrado um exemplo da invers˜ao s´ısmica tradicional e a Figura 11 ilustra um exemplo do resultado esperado da invers˜ao s´ısmica com GMP para o mesmo reservat´orio.

Figura 10 – Exemplo do resultado para modelo de f´acies utilizando a invers˜ao s´ısmica tradicional. Neste caso o ru´ıdo na s´ısmica gera diversas descontinuidades entre os padr˜oes de conectividade.

Entretanto, as propostas de invers˜ao s´ısmica com a Geoestat´ıstica Multipontos, apesar de se mostrarem promissoras, s˜ao custosas e de-mandam alto custo e tempo de processamento se comparadas `a invers˜ao s´ısmica tradicional. Outras limita¸c˜oes est˜ao nas pr´oprias imagens de treinamento, que n˜ao fornecem nenhum tipo de incerteza ou probabi-lidade para cada ponto de conex˜ao entre corpos geol´ogicos vizinhos. Al´em disso, todo o processo exige um esfor¸co do profissional para a defini¸c˜ao emp´ırica dos parˆametros dos m´etodos GMP.

2.1.4 Padr˜oes de Conectividade de Reservat´orios

Segundo Ainsworth (2005), os padr˜oes de conectividade de re-servat´orio representam uma das maiores incertezas da subsuperf´ıcie em quest˜ao de valida¸c˜ao e desenvolvimento do campo. Um reservat´orio que possui pouca conectividade pode levar a uma alta quantidade de compartimentos, resultando em um investimento elevado e uma baixa

(46)

Figura 11 – Exemplo do resultado esperado da invers˜ao s´ısmica com a abordagem geoestat´ıstica multipontos, com os padr˜oes de conectivi-dade recuperados de acordo com os padr˜oes encontrados na imagem de treinamento utilizada.

recupera¸c˜ao de hidrocarbonetos. A defini¸c˜ao dos padr˜oes de conectivi-dade fornece uma previsibiliconectivi-dade e o potencial do n´ıvel de conectiviconectivi-dade do reservat´orio, ajudando a definir um melhor layout das localiza¸c˜oes ideais para a perfura¸c˜ao dos po¸cos injetores e produtores. Portanto, entender e modelar as conectividades do reservat´orio tem grande va-lor para qualquer plano de desenvolvimento do campo a ser expva-lorado, (RENARD; ALLARD, 2013).

Assim como a defini¸c˜ao das conectividades, o pr´oprio layout das posi¸c˜oes de perfura¸c˜ao dos po¸cos tem grande influˆencia na recupera¸c˜ao do petr´oleo. A fun¸c˜ao dos po¸cos injetores ´e injetar algum flu´ıdo ou g´as diretamente no reservat´orio afim de fazer press˜ao para criar um canal de fluxo por onde o hidrocarboneto deve percorrer. Com isso, atrav´es dos canais do reservat´orio, deve existir um padr˜ao de conectividade na qual o petr´oleo possa atravessar e chegar at´e o po¸co produtor, onde de fato ´e extra´ıdo para a superf´ıcie. A Figura 12 ilustra a extra¸c˜ao de petr´oleo utilizando um po¸co injetor e um po¸co produtor.

2.2 REDES NEURAIS

Uma Rede Neural Artificial (RNA) ´e um sistema massivamente paralelo e distribu´ıdo, composto por unidades de processamento sim-ples que possuem uma capacidade natural de armazenar conhecimento

(47)

Figura 12 – Ilustra¸c˜ao da produ¸c˜ao de petr´oleo utilizando po¸cos inje-tores e po¸cos produtores conectados por um canal de fluxo. Adaptado de Zerkalov (2015).

e torn´a-lo dispon´ıvel para uso (HAYKIN, 1994). Dentre os diversos mo-delos propostos, as RNAs podem ser classificadas de duas maneiras: redes de aprendizagem supervisionadas (RUMELHART; HINTON; WILLI-AMS, 1986) e as redes de aprendizagem n˜ao supervisionada (KOHONEN et al., 2001). As redes supervisionadas s˜ao treinadas para um conjunto de dados de sa´ıda conhecido, j´a as redes de aprendizado n˜ao supervisi-onado s˜ao treinadas somente com os dados dispon´ıvel, sem uma sa´ıda conhecida.

Ao longo dos anos, desde o surgimento das RNAs, diversos mode-los surgiram para resolver diferentes classes de problemas. Atualmente, as redes neurais vˆem sendo utilizadas em diversas ´areas devido `a sua alta capacidade de processamento, em conjunto com a evolu¸c˜ao dos hardwares, e a capacidade de inferˆencia com informa¸c˜oes extra´ıdas a partir de conjuntos de dados. Entre as mais famosas do estado da arte, as redes convolucionais tˆem sido objeto de estudo em diversos trabalhos (KRIZHEVSKY; SUTSKEVER; HINTON, 2012; JI et al., 2013; HOWARD et al., 2017;ZHANG et al., 2018a;CHEN et al., 2018).

(48)

2.2.1 Redes Neurais Convolucionais

Em 1989, LeCun et al. (1989) apresentou o conceito de Redes Neurais Convolucionais (RNC). A RNC ´e um tipo especial de Rede Neu-ral, com a capacidade de trabalhar com dados que possuem formatos em grade ou topologia. Alguns exemplos conhecidos s˜ao: s´eries temporais (grade 1D com amostras em intervalos de tempo) e dados de imagem (grade 2D e 3D de pixel ) (KRIZHEVSKY; SUTSKEVER; HINTON, 2012). O nome surgiu a partir do uso de camadas baseadas na opera¸c˜ao ma-tem´atica chamada convolu¸c˜ao. Goodfellow, Bengio e Courville (2016) definem uma Rede Neural Convolucional como, uma simples Rede Neu-ral que utiliza a convolu¸c˜ao no lugar de opera¸c˜oes de multiplica¸c˜ao de matrizes, em pelo menos uma de suas camadas.

Supondo um problema, onde ´e necess´ario treinar uma Rede Con-volucional para classificar rostos humanos entre duas classes: feliz e triste. Para simplificar, supondo que as imagens sejam somente em preto e branco. Agora, dada outra matriz de tamanho 3 × 3, denomi-nada filtro convolucional ou kernel. A Figura 13 ilustra uma imagem de rosto com a express˜ao feliz e a matriz entre 0 e 1 representando as cores dos pixels e a Figura 14, a matriz ilustrando o kernel.

Figura 13 – Representa¸c˜ao de um rosto sorrindo (esquerda) e a repre-senta¸c˜ao em uma matriz de valores entre 0, para branco e 1, para preto (direita). Adaptado de Goodfellow, Bengio e Courville (2016).

Primeiramente, o kernel ´e sobreposto sobre o canto superior es-querdo da matriz de valores que representa a imagem de entrada. Sendo assim, ´e feito o produto do kernel sobrepostos com os valores da ima-gem de entrada, gerando uma matriz 3 × 3, onde todos os coeficientes

(49)

Figura 14 – Exemplo de representa¸c˜ao da matriz de parˆametros 3 × 3 chamada de kernel. Adaptado de Goodfellow, Bengio e Courville (2016).

s˜ao somados, gerando o coeficiente (1, 1) da matriz de caracter´ısticas, ou mais comumente, mapa de caracter´ısticas.

O kernel ´e ent˜ao movido para a direita, em um passo denomi-nado de stride. O tamanho do stride pode ser definido como um pixel para a direita. Ap´os ser movido o kernel, ´e feita a mesma opera¸c˜ao para a obten¸c˜ao do coeficiente (1, 2) do mapa de caracter´ısticas e as-sim sucessivamente. A Figura 15 ilustra intuitivamente a opera¸c˜ao de convolu¸c˜ao realizada no treinamento da Rede Neural Convolucional.

O tamanho do mapa de caracter´ısticas ´e controlado pelo tama-nho do passo stride. Quanto maior o stride, menor ser´a o tamanho do mapa de caracter´ısticas. A redu¸c˜ao da imagem de entrada para os ma-pas de caracter´ısticas ´e fundamental para que a Rede Neural Convolu-cional aprenda somente as caracter´ısticas mais importantes, agilizando o processo de treinamento. A proposta do kernel ´e justamente detectar estas caracter´ısticas nas imagens de entrada.

Segundo Goodfellow, Bengio e Courville (2016), diferentes ker-nels possibilitam a identifica¸c˜ao de diferentes caracter´ısticas. Portanto, diferentes kernels s˜ao utilizados durante o treinamento da Rede Neural Convolucional, podendo at´e serem definidos com tamanhos diferentes. A Figura 16 mostra a aplica¸c˜ao de diferentes kernels para uma mesma imagem.

(50)

(a)

(b)

Figura 15 – Ilustra¸c˜ao do in´ıcio da opera¸c˜ao convolu¸c˜ao (a) e o mapa de caracter´ıstica obtido ao final ap´os aplicar o kernel por toda a imagem (b). Da esquerda para a direita: pesos da imagem de entrada, kernel e o mapa de caracter´ısticas. Adaptado de Goodfellow, Bengio e Courville (2016).

Figura 16 – Exemplo dos mapas de caracter´ısticas obtidos a partir de diferentes kernels. Adaptado de Goodfellow, Bengio e Courville (2016).

(51)

2.2.1.1 Camada Convolucional

No contexto da Rede Neural Convolucional, a aplica¸c˜ao de di-versos kernels sobre a imagem de entrada gera didi-versos mapas de ca-racter´ısticas. Os mapas de caracter´ısticas s˜ao empilhados, formando a Camada Convolucional (CONV). Para cada um destes mapas de carac-ter´ısticas, podem ser aplicados novamente diferentes kernels para obter novos mapas de caracter´ısticas para formar a camada convolucional se-guinte (LECUN et al., 1989).

Cada kernel possui uma dimens˜ao reduzida em rela¸c˜ao aos dados de entrada, por´em, ele possui a mesma profundidade de imagem, po-dendo variar de acordo com o problema. Por exemplo, se uma imagem de entrada possui dimens˜ao 100 × 100 e ela for colorida em tons RGB, ent˜ao neste caso sua profundidade ´e 3. Portanto, o kernel pode ser definido como 3 × 3 × 3, onde a ´ultima dimens˜ao ´e a mesma da imagem de entrada (LECUN; BENGIO; HINTON, 2015). A Figura 17 mostra um exemplo da aplica¸c˜ao de kernels com a mesma profundidade dos dados de entrada.

Figura 17 – Aplica¸c˜ao de n kernels de tamanho k×k×3 em uma entrada de tamanho w × h × 3. O resultado s˜ao n mapas de caracter´ısticas de tamanho w × h.

Em termos formais, a entrada de cada CONV sendo representado por l, onde l ´e o n´umero da camada composta por um conjunto de n(l−1) mapas de caracter´ısticas extra´ıdas pela camada anterior (l − 1)

com dimens˜ao w(l−1)× h(l−1). Caso l seja a primeira camada da rede,

sua entrada pode ser uma imagem I compostas de n canais. A sa´ıda da camada convolucional consiste em n(l)mapas de caracter´ısticas com

(52)

Mi(l)), ´e representada da forma: Mi(l)= Bi(l)+ n(l−1) X j=1 Ki,j(l)∗ Mj(l−1) (2.4)

onde Bi(l) ´e uma matriz contendo o bias e Ki,j(l) ´e o filtro a ser aplicado nos dados de entrada (LECUN; BENGIO; HINTON, 2015).

2.2.1.2 Camada Pooling

A camada pooling ´e geralmente utilizada ap´os uma camada CONV para a redu¸c˜ao da dimensionalidade dos atributos, reduzindo o custo computacional da Rede Neural Convolucional. No caso de uma camada pooling de dimens˜oes (2, 2) aplicada sobre um mapa de caracter´ısticas de (4, 4), resulta em um mapa de caracter´ısticas de dimens˜oes (2, 2) (HUANG et al., 2007).

O c´alculo da sa´ıda de uma camada pooling por ser definida de diversos modos, onde se aplica alguma fun¸c˜ao em todos os elementos de uma determinada regi˜ao. Geralmente os trabalhos encontrados na literatura fazem o uso da Average Pooling ou a Max Pooling. No pri-meiro, ´e feito o c´alculo da m´edia dos elementos para se obter a sa´ıda e no segundo o valor da sa´ıda ´e o maior elemento de determinada regi˜ao. ´

E importante mencionar que a camada pooling n˜ao reduz a profundi-dade da entrada, somente a largura e altura do campo perceptivo dos filtros da RNC (LECUN; BENGIO; HINTON, 2015). A Figura 18 mostra um exemplo da opera¸c˜ao pooling, onde a entrada ´e dividida em janelas 4x4, sendo que, para de cada uma destas janelas, ´e utilizada a fun¸c˜ao Max Pooling.

Al´em de reduzir a dimens˜ao dos filtros e dos parˆametros da rede, a camada pooling tamb´em ´e essencial para criar invariˆancia espacial (GOODFELLOW; BENGIO; COURVILLE, 2016). A invariˆancia espacial permite identificar o mesmo padr˜ao em qualquer local dos dados de entrada. Por exemplo, para entradas do tipo imagem, onde o obje-tivo ´e identificar as rodas de um carro, independente da sua localiza¸c˜ao na imagem, ela ser´a identificada da mesma forma pelos mapas de ca-racter´ısticas. A Figura 19 ilustra a estrutura de uma Rede Neural Convolucional.

(53)

Figura 18 – Opera¸c˜ao de Pooling utilizando a fun¸c˜ao de m´aximo.

Figura 19 – Exemplo de uma estrutura de uma Rede Neural Convolu-cional. Adaptada de Albelwi e Mahmood (2017).

(54)

2.2.2 Fun¸c˜oes de Ativa¸c˜ao

Segundo Goodfellow, Bengio e Courville (2016), existem algumas dicas a serem seguidas para se ter um treinamento mais eficiente da Rede Gerativa Advers´aria. Uma destas etapas ´e n˜ao utilizar a Sigm´oide como fun¸c˜ao de sa´ıda da Rede Neural, sendo que o recomendado ´e utilizar a fun¸c˜ao Tangente Hiperb´olica (tanh). A diferen¸ca entre as duas fun¸c˜oes ´e que a Hiperb´olica trabalha com valores entre (−1, 1) e a Sigm´oide entre (0, 1).

No trabalho de LeCun et al. (2012), os autores mostram que a fun¸c˜ao Tangente Hiperb´olica fornece gradientes melhores do que a Sigm´oide. Os autores explicam que a derivada da Sigm´oide para n´umeros pequenos fornece valores quase iguais a zero, o que dificulta o aprendi-zado e treinamento Rede Neural. A principal vantagem ´e a necessidade de um menor n´umero de ´epocas para a convergˆencia da rede, sendo que uma ´epoca constitui na atualiza¸c˜ao dos pesos ap´os a apresenta¸c˜ao de todos os exemplos de treinamento contidos no conjunto de dados. Al´em disso, os resultados de inferˆencia e a estabilidade tamb´em se mostram superiores. A Figura 20 mostra os gr´aficos de ambas as fun¸c˜oes.

(a) Tangente Hiperb´olica (b) Fun¸c˜ao Sigm´oide

Figura 20 – Compara¸c˜ao entre a fun¸c˜ao Tangente Hiperb´olica e a fun¸c˜ao Sigm´oide.

As fun¸c˜oes de ativa¸c˜ao Sigm´oide e Tangente Hiperb´olica s˜ao co-mumente utilizadas no treinamento das Redes Neurais. No entanto, segundo Krizhevsky, Sutskever e Hinton (2012), a fun¸c˜ao de ativa¸c˜ao ReLU (Rectified Linear Unit ) tem se tornado popular nos ´ultimos anos. A fun¸c˜ao da ReLU ´e denominada como

f (x) = max(0, x) (2.5)

(55)

ca-racter´ısticas. Algumas vantagens em utilizar a ReLU s˜ao: aumento do desempenho no treinamento da Rede Neural e simplicidade na imple-menta¸c˜ao, pois ela pode ser interpretada somente como uma ativa¸c˜ao limitada `a zero (KRIZHEVSKY; SUTSKEVER; HINTON, 2012).

2.2.3 Redes Autocodificadoras Convolucionais

Segundo Bengio et al. (2007), uma Rede Autocodificadora (RA) ´e uma rede do tipo n˜ao-supervisionada onde se utiliza o mesmo conjunto de dados como entrada e sa´ıda. A RA recebe uma entrada x ∈ Rd e mapeia esta entrada para uma representa¸c˜ao latente h ∈ Rd utili-zando uma fun¸c˜ao determin´ıstica do tipo h = fθ = σ(Wx+ b) com

parˆametros θ = {W, b}. Esta representa¸c˜ao latente, tamb´em chamada de ”codifica¸c˜ao”, ´e utilizada para a reconstru¸c˜ao da entrada original por um mapeamento reverso de f : ˆx = fθ0(h) = σ(W0h + b0) com

θ0= {W0, b0}.

Estes dois parˆametros s˜ao geralmente restritos para serem da forma W0 = WT, usando os mesmos pesos para as representa¸oes

latentes do codificador e decodificador. Para cada padr˜ao de treina-mento xi ´e mapeado para sua codifica¸c˜ao hi e sua decodifica¸c˜ao

(re-constru¸c˜ao) ˆxi. Os parˆametros s˜ao otimizados, minimizando o erro

com alguma fun¸c˜ao de custo sobre o conjunto de treinamento Dn =

{(x0, t0), ..., (xn, tn)}. A Figura 21 mostra o modelo de uma RA.

Figura 21 – Exemplo de um modelo de Rede Autocodificadora. No trabalho de Masci et al. (2011), os autores mostram que, uma Rede Autocodificadora totalmente conectada tradicional ignora estruturas de imagens nos formatos 2D. Este problema acontece, pois, uma Rede Autocodificadora tradicional possui um neurˆonio por pixel, perdendo informa¸c˜oes sobre a correla¸c˜ao espacial entre pixels vizinhos.

(56)

Ao se ignorar este tipo de estrutura, surge o problema de lidar com tamanhos real´ısticos de entradas e tamb´em introduz redundˆancia nos parˆametros, for¸cando cada representa¸c˜ao de determinada caracter´ıstica ser global, ou seja, abranger todo o campo visual ao inv´es de um campo visual local.

As Redes Autocodificadoras Convolucionais (RAC), inicialmente propostas por Masci et al. (2011), foram desenvolvidas para o apren-dizado de caracter´ısticas encontradas em imagens via aprenapren-dizado n˜ao supervisionado. A RAC ´e uma combina¸c˜ao entre Redes Neurais Convo-lucionais e as Redes Autocodificadoras. Este tipo de rede ´e geralmente utilizado para aumentar a resolu¸c˜ao ou reconstruir imagens danificadas (por algum ru´ıdo ou parte da imagem faltante).

Em ambos os conceitos, o objetivo ´e minimizar o erro da recons-tru¸c˜ao da imagem com o conhecimento `a priori de uma imagem n˜ao danificada. A arquitetura de uma RCA ´e similar ao conceito das RA descritas na se¸c˜ao 2.2.3, exceto pelas camadas serem convolucionais e pelos pesos que s˜ao compartilhados. A Figura 22 ilustra a arquitetura de uma Rede Autocodificadora Convolucional.

Figura 22 – Exemplo de um modelo de Rede Autocodificadora Convo-lucional aplicada para o reconhecimento de f´acies em dados s´ısmicos. Adaptado de Qian et al. (2017).

Para uma entrada x, a representa¸c˜ao latente do kth mapa de

caracter´ıstica ´e dado por

hk= σ(x ◦ Wk+ bk) (2.6) onde o bias ´e transmitido para todo o mapa, σ ´e a fun¸c˜ao de ativa¸c˜ao,

Referências

Documentos relacionados

Para discutir a temática, iniciaremos nossa incursão teórica a partir da concepção de religião implícita em DURKHEIM (1996), mais especificamente sobre a religião como

1) As Operadoras obrigam-se a cumprir o que foi declarado na CPI da Telefonia Móvel em Santa Catarina quanto à execução de investimentos previstos nos termos do Plano de Melhoria

São Bernardo do Campo

são responsáveis pela diferença na nota entre os piores e melhores alunos, em razão disto, este trabalho tem como objetivo encontrar quais determinantes de desempenho

Diante do exposto, objetivou-se com este trabalho avaliar fontes alternativas de proteína para vacas em lactação, quanto ao consumo, digestibilidade dos nutrientes, produção

Tabela 6-Valores médios e desvios padrão da freqüência cardíaca FC, da duração Ps e amplitude PmV da onda P, duração do complexo QRS, duração do intervalo PR, duração

UNIVERSIDADE FEDERAL RURAL DE PERNAMBUCO UNIDADE ACADÊMICA DE GARANHUNS TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO Convidamos o a Sr a para participar da Pesquisa intitulada

Os resultados obtidos indicaram que o Método do Ganho de Massa é viável para a obtenção do percentual de absorção de CO2; todas as mostras submetidas à cura por