ADALBERTO FRANCISCO MONTEIRO FILHO
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE
UNIDADE ACADEMICA DE MINERACAO E GEOLOGiA
CAMPINA GRANDE (PB)
JULHO 2011
ADALBERTO FRANCISCO MONTEIRO FILHO
Dissertacao apresentada a Unidade
Academica de Mineracao e Geologia
da Universidade Federal de Campina
Grande, como parte das exigencias
para obtengao do titulo de Mestre em
Ciencias.
Orientador: Prof. Jose Agnelo Soares, DSc.
CAMPINA GRANDE (PB)
JULHO2011
M775e Monteiro Filho, Adalberto Francisco
Efeito do Tamanho da Amostra de treinamento na Predicao de Perfis Faltantes por tecnica de Analise Multivariada / Adalberto Francisco Monteiro Filho. — Campina Grande. 2011.
112f.:il.col.
Dissertacao (Mestrado em Engenharia de Minas) - Universidade Federal de Campina Grande, Centro de Tecnologia e Recursos Naturais.
Referencias.
Orientador: Prof. Dr. Jose Agnelo Soares.
1. Perfilagem de Pocos. 2. Analise Multivariada. 3. KNN. 4. Petroleo. I. Titulo.
ADALBERTO FRANCISCO MONTEIRO FILHO
Dissertacao apresentada a Unidade
Academica de Mineracao e Geologia
da Universidade Federal de Campina
Grande, como parte das exigencias
para obtencao do titulo de Mestre em
Ciencias.
Aprovada em 04/07/2011
Comissao Examinadora:
Gostaria de expressar o mais profundo agradecimento a todas as pessoas que
direta ou indiretamente contribuiram para o exito deste trabalho, pela ajuda e apoio
durante o perfodo que trabalhei nesta dissertacao. Seria impossivel mencionar a
todas.
A minha familia, pela paciencia e motivagao que sempre manifestaram ao longo
deste trabalho.
Ao meu orientador, Prof. Dr. Jose Agnelo Soares, pelo apoio permanente, suas
sugestoes valiosas, paciencia e dedicacao.
Ao Prof. Dr. Arlindo Jose Bazante, pelas valiosas sugestoes e contribuicoes para o
desfecho do trabalho.
Aos membros da banca examinadora pela leitura critica e valiosas sugestoes que
muito contribuiram para a melhoria deste trabalho.
A Universidade Federal de Campina Grande (UFCG).
A Unidade Academica de Mineracao e Geologia, seus coordenadores e funcionarios
pelo apoio prestado ao longo do trabalho.
RESUMO
Perfis geofisicos de pocos constituem uma importante fonte de dados para a
avaliacao do potencial de uma dada area, com fins de exploracao de recursos
naturais subterraneos. Por diversas razoes, dentre as quais destacamos as
dificuldades operacionais, indisponibiiidade de sondas ou por questoes relativas a
priorizacao no momento da contratagao do servico de aquisicao dos dados, assim
sendo dificilmente se dispoe do conjunto completo de perfis, de modo que pode
haver perfis faltantes em um dado poco. No entanto, uma caracteristica marcante
dos perfis geofisicos de pocos e que existe eerto nivel de redundancia entre eles, de
modo que se pode fazer uso desta caracteristica para estimar um dado perfil faltante
a partir dos demais perfis disponiveis. Neste trabalho as estimativas de perfis
faltantes foram realizadas atraves da aplicagao da tecnica de estatistica multivariada
KNN (K-esimos valores mais proximos), a qual se baseia na medicao da
similaridade, no espaco multidimensional, entre valores dos diversos perfis de uma
amostra de treinamento. A estimativa do valor de um dado perfil faltante e obtida
pela similaridade entre os perfis disponiveis e os perfis da amostra de treinamento.
Em particular, neste trabalho se avaliou o efeito do tamanho da amostra de
treinamento sobre a eficiencia da predicao pelo metodo KNN. Os resultados obtidos
mostram que o aumento do tamanho da amostra de treinamento conduz a reducao
da diferenca entre a curva real e a estimada. No entanto, amostras de treinamento
com apenas 10% dos dados disponiveis ja fornecem resultados aceitaveis de
predicao para os perfis cuja variacao ocorre em escala linear, como os perfis de
densidade, sonico, raios gama e porosidade de neutrons. Para o perfil de
resistividade eletrica nao se obteve resultados aceitaveis, pois o mesmo nao guarda
redundancia em relacao aos demais perfis disponiveis.
ABSTRACT
Geophysical well logs constitute an important data source for the evaluation of the
potential of a given area for underground natural resources exploitation purposes.
For several reasons, hardly the complete log set is available, so that there may be
missing logs in a given well. However, a geophysical well logs characteristic is that
there is some level of redundancy between them, so this feature can be used to
estimate a given missing log from other available logs. This work estimate missing
logs through the application of the multivariate statistical technique KNN (K-thnearest
neighbor) which is based on the measurement of similarity between the values of
several logs of a training sample set. The estimated value of a given missing log is
obtained by the similarity between the available logs and the training set values. In
particular this work evaluates the effect of the training set size on the efficiency of
KNN prediction. The results obtained show that increasing the training set size leads
to a reduction of the difference between the actual log and the estimated one.
However, training set with only 10% of the available data already provide acceptable
prediction for logs whose variation occurs in linear scale, as density, sonic, gamma
ray and neutron porosity logs. For electrical resistivity log KNN not achieved
acceptable results, because this log does not have redundancy with other available
logs.
LISTA DE ILUSTRACOES
Figura 1 - Movimento e direcao das ondas P e S 8
Figura 2 - Classificacao de um novo elemento 15
Figura 3 - Mapa de localizacao dos pocos do Campo de Namorado 18
Figura 4 - Tela de dados do programa SAS Enterprise Guide® com o plugin da
Funcao Discriminante 20
Figura 5 - Tela do SAS Enterprise Guide® para selegao do perfil a estimar a partir
dos perfis de analise 21
Figura 6 - Tela do SAS Enterprise Guide® para selegao do metodo estatistico de
analise 22
Figura 7 - Tela do SAS Enterprise Guide® para definicao dos parametros da funcao
discriminante 23
Figura 8 - Tela do SAS Enterprise Guide® para incluir os dados de classificacao e
gerar arquivo com os dados de saida
, 24
Figura 9 - Tela do SAS Enterprise Guide® com o arquivo de saida, o qual inclui a
coluna com o perfil faltante estimado 25
Figura 10 - Fluxograma para obtengao dos conjuntos de dados de treinamento
27
Figura 11 - Fluxograma para aplicacao das regras discriminantes e estimacao dos
perfis faltantes
27
Figura 12 - Perfis sonicos do poco NA-01a
29
Figura 13 - Perfis sonicos do poco NA-02
30
Figura 14 - Perfis sonicos do poco NA-04...
31
Figura 15 - Perfis sonicos do poco NA-05a
32
Figura 16 - Perfis sonicos do poco NA-07
33
Figura 17 - Perfis sonicos do poco NA-11a
34
Figura 18 - Perfis sonicos do poco NA-12
35
Figura 19 - Perfis sonicos do poco NA-17a
36
Figura 20 - Perfis sonicos do poco NA-21b
37
Figura 21 - Perfis sonicos do poco RJS-19
38
Figura 23 - Perfis sonicos do poco RJS-234
40
Figura 24 - Perfis raios gama do poco NA-01a
41
Figura 25 - Perfis raios gama do poco NA-02
.42
Figura 26 - Perfis raios gama do poco NA-04
43
Figura 27 - Perfis raios gama do poco NA-05a
44
Figura 28 - Perfis raios gama do poco NA-07
45
Figura 29 - Perfis raios gama do poco NA-11a
...46Figura 30 - Perfis raios gama do poco NA-12
47
Figura 31 - Perfis raios gama do pogo NA-17a
48
Figura 32 - Perfis raios gama do pogo NA-21b
49
Figura 33 - Perfis raios gama do pogo RJS-19
50
Figura 34 - Perfis raios gama do pogo RJS-42
51
Figura 35 - Perfis raios gama do pogo RJS-234
52
Figura 36 - Perfis resistividade eletrica do pogo NA-01a
53
Figura 37 - Perfis resistividade eletrica do pogo NA-02
54
Figura 38 - Perfis resistividade eletrica do pogo NA-04
55
Figura 39 - Perfis resistividade eletrica do pogo NA-05a
56
Figura 40 - Perfis resistividade eletrica do pogo NA-07
57
Figura 41 - Perfis resistividade eletrica do pogo NA-11a
58
Figura 42 - Perfis resistividade eletrica do pogo NA-12
59
Figura 43 - Perfis resistividade eletrica do pogo NA-17a
60
Figura 44 - Perfis resistividade eletrica do pogo NA-21b
61
Figura 45 - Perfis resistividade eletrica do pogo RJS-19
....62Figura 46 - Perfis resistividade eletrica do pogo RJS-42
63
Figura 47 - Perfis resistividade eletrica do pogo RJS-234
64
Figura 48 - Perfis porosidade de neutrons do pogo NA-01a
65
Figura 52 - Perfis porosidade de neutrons do pogo NA-07
Figura 53 - Perfis porosidade de neutrons do pogo NA-11a
Figura 54 - Perfis porosidade de neutrons do pogo NA-12
Figura 55 - Perfis porosidade de neutrons do pogo NA-17a .
Figura 56 - Perfis porosidade de neutrons do pogo NA-21b
Figura 57 - Perfis porosidade de neutrons do pogo RJS-19
Figura 58 - Perfis porosidade de neutrons do pogo RJS-42
Figura 59 - Perfis porosidade de neutrons do pogo RJS-234
Figura 60 - Perfis densidade do pogo NA-01a
Figura 61 - Perfis densidade do pogo NA-02
Figura 62 - Perfis densidade do pogo NA-04
Figura 63 - Perfis densidade do pogo NA-05a
Figura 64 - Perfis densidade do pogo NA-07
Figura 65 - Perfis densidade do pogo NA-11a
Figura 66 - Perfis densidade do pogo NA-12....
Figura 67 - Perfis densidade do pogo NA-17a
Figura 68 - Perfis densidade do pogo NA-21b
Figura 69 - Perfis densidade do pogo RJS-19
Figura 70 - Perfis densidade do pogo RJS-42
Figura 71 - Perfis densidade do pogo RJS-234
Figura 72 - Diferenga RMS para o perfil DT
Figura 73 - Diferenga RMS para o perfil GR
Figura 74 - Diferenga RMS para o perfil ILD
Figura 75 - Diferenga RMS para o perfil NPHI
Figura 76 - Diferenga RMS para o perfil RHOB
LISTA DE EQUACOES
Resistencia em funcao da resistividade 5
Arranjo matricial do tipo n-por-m 13
Distaneia Euclidiana entre dois elementos 14
Tabela 1 - Resistividades eletricas de materiais 5
Tabela 2 - Velocidades da onda P tipicas para diversos tipos de rocha 9
Tabela 3 - Tempo de transito caracteristico de alguns materiais 12
Tabela 4 - Perfis geofisicos disponiveis e utilizados neste trabalho 19
Tabela 5 - Quadro-resumo das diferencas RMS maximas e mfnimas, em relacao ao
LISTA DE SiMBOLOS E SIGLAS
DT Perfil Sonico
GR Perfil de Raios Gama
ILD Perfil de Inducao
KNN K Nearest Neighbors
NPHI Perfil Neutronico
RHOB Perfil de Densidade
SAS Statistical Analysis System
SP Perfil Potencial Espontaneo
SUMARIO
Resumo i
Abstract ii
Lista de ilustracoes iii
Lista de equacoes vi
Lista de tabelas vii
Lista de simbolos e siglas viii
Capitulo I
1.1 Introducao 1
1.2 Objetivos 3
1.2.1 Propriedades fisicas registradas nos perfis 3
1.2.1.1 Resistividade eletrica 5
1.2.1.2 Propriedades radioativas 6
1.2.1.3 Propriedades acusticas 8
1.2.2 Perfis utilizados neste trabalho 10
1.2.2.1 Raios gama (GR)... 10
1.2.2.2 Neutronico (NPHI) 10
1.2.2.3 Indugao (ILD) 11
1.2.2.4 Sonico (DT) 11
1.2.2.5 Densidade (RHOB) 12
1.3 Analise multivariada 12
1.3.1 Medidas de similaridade 15
1.3.1.1 Metodo da ligacao completa 15
1.3.1.2 Metodo da ligagao media 16
1.3.1.3 Metodo do centroide 16
1.3.1.4 Metodo de Ward 17
Capitulo II
2.1 Dados e programas utilizados 18
2.1.1 Dados utilizados - 18
2.1.2 Programa SAS Enterprise Guide® 19
Capitulo 111
3.1 Resultados 29
3.1.1 Perfil sonico (DT) 29
3.1.2 Perfil de raios gama (GR) 41
3.1.3 Perfil de resistividade (ILD) 53
3.1.4 Perfil de porosidade de neutrons (NPHI) 65
3.1.5 Perfil de densidade (RHOB) 77
3.2 Analise da precisao dos resultados 89
3.2.1 Diferenga RMS 89
Capitulo IV
4.1 Conclusoes 94
Capitulo V
CAPITULO 1
1.1 - INTRODUCAO
Os fenomenos geologicos geralmente nao apresentam natureza determinfstica,
assim sendo, a complexidade na realizacao de estimativas e muito grande. Os
modelos probabilfsticos sao os metodos mais viaveis para contornar esta
dificuldade, a qual poderia ser minimizada pela obtencao de testemunhos de pocos,
porem este processo e muito oneroso e limitado em relacao a quantidade de dados
coletados. Por outro lado, se faz necessario o conhecimento da relacao existente
entre os diversos pocos adjacentes e a possivel correlagao dos dados coletados e
dos dados faltantes entre eles. Tal fato possibilita a extrapolacao dos dados para os
pocos que por algum motivo nao puderam ser testemunhados. Dentre as possiveis
dificuldades, destaca-se. as operacionais, indisponibilidade de sondas, ou questoes
relativas a priorizacao no momento da contratacao do servico de aquisicao dos
dados ou impossibilidade de se conhecer algum dos perfis geofisicos.
Genericamente os perfis sao obtidos atraves dos parametros medidos em funcao
das suas propriedades derivadas.
Do ponto de vista operacional, a rapida difusao destes metodos se deve, dentre
outros fatores, as facilidades proporcionadas por novos programas e maquinas.
Interfaces amigaveis de pacotes estatisticos, como SAS® e SPSS®, tornaram
bastante simples a tarefa de construir modelos para a geracao de curvas sinteticas
[Bucheb et al., 1997 apud Ribeiro, 2008].
Diversos estudos mostram uma boa aplicabilidade das tecnicas da analise
estatistica multivariada no processamento e interpretacao de dados geofisicos
[Couto, 1994 apud Ribeiro, 2008]. No caso da geofisica de poco, uma aplicacao
frequentemente apresentada trata da identificacao e separacao das eletrofacies e a
sua associacao aos diversos litotipos atravessados pelo poco. Outros estudos, onde
tambem se tern aplicado a estatistica multivariada com sucesso, se referem a
problemas da engenharia de reservatorio [Nitters et al., 1995 apud Ribeiro, 2008].
Wilbert [1986 apud Ribeiro, 2008] afirma que se considera rotina operacional no
reestudo de campos de petroleo por perfis, a extrapolacao, para os demais pocos do
campo, de parametros e procedimentos calibrados com litologias distingufveis em
pocos testemunhados (litofacies), dentro de eletrofacies rastreaveis atraves de
perfis. Segundo este mesmo autor, a caracterizacao das eletrofacies, normalmente
se faz considerando suas respostas tipicas em distintos perfis ou em associates de
perfis por grupo litologico. 0 padrao de resposta eletrofacies, assumido como
representative de uma determinada situacao litologiea definida nos testemunhos por
petrografia e ou petrofisica, e rastreado pelo computador sobre dados digitalizados
de perfis, ao longo de toda a area.
Sendo assim, e importante ter uma suite de perfis completa para a determinagao
computacional mais precisa das eletrofacies. Como uma solucao para aumentar a
precisao desta caracterizacao, esta pesquisa visa obter curvas sinteticas faltantes de
pocos perfilados atraves de modelagem estatistica.
Para contornar este problema, o primeiro passo e a obtencao de dados de boa
qualidade e, com o auxilio da modelagem numerica, poder oferecer estimativas
razoaveis e coerentes como resultado. Neste contexto, a modelagem de dados se
toma uma importante ferramenta, pois permite a simulacao dos dados de regioes
desconhecidas, tornando a exploracao mais segura.
1.2-OBJETIVOS
O objetivo principal deste estudo e aplicar tecnicas de analise multivariada para
realizar estimativas de perfis geofisicos faltantes a partir dos demais perfis existentes
nos pocos do Campo de Namorado, na Bacia de Campos. A ideia central e
aproveitar a redundancia das informacoes existentes nos dados para estabelecer
correlagoes, as vezes nao lineares, entre os diversos perfis geofisicos de um poco.
Desta forma se pode realizar a estimativa de um perfil faltante em um poco, ou de
um perfil inexistente em um dado intervalo de profundidade. Outro objetivo central e
avaliar a influencia do tamanho da amostra de treinamento sobre a eficiencia de
predicao.
A fim de atingir estes objetivos principais, os seguintes objetivos especificos devem
ser perseguidos:
- Edicao do arquivo contendo os dados de todos os pocos a analisar;
- Extracao dos arquivos com as amostras de treinamento selecionadas de
forma aleatoria;
- Executar a analise, gerando os perfis estimados;
- Preparar os graficos para a comparacao visual dos perfis estimados com os
seus correspondentes perfis reais;
- Calcular as diferengas medias quadraticas entre os perfis estimados e os
reais;
- Analisar os resultados obtidos.
1.2.1 - PROPRIEDADES FISICAS REGISTRADAS NOS PERFIS
A procura pela otimizagao da exploragao dos reservatorios petroliferos e
fundamental para o crescimento da industria do petroleo. Para que haja um cenario
propicio para a otimizagao de um reservatorio e necessario que seja feita uma
caracterizagao completa que esboga e identifica suas formas e suas propriedades
petrofisicas (porosidade, permeabilidade, argilosidade e saturagao). A partir dai
tecnicas de correlagao entre atributos sismicos e propriedades petrofisicas sao
obtidas e analisadas.
Quando da perfuracao de pocos de petroleo a perfilagem e uma ferramenta das
mais uteis e mais importantes, possibilitando o mapeamento completo do pogo,
mensurando as diferentes propriedades fisicas das formagoes, e a partir da
interpretagao dos perfis, identifica os diversos componentes formadores do
reservatorio (zonas de oleo, gas ou agua), alem de fazer a estimativa do volume de
hidrocarbonetos que pode vir a ser produzido. A perfilagem geofisica apesar de
fundamentar a avaliagao do reservatorio, e um metodo que representa um pequeno
percentual do custo total do pogo, entretanto fornece importantes informagoes sobre
as propriedades da rocha nas condigoes do reservatorio.
Esses perfis podem ser usados para realizar a definigao da litologia, uma vez que
respondem a uma grande quantidade de parametros geologicos e podem ser
corridos em toda a extensao do pogo obtendo-se medidas continuas em todo o
trajeto, alem de revelar diferentes propriedades das formagoes. Porem, realizar a
definigao litologica, a partir dos perfis de pogos, pode ser uma tarefa complexa,
especialmente quando grandes quantidades de informagoes estao envolvidas. Para
tornar essa tarefa eficaz, a estatistica multivariada, que envolve etapas como a
redugao da dimensionalidade e o reconhecimento de padroes, e uma pratica
adotada com frequencia [Talaat & Mostafa, 1989]. A analise multivariada e adotada
neste trabalho com o objetivo de estimar perfis inexistentes em um pogo.
0 perfil de um pogo e obtido a partir de ferramentas que sao descidas no pogo, onde
os valores sao registrados e em seguida sao armazenados em arquivos digitals para
posteriormente serem recuperados e analisados.
A efetivagao do registro das propriedades fisicas dos pogos e baseada
principalmente nas propriedades eletricas, radioativas e acusticas das rochas, sendo
esta ultima tambem muito importante no estudo de propagagao das ondas sismicas.
1.2.1.1 - RESISTIVIDADE ELETRICA
A resistencia eletrica e definida como sendo a medida da capacidade de um material
qualquer de se opor a passagem da corrente eletrica. A resistencia (R) e
diretamente proporcional ao comprimento (L), a ser percorrido pela corrente eletrica,
e a resistencia especifica ou resistividade do meio (p) e inversamente proporcional a
secao transversal (A) atravessada. A resistencia e dada por:
A rocha sedimentar e formada, quase que na sua totalidade, por minerals de
resistividade muito alta, consequentemente a corrente eletrica nao tern propagacao
pelos graos, mas sim atraves das solucoes eletroliticas que ocupam os espacos
vazios interligados, que sao muito mais condutivos.
A resistividade das rochas sedimentares varia entre 0,5 e 1.000 Dm. A resistividade
das solucoes eletroliticas intersticiais (que estao nos poros das rochas, e em
vesiculas ou fraturas), variam entre 0,05 e 100 Qm (ver Tabela 1). Desta forma, uma
rocha se torna mais ou menos condutora da corrente eletrica, a depender da maior
ou menor interconexao entre seus poros (porosidade e permeabilidade) e da maior
ou menor concentracao ionica de sua solucao (salinidade). A escassez de fluidos
condutores ou entao a presenca de fluidos isolantes, como o petroleo, torna a rocha
menos condutiva.
Tabela 1 - Resistividades eletricas de materiais (modiftcado de Tittman, 1986)
Material
Resistividade (Q.m a 18 -20°C)
Quartzo
1 0
1 2a 3 x 1 0
1 4Petroleo
10
Ha 1 0
i eAgua destilada a 2 kppm NaCI
3,4
Agua destilada a 10 kppm NaCI
0,72
Agua destilada a 20 kppm NaCI
0,38
Agua destilada a 100 kppm NaCI
0,09
Agua destilada a 200 kppm NaCI
0,06
Argila / Folhelho
2 - 1 0
Arenito com agua salgada
0 , 5 - 1 0
Arenito com oleo
5 - 1 0
3Calcario compactado
10
3a 10
4A genese do registro eletrico e atribuida a Conrad Schlumberger, professor de fisica
da Ecole de Mines de Paris, Franca, que concebeu a ideia da prospecgao de
depositos de minerio de metal usando os principios eletricos de condutividade para
distingui-los de outros menos condutores. Um dos primeiros testes, de acordo com
historiadores, Schlumberger realizou em sua banheira, que estava cheia de varias
rochas para o experimento. Trabalhando com seu irmao Marcel Schlumberger,
Conrad comecou uma serie de pesquisas na Europa, Africa e America do Norte
durante um periodo de tres anos.
Em 1926, os irmaos formaram a Societe de Prospection Electhque e desenvolveram
a teoria que adicionando informagoes de resistividade das formagoes mais
profundas aumentaria a eficacia da prospecgao. A experiencia consistiu em baixar
uma sonda eletrica a profundidade de 1.600 pes (-48 m) em um pogo no campo de
Pechelbronn, Franga, em 05 de setembro de 1927. Assim os irmaos Schlumberger
criaram o primeiro perfil de pogo. Este registro foi meticulosamente gravado ponto
por ponto, metro a metro, utilizando um equipamento improvisado e as sucessivas
leituras foram entao plotadas juntas. A tecnologia era simples, mas funcional. Era
composta por tres eletrodos A, M e N, que eram descidos ao fundo do pogo em tres
fios isolados. Um eletrodo de corrente A passa pela lama de perfuragao e se espalha
pela formagao. Os potenciais medidos em M e N sao transmitidos para a superficie
onde eles sao medidos. Ao medir a diferenga de potencial entre M e N, e a
intensidade da corrente de A, a resistividade aparente da formagao e calculada.
Apos o sucesso inicial com este primeiro registro a tecnologia de registrar permitiu a
aquisigao de diferentes conjuntos de dados nascidos a partir de ferramentas que
forneciam dados sobre raios gama, SP, resistividade, sonico e caliper com uma
simples coleta.
1.2.1.2- PROPRIEDADES RADIOATIVAS
As propriedades quimicas sao determinadas pelo numero de protons nos nucleos
atomicos e caracterizam diferentes elementos quimicos. Um mesmo elemento pode
ter um numero definido de protons podendo, entretanto, variar o seu numero de
neutrons (isotopos) cada isotopo tern suas proprias propriedades radioativas. Alguns
isotopos sao estaveis, ou seja, nao ha mudanca na estrutura atomica ou estado
energetico. Por outro lado, quando as forcas nucleares se desestabilizam, os
isotopos modificam sua estrutura, passando a emitir energia em forma de radiacao,
na tentativa de retornar a estabilidade, e se transformar em elementos diferentes. De
quase 1400 isotopos conhecidos atualmente, 1130 deles sao instaveis e apenas 65
ocorrem naturalmente, os demais sao artificiais [Thomas, 2001].
A magnitude de radioatividade natural das rochas depende do teor de tres
elementos: uranio, torio e do isotopo radioativo do potassio (K
4 0). A importancia
destes elementos deve-se a relativa abundancia litologica, em relacao a outros
elementos radioativos, e tambem as suas meias-vidas elevadas, se aproximando a
idade da Terra.
De acordo com Thomas [2001], as rochas sedimentares podem ser divididas, de
acordo com sua radioatividade natural, em tres grandes grupos:
- Rochas altamente radioativas - folhelhos de aguas profundas, folhelhos pretos
betuminosos, evaporitos potassicos e algumas rochas igneas e metamorficas;
- Rochas medianamente radioativas - folhelhos e arenitos argilosos de aguas rasas,
carbonatos e dolomitos argilosos;
- Rochas de baixa radioatividade - grande maioria de arenitos, carvoes e evaporitos
nao potassicos (halita, anidrita, gipsita).
1.2.1.3 - P R O P R I E D A D E S A C U S T I C A S
Dois tipos importantes de m e c a n i s m o s d e t r a n s p o r t e de energia s a o s u p o r t a d o s pelo m e i o elastico: o n d a s c o m p r e s s i o n a i s (onda P) e cisalhantes (onda S). A Figura 1 a p r e s e n t a uma explicacao e s q u e m a t i c a para estes tipos de o n d a .
ONDAS P
Compressao
Meio nao perturbado
Diregao das ondas
ONDAS S
\
O u p l a a m p l i t u d e C o m p r i m e n t o d a o n d aMeio nao perturbado
Diregao das ondas
Figura 1 - M o v i m e n t o e direcao das o n d a s P e S ( a d a p t a d o de http://www.apolo11 . c o m / t e r r e m o t o s _ w a v e . p h p ) .
A v e l o c i d a d e de p r o p a g a c a o d o s o m d e p e n d e d o m e i o e m q u e viajam a s o n d a s elasticas, s e n d o muito m a i s rapido nos solidos que nos fluidos. Portanto, a v e l o c i d a d e d e p r o p a g a c a o d a onda d e p e n d e do material (mineralogia), da s e p a r a c a o entre o s c o m p o n e n t e s solidos (geometria porosa) e d a concentragao dos
c o m p o n e n t e s fluidos (saturacao). Desta forma, o t e m p o q u e o s o m leva para percorrer u m d e t e r m i n a d o e s p a c o de u m material p o d e ser u s a d o para d e t e r m i n a c a o d a s c o n s t a n t e s elasticas deste material e analise quantitativa d a porosidade. A T a b e l a 2 a p r e s e n t a as velocidades tfpicas d a o n d a c o m p r e s s i o n a l para diversos materials geologicos.
T a b e l a 2 - V e l o c i d a d e s d a o n d a P tipicas para diversos tipos de rocha.
V e l o c i d a d e ( m / s )
P r o v a v e l tipo d e r o c h a
< 4 0 0 Solos, depositos superficiais de s e d i m e n t o s nao c o n s o l i d a d o s .
4 0 0 - 1400 A r g i l a s e areias, nao consolidados.
1 4 0 0 - 1 8 0 0 A r e i a s saturadas, argilas c o m p a c t a d a s , rochas b a s t a n t e alteradas.
1 8 0 0 - 2 4 0 0
S e d i m e n t o s c o n s o l i d a d o s e p r o v a v e l m e n t e s a t u r a d o s , r o c h a s m e t a m o r f i c a s o u igneas, altamente f r a t u r a d a s e/ou alteradas, arenitos e folhelhos.
2 4 0 0 - 3 7 0 0 Folhelhos, arenitos, r o c h a s igneas e m e t a m o r f i c a s alteradas e / o u fraturadas.
3 7 0 0 - 4 5 0 0 R o c h a s igneas e m e t a m o r f i c a s f r a c a m e n t e a l t e r a d a s ou f r a t u r a d a s , carbonatos.
4 5 0 0 - 6 0 0 0 R o c h a s igneas e m e t a m o r f i c a s sas, nao fraturadas.
Existem varios tipos de perfis utilizados para as mais diversas aplicagoes, t o d o s c o m o objetivo d e avaliar m e l h o r as f o r m a c o e s g e o l o g i c a s q u a n t o a ocorrencia de u m a jazida comercial de hidrocarbonetos. Os perfis m a i s c o m u n s sao: Potencial
1.2.2 - P E R F I S U T I L I Z A D O S N E S T E T R A B A L H O
1.2.2.1 - R A I O S G A M A ( G R )
Este perfil permite detectar e avaliar a radioatividade natural d a f o r m a c a o geologica. O principal p a r a m e t r o de m e d i c a o e a amplitude d e u m pulso radioativo o r i u n d o das rochas, s e n d o f u n c a o d a energia d o foton que e c a p t u r a d o no detector. A intensidade, o u q u a n t i d a d e d a radiacao, esta relacionada c o m o n u m e r o de f o t o n s d e t e c t a d o s por u n i d a d e de t e m p o . Este m e t o d o c o m e c o u a ser utilizado no final d o s a n o s 30, s e n d o o primeiro perfil de pogo nao r e s i s t i v e N e s s a e p o c a , foi utilizado para distinguir f o r m a c o e s argilosas de f o r m a c o e s c o m p o u c a argila (limpas).
Utilizado na identificacao d a litologia, identificagao de minerais radioativos e para o calculo do v o l u m e d e argilas o u argilosidade. T a m b e m p o d e ser util para interpretagao de a m b i e n t e s d e p o s i c i o n a i s e na investigagao d a subida do contato o l e o - a g u a e m reservatorios fraturados.
1.2.2.2 - N E U T R O N I C O ( N P H I )
S e n d o o s neutrons particulas destituidas de carga eletrica, p o d e m penetrar p r o f u n d a m e n t e na materia, atingindo o s nucleos d o s e l e m e n t o s q u e c o m p o e m a rocha, o n d e interagem atraves de c h o q u e s elasticos e/ou inelasticos. O s perfis mais a n t i g o s m e d e m a q u a n t i d a d e de raios g a m a d e c a p t u r a a p o s excitagao artificial a t r a v e s de b o m b a r d e i o dirigido de n e u t r o n s rapidos. O s m a i s m o d e r n o s m e d e m a q u a n t i d a d e de neutrons epitermais e/ou termais d a rocha a p o s o b o m b a r d e i o .
E utilizado para estimativa de porosidade, d e t e r m i n a g a o do volume de argila, pode auxiliar n a identificacao d a litologia e d o s fluidos d a f o r m a g a o e na detecgao de h i d r o c a r b o n e t o s leves ou gas.
1.2.2.3 - I N D U Q A O (ILD)
F o r n e c e leitura a p r o x i m a d a da resistividade, atraves d a m e d i c a o de c a m p o s eletricos e m a g n e t i c o s induzidos nas rochas. A resistividade e a p r o p r i e d a d e da rocha permitir ou nao a p a s s a g e m d a corrente eletrica. A f e r r a m e n t a de inducao foi d e s e n v o l v i d a para ler m e d i d a s de resistividades p r o f u n d a s na f o r m a c a o c o m o m i n i m o de distorcao p r o v o c a d a pela z o n a invadida.
A f e r r a m e n t a possui uma o u mais b o b i n a s transmissoras c o m c o r r e n t e alternada que e u s a d a para energizar a s r o c h a s a d j a c e n t e s ao pogo. A maior parte desta corrente e f o c a l i z a d a atraves do pogo, o que a faz penetrar p r o f u n d a m e n t e na f o r m a c a o . Desta forma, a s v o l t a g e n s induzidas nas b o b i n a s receptoras e s t i m a m a c o n d u t i v i d a d e d a formagao [ D o v e t o n , 1986].
E u m perfil muito utilizado na industria petrolffera por ser u m m e t o d o muito eficiente para indicar o contato a g u a - o l e o d e v i d o ao contraste muito e l e v a d o de valores destes fluidos [ T h o m a s , 2 0 0 1 ] .
1 . 2 . 2 . 4 - S O N I C O ( D T )
C o n h e c i d o t a m b e m c o m o perfil acustico m e d e a diferenga nos t e m p o s de transito de u m a o n d a m e c a n i c a a t r a v e s d a s rochas. E utilizado para estimativa de porosidade, identificagao de litologia, correlagao pogo a pogo, estimativas d o grau d e c o m p a c t a g a o d a s rochas, estimativa d a s c o n s t a n t e s elasticas, detecgao d e fraturas e a p o i o a s i s m i c a . Diferentemente d a m e d i d a d e resistividade, que p o d e ser u s a d a diretamente na detecgao de petroleo, e d a s m e d i d a s radioativas q u e f o r a m inicialmente v o l t a d a s para determinagao de p o r o s i d a d e , o perfil acustico iniciou c o m o u m m e t o d o c o m p l e m e n t a r para a exploragao sfsmica [ T h o m a s , 2 0 0 1 ] .
Esta f e r r a m e n t a registra o t e m p o decorrido entre o m o m e n t o e m q u e u m pulso s o n o r o c o m p r e s s i o n a l e e m i t i d o por u m transmissor, ate sua c h e g a d a a dois receptores distintos. A T a b e l a 3 a p r e s e n t a os t e m p o s de transito tipicos para alguns materiais.
T a b e l a 3 - T e m p o d e transito caracterlstico de alguns materiais [Doveton, 1986]. Material T e m p o d e transito ( u s / m ) Quartzo 16,8 Calcita 14,5 Dolomita 13,3 Petroleo (media) 72,5 A g u a d o c e 5 6 , 7 1.2.2.5 - D E N S I D A D E ( R H O B )
Este perfil tern a f u n c a o de detectar os raios g a m a defletidos pelos eletrons orbitais d o s e l e m e n t o s c o m p o n e n t e s d a s rochas, a p o s terem sido emitidos por u m a fonte c o l i m a d a situada dentro d o pogo. A l e m da d e n s i d a d e d a s c a m a d a s , p e r m i t e o calculo d a porosidade e a identificacao d a s z o n a s de gas. E utilizado t a m b e m c o m o a p o i o a sfsmica para o calculo do s i s m o g r a m a sintetico.
A f e r r a m e n t a de d e n s i d a d e e f o r m a d a por u m a f o n t e radioativa de raios g a m a , g e r a l m e n t e cesio-137, m o n t a d a e m u m mandril c o m patins metalicos, os quais s a o p r e s s i o n a d o s contra a p a r e d e do pogo, A fonte e r e s p o n s a v e l pela e m i s s a o de raios g a m a de alta energia, que interagem c o m os eletrons d o s a t o m o s d a f o r m a g a o . Esta interagao p o d e ser d e tres m o d o s diferentes: efeito fotoeletrico, efeito C o m p t o n e produgao do par eletron-positron; o n d e a p e n a s o s dois primeiros sao de interesse para a g e o f i s i c a d e pogo.
1.3 - A N A L I S E M U L T I V A R I A D A
A analise multivariada visa e n t e n d e r e d e s c r e v e r a relagao entre u m n u m e r o arbitrario de variaveis. O s geocientistas f r e q u e n t e m e n t e lidam c o m c o n j u n t o s de d a d o s multivariados, tais c o m o propriedades f i s i c a s e q u i m i c a s de minerals e rochas.
Se existem relagoes c o m p l e x a s entre os diferentes parametros, estatisticas univariadas ignoram o c o n t e u d o da informagao d o s d a d o s . U m conjunto de d a d o s multivariados consiste e m m e d i d a s de p variaveis e m n objetos. T a i s conjuntos d e
d a d o s s a o n o r m a l m e n t e a r m a z e n a d o s e m arranjos matriciais do tipo n-por-m [Trauth, 2006], X = r * i i * i 2 * l m * 2 1 * 2 2 * 2 m - * n l - * - n 2 * n mJ (2)
O n d e a s c o l u n a s d a matriz r e p r e s e n t a m as variaveis m, e as linhas r e p r e s e n t a m os n objetos.
A analise multivariada e u s a d a para descrever n u m e r o s a s o b s e r v a g o e s ou variaveis q u e sao obtidas para c a d a indivfduo o u u n i d a d e e s t u d a d a . Descobrir a s inter-relagoes c o m p l e x a s entre diversas m e d i d a s no m e s m o indivfduo ou unidade, e fazer a interpretagao d e s s e s resultados e o papel p r e d o m i n a t e d a analise multivariada. Q u a n d o algo e estimado, na realidade e realizado u m m o d e l a m e n t o n u m e r i c o do q u e sera medido, s e g u i n d o a l g u m a regra para atribuir u m n u m e r o a caracterfstica particular q u e esta s e n d o e s t i m a d a .
O s algoritmos mais c o m u m e n t e u s a d o s para este m o d e l a m e n t o s a o classificados e m d u a s categorias gerais: (1) hierarquica e (2) n a o hierarquica
O s p r o c e d i m e n t o s hierarquicos e n v o l v e m a c o n s t r u g a o d e u m a hierarquia de u m a estrutura d o tipo arvore t e n d o c o m o caracterfstica que os resultados de u m estagio anterior sao s e m p r e a n i n h a d o s c o m os resultados de u m e s t a g i o posterior, criando ramificagoes parecidas c o m u m a arvore ( d e n d r o g r a m a ) .
D e n t r e os algoritmos hierarquicos os mais populares u s a d o s para d e s e n v o l v e r a g r e g a d o s sao (1) ligagao individual, (2) ligagao media, (3) ligagao c o m p l e t a , (4) m e t o d o de W a r d e (5) m e t o d o do centroide. E s s e s algoritmos d i f e r e m na f o r m a c o m o a distancia entre os a g r u p a m e n t o s e c o m p u t a d a .
O p r o c e d i m e n t o d e ligagao individual e b a s e a d o e m distancia m i n i m a . A tecnica de a g r u p a m e n t o hierarquico interliga as a m o s t r a s por s u a s similaridades, produzindo u m d e n d r o g r a m a o n d e a s a m o s t r a s s e m e l h a n t e s , s e g u n d o as variaveis escolhidas, s a o a g r u p a d a s entre si. A suposigao basica de sua interpretagao e q u e q u a n t o menor a distancia entre os pontos q u e r e p r e s e n t a m as a m o s t r a s no espago das
variaveis, maior a s e m e l h a n c a entre estas amostras. Desta maneira dois objetos s e p a r a d o s pela menor distancia sao colocados no primeiro a g r u p a m e n t o . Em seguida a proxima distancia m a i s curta e d e t e r m i n a d a , e u m terceiro objeto se junta a o s dois primeiros para formar u m a g r e g a d o , o u u m n o v o a g r u p a m e n t o de dois m e m b r o s e f o r m a d o . O p r o c e s s o continua ate q u e todos os objetos f o r m e m u m so a g r e g a d o . Esse p r o c e d i m e n t o t a m b e m e c h a m a d o de a b o r d a g e m o u classificacao d o vizinho m a i s proximo ( K N N ) .
A classificacao utilizando a regra do vizinho mais proximo (K-Nearest Neighbors) e b a s e a d a na c o m p a r a c a o da distancia entre a m o s t r a s , p a r a isto e calculada uma matriz n-dimensional entre t o d a s a s a m o s t r a s no conjunto de d a d o s , o n d e n e o n u m e r o d e variaveis nos d a d o s m e d i d o s . N u m a v e r s a o mais simples, K N N consiste na classificacao de u m a amostra junto c o m o vizinho m a i s proximo, dentro de u m n u m e r o de classes pre-definidas. A classe predita de u m a a m o s t r a teste e e n t a o d e t e r m i n a d a b a s e a d a na identidade d a q u e l a s a m o s t r a s m a i s proximas d a a m o s t r a d e s c o n h e c i d a .
O algoritmo K N N e u m a tecnica iterativa bastante simples q u e permite a g r u p a r e l e m e n t o s por analogia. Em u m conjunto de treino constituido por vetores n-d i m e n s i o n a i s , o algoritmo K N N procura os k e l e m e n t o s mais proximos no g r u p o n-de treino. D e s t e s k vizinhos, a classe de maior ocorrencia e n o r m a l m e n t e utilizada para classificar o n o v o elemento. C o n t u d o , e m a l g u m a s classificacoes especfficas, poder-se-a escolher o u t r a s relacoes entre estes k vizinhos para decidir qual a classificacao do n o v o elemento. P o d e m ser utilizadas diversas distancias metricas c o m o m e t o d o de similaridade: euclidiana, M a h a l a n o b i s c o m p l e t a o u M a h a l a n o b i s diagonal. Neste trabalho e utilizada a distancia Euclidiana que m e d e a e x t e n s a o g e o m e t r i c a entre d o i s e l e m e n t o s e m u m espago multidimensional.
d 0 il ff i2) = y/IUO^O - h2(i)\)2 <3)
O n d e :
h i e o valor do primeiro e l e m e n t o ; h2e o valor do s e g u n d o elemento.
O maior p r o b l e m a se verifica na correta escolha do valor de q u a n t o s vizinhos d e v e m ter similaridade p a r a determinar o valor do proximo e l e m e n t o ( k ) . U m a regra geral
para e s s e valor sera de considerar k = ( m )1 / 2, o n d e m e o n u m e r o de e l e m e n t o s
c o n s i d e r a d o s n a matriz de treinamento. T e o r i c a m e n t e k d e v e r a ser tao g r a n d e q u a n t o possfvel de m o d o a minimizar o erro, mas a m e d i d a q u e se a u m e n t a o valor de k, a u m e n t a - s e o t e m p o c o m p u t a c i o n a l e p e r d e - s e resolucao devido a s u a v i z a c a o e x c e s s i v a . Se for c o n s i d e r a d o u m valor de k p e q u e n o , a p e n a s serao c o n s i d e r a d o s os e l e m e n t o s muito proximos. [Almeida et al.,2008]
Figura 2 - Classificacao de u m n o v o e l e m e n t o a d a p t a d o d e A l m e i d a et al.,2008.
1.3.1 - M e d i d a s d e similaridade
1.3.1.1 - M e t o d o d a ligagao c o m p l e t a
O p r o c e d i m e n t o de ligagao c o m p l e t a e s e m e l h a n t e ao d a ligagao individual, exceto e m q u e o criterio de a g r u p a m e n t o se b a s e i a e m distancia m a x i m a , s e n d o u m a d a s tecnicas de hierarquizagao aglomerativa d e maior aplicagao na analise de a g r u p a m e n t o [ G a m a , 1980]. C o m o no m e t o d o de ligagao individual, aqui t a m b e m n a o e exigida a fixagao, a priori, do n u m e r o de a g r u p a m e n t o s .
C o n f o r m e B u s s a b et a l . [1990], a g r u p a m e n t o s sao c o n e c t a d o s u m c o m o outro a distancia m a x i m a o u similaridade m i n i m a no m e t o d o d a ligagao completa, t a m b e m d e n o m i n a d o vizinho mais distante. A dissimilaridade entre dois grupos e definida c o m o s e n d o a q u e l a a p r e s e n t a d a pelos individuos de c a d a g r u p o q u e m a i s se p a r e c e m , o u seja, f o r m a m - s e t o d o s os pares c o m u m m e m b r o de c a d a g r u p o , e a dissimilaridade entre os g r u p o s e definida p e l o par q u e m a i s se parece. Este metodo, g e r a l m e n t e , leva a g r u p o s c o m p a c t o s e discretos, t e n d o os s e u s valores d e dissimilaridade relativamente grandes.
1.3.1.2 - M e t o d o da ligagao media
O m e t o d o d e ligacao m e d i a c o m e c a d a maneira similar a ligacao individual o u c o m p l e t a [Hair et al., 2 0 0 5 ] , diferenciando-se na maneira d e formar os a g r u p a m e n t o s que sao feitos a partir d a distancia m e d i a d e t o d o s o s e l e m e n t o s e m u m a g r u p a m e n t o aos d e m a i s e m outro. Essa tecnica n a o d e p e n d e d e valores extremos, c o m o o c o r r e c o m a ligacao individual o u c o m p l e t a , e a selegao b a s e a d a e m t o d o s os e l e m e n t o s d o s a g r e g a d o s , a o inves d e um unico par d e m e m b r o s e x t r e m o s . A b o r d a g e n s d e ligacao m e d i a t e n d e m a c o m b i n a r a g r e g a d o s c o m p e q u e n a variacao interna. Elas t a m b e m t e n d e m a produzir a g r e g a d o s c o m a p r o x i m a d a m e n t e a m e s m a variancia.
1.3.1.3 - M e t o d o d o centroide
O m e t o d o d o centroide foi p r o p o s t o por Sokal & M i c h e n e r [1958] e t e v e c o m o o r i g e m a caracterizagao da matriz d e d a d o s c o m o p o n t o s d o e s p a c o M a h a l a n o b i s . C a d a a g r u p a m e n t o e c o n s i d e r a d o u m s i m p l e s ponto, r e p r e s e n t a d o pelo s e u centro d e m a s s a , c h a m a d o centroide. O p r e s e n t e m e t o d o utiliza u m a f u n c a o d e a g r u p a m e n t o p a r a medir a distancia entre os centros d e m a s s a d o s d a d o s . Esta tecnica e d e hierarquizagao aglomerativa.
Este algoritmo se caracteriza pela redefinigao, a c a d a passo, d a matriz d e dados. C a d a a g r u p a m e n t o e r e p r e s e n t a d o pelo vetor m e d i o d a s p variaveis envolvidas. Na realidade, u m a n o v a matriz d e distancias e d e t e r m i n a d a a cada interagao.
No m e t o d o do centroide, a distancia entre dois g r u p o s e definida c o m o a distancia entre os seus centroides, pontos definidos pelas m e d i a s das variaveis c a r a c t e r i z a d o r a s d o s individuos d e cada grupo, isto e, o m e t o d o d o centroide calcula a distancia entre dois g r u p o s c o m o a diferenga entre as s u a s medias, para t o d a s as variaveis. U m a d e s v a n t a g e m d e s s e m e t o d o e q u e se dois g r u p o s f o r e m muito diferentes e m t e r m o s d e d i m e n s a o , o c e n t r o i d e d e u m n o v o a g r u p a m e n t o estara, mais p r o x i m o d a q u e l e q u e for maior e as caracteristicas d o grupo m e n o r t e n d e r a o a se perder. De fato, c o m e s s e m e t o d o , o centroide d e u m n o v o g r u p o e uma c o m b i n a g a o p o n d e r a d a d o s centroides dos dois g r u p o s s e p a r a d o s , s e n d o a s p o n d e r a g o e s proporcionais a o t a m a n h o d e s t e s g r u p o s [Reis, 1997].
1 . 3 . 1 . 4 - M e t o d o de W a r d
W a r d [1963] p r o p o e u m p r o c e s s o geral de classificacao e m q u e n e l e m e n t o s s a o p r o g r e s s i v a m e n t e reunidos dentro de g r u p o s atraves d a minimizagao de uma f u n c a o objetiva para c a d a (n - 2) p a s s o s de f u s a o .
Inicialmente, este algoritmo a d m i t e q u e c a d a u m dos e l e m e n t o s se constitui e m u m unico a g r u p a m e n t o . C o n s i d e r a n d o a primeira reuniao de e l e m e n t o s e m u m n o v o a g r u p a m e n t o , a s o m a d o s d e s v i o s d o s pontos representatives de s e u s elementos, e m relacao a m e d i a d o a g r u p a m e n t o , e calculada, e da u m a indicagao de h o m o g e n e i d a d e do a g r u p a m e n t o f o r m a d o . Esta m e d i d a f o r n e c e a "perda de informacao" q u e se p r o d u z ao reunir o s e l e m e n t o s e m u m a g r u p a m e n t o [ G a m a , 1980].
C A P ITU LO II
2.1 - D A D O S E P R O G R A M A S U T I L I Z A D O S
2.1.1 - Dados utilizados
Neste trabalho foram utilizados d a d o s de perfilagem g e o f i s i c a de 12 pocos de petroleo do C a m p o de N a m o r a d o , situado na parte central da Bacia de C a m p o s , litoral do estado do Rio de Janeiro, localizado a 7 0 km da costa. O s p o c o s cujos d a d o s sao utilizados n e s t e trabalho estao localizados c o n f o r m e a p r e s e n t a d o no m a p a d a Figura 3.
Figura 3 - M a p a d e localizacao d o s p o c o s do C a m p o de N a m o r a d o , utilizados n e s t e estudo ( A d a p t a d o de Rosa et at., 2 0 0 8 ) .
A T a b e l a 4 a p r e s e n t a a s u i t e d e perfis g e o f i s i c o s d i s p o n i v e i s e m c a d a pogo analisado. O s d a d o s f o r a m f o r n e c i d o s pela A N P ( A g e n d a Nacional de Petroleo) para u s o a c a d e m i c o pelas instituigoes de pesquisa nacionais.
T a b e l a 4 - Perfis geoflsicos disponfveis e utilizados neste trabalho. \PERFIL D T GR ILD N P H I R H O B N A 0 1 N A 0 2 N A 0 4 S </ N A 0 5 A N A 0 7 V N A 1 1 N A 1 2 H s N A 1 7 N A 2 1 R J S 0 1 9 R J S 0 4 2 s s R J S 2 3 4
2.1.2 - P r o g r a m a SAS Enterprise Guide®
Este foi o p r o g r a m a utilizado para a analise estatistica d o s d a d o s . T r a t a - s e de uma interface amigavel para utilizacao do p a c o t e SAS® (Statistical Anaiisys Software) s e m a n e c e s s i d a d e de c o n h e c i m e n t o d a linguagem de p r o g r a m a c a o S A S . Este p r o g r a m a permite a incorporacao de plugins d e s e n v o l v i d o s pelo usuario. Neste trabalho foi utilizado o plugin "Discrim Petrobras", anteriormente d e s e n v o l v i d o [Soares, 2 0 0 5 ] . 0 plugin tern a f i n a l i d a d e de c h a r u m a interface amigavel para o usuario, d i s p e n s a n d o - o de c o n h e c e r a l i n g u a g e m de p r o g r a m a c a o SAS®.
A Figura 4 a p r e s e n t a a tela inicial c o m o s d a d o s d o conjunto d e t r e i n a m e n t o para definigao d a regra discriminante pelo m e t o d o K N N , atraves d o p r o g r a m a SAS
Enterprise Guide®. Nesta figura o b s e r v a - s e a incorporagao d o s plugins definidos
pelo usuario n a a b a Analysis / Custom / Fungao Discrim Petrobras.
SpM Column SurtCdumnt Tr»Aipew •to* Out. MOM t' ya»i MEM I 11 1171 MMTT IJIWU i I K I 2 JJ* .-4717 7<«7) H U M man » W 7«11« : i s » 2»nei| itm 61 I K
Figura 4 - T e l a d e d a d o s d o p r o g r a m a S>AS Enterprise Guide® c o m o plugin da F u n g a o Discriminante e m d e s t a q u e .
A Figura 5 a p r e s e n t a a tela d o p r o g r a m a SAS Enterprise Guide referente a selegao d a s variaveis d e analise e classificacao. N o e x e m p l o m o s t r a d o nesta figura, o perfil s o n i c o (variavel D T ) foi utilizado c o m o a variavel a ser e s t i m a d a a partir d o s d e m a i s perfis geofisicos disponiveis.
ft Analise Discriminante
Colunas | Seleoonar Regra | FuncSo Ducm-nanfe | Vanavee de O a s s t e a c i o | Resutados| TiMos|
Columns to assign Column ides: Name • DEPTBM • OT • GR • ILO • NPHI • RHOB • INTO. ±1 • Analysis variables • GR • ILO • NPHI • RHOB 4 5 Classrficahon variables a • OK Cancel
Figura 5- T e l a d o SAS Enterprise Guide® para s e l e c a o d o perfil a estimar a partir dos perfis d e analise.
A j a n e l a d o programa SAS Enterprise Guide , a p r e s e n t a d a na Figura 6, permite realizar a escolha do m e t o d o estatistico a ser e m p r e g a d o na estimativa d o perfil faltante. No caso d a e s c o l h a d o m e t o d o K N N , o s p a r a m e t r o s definidos pelo usuario s a o o valor d e K ( n u m e r o d e vizinhos no e s p a c o n-dimensional) e o tipo d e metrica utilizada para determinagao d a s distancias entre as n a m o s t r a s no e s p a c o investigado.
G Analise Discriminante
Colunas SeleaonaiRegia | FuncaoDrscrmnante | VariaveisdeOassrtcacSo| Resu»ados| T i h i o s | Regra
r L«near
C Quadratrca
C Teste de igualdade das matnzes de covanancias (regra linear ou quadrabca)
C KNN K - M « ^ * | E u c W e a n a ~7\ C Canonica N! de variaveis canomcas fo (cfevese^-n'devariaveKoriginais) r Linear passo a passo
r Opcoes da regra Linear Passo a Pa:so (PROC
STEFOISC)-G Stepwise Opcoes Stepwise IS p.entrar- |0.15 p_permanecei - jo 15 C R2_enlrar = R2_permanecer i r Forward Opcoes Forward p_entrai» JO 15 r R2_entrar = r Backward Opcoes Backward 15 p_permanecer» |o 15 r R2_permanece« «| OK Cancel
Figura 6 - T e l a d o SAS Enterprise Guide® p a r a s e l e c a o d o m e t o d o estatfstico de analise.
A Figura 7 a p r e s e n t a a tela do p r o g r a m a SAS Enterprise Guide , o n d e o usuario tern a possibilidade de adotar diversas o p c o e s relacionadas a i m p l e m e n t a c a o d a f u n c a o discriminante e do p a d r a o de probabilidades a priori, p a r a a ocorrencia de u m a d a d a classificacao. A e s c o l h a d a o p c a o de probabilidades iguais significa que se c o n s i d e r a o evento c o m o aleatorio, o u seja, a probabilidade de ocorrencia de u m d a d o valor e, a priori, a m e s m a q u e q u a l q u e r outro valor.
O Analise Discriminante
Colunas | Setecionai Reoja . Funcao Discriminantej| Variaveis de Classificacao | Resultados | Titulos
Opcoes da Funcao Discriminante
r OassJicacao da valdacao ciuzada
| 7 Resu'Jados da classificacao da va'idacao ciusada
r ResurJados da classificacao da re-substrtuicao
f" E stimativa da taxa de eiro de piobabilidade posterior
r- Estatistica univanada paia testai que as medias das classes sao iguats na popUacao
>- Estatistica muhvanada paia leslai que as mectas das classes sao iguais na popUacao
OK Cancel
Figura 7 - Tela do SAS Enterprise Guide para definicao d o s p a r a m e t r o s d a f u n c a o discriminante.
Para gerar u m d a d o perfil geofisico faltante, c o m b a s e nas propriedades ffsicas registradas nos d e m a i s perfis de u m poco, e preciso definir qual o arquivo q u e c o n t e m os d a d o s para classificacao (perfis disponiveis), c o m o t a m b e m o arquivo de s a i d a , o qual d e v e conter u m a c o l u n a com os v a l o r e s e s t i m a d o s para o perfil faltante. A Figura 8 a p r e s e n t a a tela do p r o g r a m a SAS Enterprise Guide® q u e permite ao usuario a definicao d e s t e s parametros.
Colunas | Seleoonar Regia | Funcao Discimnarte Variaveis de Clasahcacao | Resutados | Titutosj
Inckn dados de classificacao ISASUSER NA01A
v Cnar tabela de saida paia comer classJicacoes |SASUSERNA01DTJ0P_OUT " r5ll
r~ Diai labela de saida para comei estmativas de densidade paia dados de leste SASUSER
OK Cancel
Figura 8 - Tela do SAS Enterprise Guide® p a r a incluir os d a d o s de classificacao e gerar arquivo c o m os d a d o s de s a i d a ( d a d o s e s t i m a d o s ) .
A Figura 9 apresenta o arquivo c o m a coluna " _ I N T O _ " , a qual c o n t e m o s valores e s t i m a d o s p a r a o perfil faltante. N o e x e m p l o a p r e s e n t a d o nesta figura, a c o l u n a " _ I N T O _ " procura reproduzir o s valores da c u r v a DT. O b s e r v a - s e n e s t a figura a p r o x i m i d a d e d o s valores entre a coluna de d a d o s r e a l m e n t e m e d i d a (coluna DT) e a c o l u n a e s t i m a d a c o n s i d e r a n d o - s e a a u s e n c i a do perfil D T (coluna _ I N T O _ ) .
naOla.dt.lOplOO (read-only) « D E P T H A G« © • RMOS o • : 2 9 5 2 * 2952 6 95 4766 94 £945 74 275 7£ 6592 1.1445 1.1443 7245 25 7245 2 4929 2 448 52 0547 87 9492 •: 2552 3 2953 92 9727 9 1 8 2 8 1 30 0625 £1 0251 1 1831 1 2465 25 7617 260015 2 4 3 5 5 2 4 1 1 9 87 9492 £7 9492 c 2 9 5 3 2 91.0703 £1 £202 1 2105 25 3672 2 4 1 7 6 £7 5492 e 2552 4 50 0556 £2 1836 I 2556 25 7031 2 4678 92 .Hi 7 2552 6 £5 €602 £2 6514 1 4052 26 5022 2 4412 100 5276 S 2952 c £5 1252 £2 2656 1 4655 2 5 9 5 3 1 2 4116 92 U4« • 2554 £7 9492 75 0586 1 5227 24 082 2 4 7 7 5 87 9492 • : 255-i 2 £5 5702 7£ 6526 1573 24 2425 2 5 2 0 6 87 9492 2554 4 £7 6211 £1 5766 1602 24 £552 2 522 92 •445 •: 2554 6 £5 2672 £4 £75 16511 2 3 9 4 5 3 2 5 1 9 3 52 1445 13 2554 £ £4 1522 £5 5275 17231 230938 2 4561 £i 8584 •- 2955 £4 1426 £7 2555 1782 22 2£91 2 4372 81 £424 2 9 5 5 2 £4 7252 £7 £22 1 5055 21 2594 2 4 8 6 4 £25625 2555 4 £5 9344 £5 2711 18014 21 1034 2 4 8 3 6 89 9375 17 18 295 5 6 2955 2 ££4102 8 9 8 0 4 7 | £2 550£ £4 5275 17815 1 7526 21 3066 21 £477 2 4863 2 4 8 1 8 92 I44« 92 ' 4 4 ! IS 20 2956 2956 2 £7 66 02 £5 707 £5 4"5£ 52 1757 1 7509 1 7665 : : 3122 21 665 2 4 9 7 8 2 5017 S3 5625 £2 5625 21 2556 4 £5 2262 55 4766 17705 20 2461 2 4971 83 5625 : : 2956 6 £6 £7£9 9 6 0 1 9 5 1 741£ 19 5477 2 5 2 7 1 i: 5625 : : 2956 8 ££7461 52 1£75 16546 19 6641 2 5404 83 5625 2957 2957 2 92 5625 94 6172 87 S £4 4452 1 6245 1 5501 19 5215 21 5664 25149 25181 82 5625 52 1445 26 2 5 5 7 * 2557 -: 912205 50 065 7 £6 £125 51 1757 1 5545 1 5126 2 3 0 5 4 7 22 457 2 52? 2 5 5- 2 31 £524 83 562S
Figura 9 - Tela do SAS Enterprise Guide c o m o arquivo de s a i d a , o qual inclui a coluna c o m o perfil faltante e s t i m a d o (coluna e m d e s t a q u e ) .
2.2 - M E T O D O L O G I A
Para montar a b a s e de d a d o s d e s t e trabalho f o r a m escolhidos os 12 pocos d o C a m p o de N a m o r a d o citados anteriormente, e as variaveis utilizadas f o r a m t o d o s os perfis d i s p o n i v e i s (DT, GR, ILD, N P H I e R H O B ) . O criterio a d o t a d o para a e s c o l h a d o s pogos foi o de incluir a p e n a s os pogos verticais, e x c l u i d o os direcionais, o s quais p r e c i s a m ser interpretados de f o r m a nao c o n v e n c i o n a l , e por isso f o r a m e x c l u f d o s d a b a s e de d a d o s d e s t e trabalho.
Inicialmente foi feita a c o n c a t e n a g a o d o s perfis de t o d o s os pogos e m u m unico arquivo, totalizando a p r o x i m a d a m e n t e o n z e mil registros. Esta f u s a o foi realizada c o m o objetivo de permitir q u e o p r o c e s s o de a m o s t r a g e m aleatoria, para fins d e geragao d o conjunto de d a d o s de t r e i n a m e n t o , tenha a possibilidade de escolher a m o s t r a s representatives de todas a s f o r m a g o e s g e o l o g i c a s q u e o c o r r e m e m q u a i s q u e r d o s pogos analisados. A falta d a s caracteristicas representatives de u m a f o r m a g a o no conjunto de d a d o s de t r e i n a m e n t o p o d e induzir a regra discriminante a nao ser c a p a z d e r e c o n h e c e r tal valor daquela propriedade d u r a n t e a f a s e de estimagao. Deste m o d o , a a m o s t r a g e m realizada s o b r e u m arquivo q u e c o n t e m os perfis de t o d o s os pogos minimiza e s s a possibilidade, reduzindo o v i c i o d a amostra. Neste trabalho u m a a m o s t r a e e n t e n d i d a c o m s e n d o o conjunto de v a l o r e s d o s varios perfis geoffsicos n u m a d a d a profundidade de u m pogo.
Posteriormente, utilizando o p r o g r a m a SAS Enterprise Guide® f o r a m feitas a m o s t r a g e n s aleatorias, sobre o arquivo c o n c a t e n a d o , n a s proporgoes de 1 0 % , 2 0 % , 3 0 % e 5 0 % , c o m o objetivo d e avaliar o efeito do t a m a n h o d a a m o s t r a de t r e i n a m e n t o s o b r e a eficiencia d a estimativa de perfis faltantes. Na realidade, neste trabalho nao ha perfis faltantes (exceto a curva DT d o pogo NA-12), m a s e s s a situagao foi s i m u l a d a para t o d o s o s perfis de t o d o s os pogos, excluindo a c a d a s i m u l a g a o u m d e t e r m i n a d o perfil d a base de d a d o s e utilizando os d e m a i s perfis c o m o d a d o d e e n t r a d a para a estimagao d a q u e l e perfil "faltante". A p o s c a d a simulagao, a eficiencia d e s t e p r o c e s s o e m e d i d a atraves do calculo d a diferenga R M S (Root Mean Square) entre o perfil real e o simulado. F o r a m t a m b e m g e r a d o s graficos p a r a c o m p a r a g a o visual entre os perfis reais e s i m u l a d o s para c a d a u m d o s pogos analisados.
UITRMS - ^ — (4)
A Figura 10 a p r e s e n t a o f l u x o g r a m a q u e d e s c r e v e o m e t o d o utilizado para a o b t e n c a o d o s conjuntos d e d a d o s d e t r e i n a m e n t o utilizados n e s t e trabalho; e n q u a n t o q u e a Figura 11 exibe o f l u x o g r a m a referente a o p r o c e s s o d e g e r a c a o e aplicagao d a s regras d i s c h m i n a n t e s para a estimagao d o s perfis "faltantes", analise d a eficiencia d a s estimativas e visualizacao grafica d o s resultados.
10% de todos os dados
Arquivo concatenado com os perfis de todos os pogos
Amostragem aleatoria para geracao dos dados de treinamento
20% de todos os dados 30% de todos os dados 50% de todos os dados
Figura 10 - F l u x o g r a m a para o b t e n c a o d o s conjuntos d e d a d o s d e treinamento.
Conjunto de dados de treinamento
i 1
Geracao das regras KNN para cada perfil
Aplicacao das regras para cada poco
1
Perfis estimados
— • Calculo da diferenca
oara cada DOCO RMS
1 1
Visualizacao grafica
Figura 11 - Fluxograma p a r a a p l i c a c a o d a s regras d i s c h m i n a n t e s e estimagao d o s perfis faltantes.
Neste trabalho, para a i m p l e m e n t a c a o d a regra K N N , foi utilizado K = 1 . E m b o r a para valores de K muito p e q u e n o s e s s a tecnica t e n d a a produzir resultados ruidosos, para a aplicagao especifica d a tecnica e m perfis g e o f i s i c o s d e pogos e s s a caracterfstica fica bastante a t e n u a d a pelo fato d e se dispor de c o n j u n t o de d a d o s c o m e l e v a d o n u m e r o de a m o s t r a s . Por outro lado, a adogao de u m valor e l e v a d o para K induziria a suavizagao e x c e s s i v a n o s resultados, a l e m d e a u m e n t a r c o n s i d e r a v e l m e n t e o c u s t o c o m p u t a c i o n a l .
C A P I T U L O
3.1 - R E S U L T A D O S
O s resultados d e s t a dissertagao estao o r g a n i z a d o s por tipo de perfil e por pogo.
3.1.1 - Perfil S o n i c o (DT)
NA01 DT 10% (us/ft) NA01 DT 20%(us/ft) NA01 DT30%(us/ft) NA01 DT50%(us/tt)
40 60 80 100 120 40 60 80 100 12040 60 80 100 12040 60 80 100 120 2950 3000 3050 3100 3150 3200 J D i fR M S= 7 , l DifR Ms=6,9 DifR Ms = 6,4 DifR Ms = 5,7
Figura 12 - Perfis sonicos do pogo NA-01a: perfil registrado (curva azul) e perfis e s t i m a d o s (curvas v e r m e l h a s ) p a r a d a d o s de t r e i n a m e n t o c o m 1 0 % , 2 0 % , 3 0 % e 5 0 % d o s d a d o s totais, respectivamente.
NA11 a DT 10%(us/ft) NA11a DT 20%(us/ft) NA11 a DT 30%(us/ft) NA11a DT 50%(us/ft) 40 60 80 100 120 40 60 80 100 120 40 60 80 100 12040 60 80 1 0 0 1 2 0
Figura 17 - Perfis sonicos do p o c o NA-11a: perfil registrado (curva azul) e perfis e s t i m a d o s (curvas v e r m e l h a s ) para d a d o s de t r e i n a m e n t o c o m 1 0 % , 2 0 % , 3 0 % e 5 0 % d o s d a d o s totais, respectivamente.
0 perfil DT da Figura 18 a p r e s e n t a o esboco e s p e r a d o para o perfil sonico e que p r o v a v e l m e n t e d e s c r e v e este perfil faltante com boa precisao, e m b o r a n a o se p o s s a quantificar essa precisao, devido a a u s e n c i a d o perfil real. C o m o a precisao e satisfatoria para os d e m a i s pocos, s u p o e - s e que t a m b e m o seja para este.
NA12 DT 10%(us/ft) NA12 DT 20%(us/ft) NA12 DT 30%(us/ft) NA12 DT 50%(us/ft)
40 60 80 100 120 40 60 80 100 120 40 60 80 100 12040 60 80 100 120
2965-, ' ' 1 1 ' ' ' ' 1 ' 1 1 1 ' 1 ' 1 1 ' 1
Figura 18 - Perfis sonicos do pogo NA-12. Neste pogo este perfil real n a o foi registrado, portanto nao se pode estimar a precisao das curvas estimadas. O s perfis a p r e s e n t a d o s s a o os e s t i m a d o s para d a d o s de t r e i n a m e n t o c o m 1 0 % , 2 0 % , 3 0 % e 5 0 % d o s d a d o s totais, respectivamente.
NA21 b DT 10%(us/ft) NA21 b DT 20%(us/ft) NA21 b DT 30%(us/ft) NA21 b DT 50%(us/ft)
40 60 80 100 12040 60 80 100 120 40 60 80 100 12040 60 80 100 120
D i fR M S = 4,1 D i fR M S = 3,6 D i fR M S = 3,3 D i fR M S = 2,8
Figura 2 0 - Perfis s o n i c o s do p o c o N A - 2 1 b : perfil registrado (curva azul) e perfis e s t i m a d o s (curvas v e r m e l h a s ) para d a d o s de t r e i n a m e n t o c o m 1 0 % , 2 0 % , 3 0 % e 5 0 % d o s d a d o s totais, respectivamente.
rjs042 DT 10%(us/ft) rjs042 DT 20%(us/ft) rjs042 DT 30%(us/ft) rjs042 DT 50%(us/ft) 40 60 80 100 120 40 60 80 100 12040 60 80 100 12040 60 80 100 120 3000 i 3050-^ E , tti 9 3100- u-3150H 3200 DifRMs = 7,5 D i fR M S = 7,1 D i fR M S = 6,4 D i fR Ms = 5 , l
Figura 2 2 - Perfis sonicos do pogo RJS-42: perfil registrado (curva azul) e perfis e s t i m a d o s (curvas v e r m e l h a s ) para d a d o s de t r e i n a m e n t o c o m 1 0 % , 2 0 % , 3 0 % e 5 0 % dos d a d o s totais, respectivamente.
rjs234 DT 10%(us/ft) rjs234 DT 20%(us/ft) rjs234 DT 30%(us/ft) rjs234 DT 50%(us/ft) 40 60 80 100 120 40 60 80 100 12040 60 80 100 12040 60 80 1° 0 12 0 3160 3200 g 3240 Q-3280 D i fR M S = 6,3 D i W = 5,9 D i fR M S = 5,6 D i fR M S = 4,9
Figura 2 3 - Perfis sonicos do pogo R J S - 2 3 4 : perfil registrado (curva azul) e perfis e s t i m a d o s (curvas v e r m e l h a s ) p a r a d a d o s de t r e i n a m e n t o c o m 1 0 % , 2 0 % , 3 0 % e 5 0 % d o s d a d o s totais, respectivamente.
2960 A
3000 H
UJ
3040-3080
3120 J
Dif
RMS=16,5 Dif
RMS= 15,l Dif
RMS= 12,7 Dif
RMS= 9,6
Figura 26 - Perfis de raios gama do pogo NA-04: perfil registrado (curva azul) e perfis estimados (curvas vermelhas) para dados de treinamento com 10%, 20%, 30% e 50% dos dados totais, respectivamente.
NA05a GR 10% NA05a GR 20% NA05a GR 3 0 % NA05a GR 50% (API) 0 40 80 120 160 0 40 80 120 160 0 40 80 120 160 0 40 80 120 160
Dif
RMs = 17,2
DifRMs= 15,4 Dif
RMS= 12,9 Dif
RMS= 9,1
Figura 27 - Perfis de raios gama do poco NA-05a: perfil registrado (curva azul) e perfis estimados (curvas vermelhas) para dados de treinamento com 10%, 20%, 30% e 50% dos dados totais, respectivamente.
Figura 28 - Perfis de raios gama do pogo NA-07: perfil registrado (curva azul) e perfis estimados (curvas vermelhas) para dados de treinamento com 10%, 20%, 30% e 50% dos dados totais, respectivamente.
DiUs = 15,1
DifRMS= 13,3
DifRMS= 13,1
D i fR Ms= 11,0
Figura 29 - Perfis de raios gama do poco NA-11: perfil registrado (curva azul) e perfis estimados (curvas vermelhas) para dados de treinamento com 10%, 20%, 30% e 50% dos dados totais, respectivamente.