• Nenhum resultado encontrado

2. REVISÃO DA LITERATURA E FUNDAMENTAÇÃO TEÓRICA

2.9 Determinação do modelo probabilístico

Obter um bom modelo de Inferência Bayesiana requer atenção na escolha de um modelo probabilístico adequado. Fatores como: características dos dados, objetivo da

35 inferência e espaço amostral devem ser observados. Para o caso postulado neste trabalho, o espaço amostral é cada pixel que compõe a imagem; o evento que se quer inferir é a probabilidade de ocorrência de uma classe informacional que se pretende determinar. As características dos dados revelam que para um único pixel, a probabilidade de ocorrência possível é de apenas uma classe de vegetação, eleita entre várias possíveis.

Como a probabilidade de cada pixel é diferente em toda imagem, seu valor não pode ser constante. Por outro lado, a opinião sobre cada classe informacional sobre o evento, é fixa para cada classe e, portanto, não pode ser variável. Tais características são de uma distribuição que considere y sucessos em n tentativas ou falhas, o que define uma distribuição Binomial em função dos parâmetros y e n, do tipo θ ฀ Bin n y

( )

, para os dados. A forma geral da distribuição Binomial é então dada por:

(

,

)

y

(

1

)

n y

p yθ n ∝θ −θ − (11)

em que y e n são inteiros positivos e θ uma probabilidade, portanto θ∈

[ ]

0,1 . Como a probabilidade do pixel é obtida através das variáveis de ambiente topográfico e variável de ambiente espectral, ou seja, os dados, logo a distribuição binomial trata-se da função de verossimilhança do modelo. De modo que os valores de probabilidade são variáveis para cada pixel da imagem.

Como a probabilidade pessoal de ocorrência do evento (certa classe informacional) é constante para cada evento, devido a uma questão de conveniência para determinar a distribuição a priori, optou-se pela escolha de uma distribuição conjugada à distribuição Binomial, ou seja, da mesma família. A alternativa foi uma distribuição Beta com parâmetros α e β, do tipo: θ ฀ Beta

(

α β,

)

. A forma geral da distribuição Beta é dada por:

(

)

1

(

)

1

, 1

p θ α β ∝θα− −θ β− (12) com valores de α,  β  > 0 e constantes. Esses representam os parâmetros da família conjugada natural das distribuições Beta e Binomial pela equivalência de α-1 sucessos a

priori e β‐1 falhas a priori. São parâmetros assumidos desconhecidos, chamados hiperparâmetros. É através deles que se pode inserir a opinião pessoal (ou probabilidade pessoal, como em Savage (1995)), acerca da distribuição, definindo sua forma por duas características como a média e a variância. Uma vez conhecidas a distribuição da amostra pela função de verossimilhança e a distribuição a priori

36 conjugada, pode-se empregar a Equação (10) para obter a função de distribuição a

posteriori, que tem a forma:

(

)

1

(

)

1

(

)

, , , 1 y 1 n y p θ α β n y ∝⎡θα− −θ β− ⎤ ⎡⎦ ⎣θ −θ − ⎤

(

)

1 1 1 n y y a β θ + − θ − + − ∝ − (13)

O modelo probabilístico a posteriori (Equação (13)) determinado através do

produto da função de verossimilhança pela distribuição a priori atende às características

dos dados (probabilidade variável) e é conveniente.

Uma vez estabelecido o modelo probabilístico a posteriori (Equação (13)), falta

ainda lidar com determinação da probabilidade inicial (θ) para alimentar a equação. Para isso, deve-se pensar em uma estratégia capaz de manipular informações de dados contínuos (superfícies de terreno, variação espectral, entre outros) em regiões (locais na imagem) de ocorrência da classe informacional (evento), de modo a integrá-las e produzir como saída valores de probabilidade. Dentre os métodos capazes de tal resultado, pode-se citar a abordagem fuzzy num paradigma subjetivo, e a Regressão Logística Binomial (RLB) num paradigma estatístico. Como a Inferência Bayesiana já contempla a subjetividade, optou-se por utilizar a RLB no lugar da abordagem fuzzy.

A RLB como ferramenta estatística é capaz de descrever a relação entre uma ou mais variáveis independentes, de valores contínuos (mas não necessariamente) e uma variável dependente, de valor binário. As variáveis independentes são as de ambiente topográficas e as de ambiente espectral, enquanto as variáveis dependentes foram as imagens booleanas das amostras de treinamento, uma para cada classe específica, com valores binários de zero e um, indicando respectivamente ausência e presença da classe. Utilizou-se o módulo LOGISTIREG do software IDRISI para realizar o processo de RLB, logo, optou-se por apresentar as etapas de cálculo das quais o referido software faz uso. A relação entre as variáveis dependentes e independentes é determinada pela expressão:

(

)

0 0 exp 1 1 exp k k k k X p X X θ = = ⎛ Β ⎞ ⎜ ⎟ ⎝ ⎠ = = ⎛ ⎞ + Β ⎝ ⎠

(14)

onde p é a probabilidade da variável dependente (θ) sendo 1, X é o vetor de variáveis independentes tal que X = (x0, x1, x2,...,xk), Β é vetor dos coeficientes estimados tal que

37

Β = (β0, β1, β2,..., βk) e k é o número de variáveis independentes. Para linearizar a Equação (14) e eliminar os valores de probabilidade nos limites próximos de 0 e 1, emprega-se a transformação logística na forma:

( )

' log

1 p θ θ θ ⎛ ⎞ = − ⎝ ⎠. Como os valores

p(θ)’ podem assumir qualquer valor no intervalo de “–” a “+” infinito, aplica-se a

transformação logit nos dois lados da equação, obtendo o modelo de regressão linear padrão:

(

)

0 1 1 2 2

log⎡p 1− p ⎤=β +βxx + +... βkxk +α (15) com α sendo o termo que representa o resíduo do modelo.

As seguintes hipóteses simplificativas são assumidas para o modelo de regressão logística: 1) que a variável aleatória dependente θ seja binária; 2) que os resultados de θ sejam mutuamente exclusivos e exaustivos; 3) que θ seja dependente de k variáveis independentes X; 4) que a relação entre θ e X não seja linear e obedeça a uma curva logística; 5) que os dados são gerados a partir de uma amostra aleatória de tamanho n; 6) que as variáveis aleatórias independentes não sejam linearmente relacionadas, ou seja, n > k; 7) e que os resíduos (α) de cada observação sejam independentes dos resíduos de todas as demais observações.

Para resolver o melhor ajustamento do conjunto de parâmetros ou coeficientes da curva de regressão logística, o módulo LOGISTICREG emprega o método de estimação da máxima verossimilhança, na forma:

( )

(

)

(1 ) 1 1 i i n y y i i i L θ θ θ − = =

(16)

onde L é a verossimilhança de θ, θi é o valor predito da variável dependente para a amostra i tal que i=logit-1

( )

i

(

1 i

)

i e e

θ θ

θ θ = + , yi é o valor observado da variável dependente para a amostra i. Com o intuito de maximizar a função de verossimilhança, deve-se solucionar as seguintes equações simultâneas não lineares:

(

)

1 0

n

i i ij i= y −θ x =

,

onde xij é o valor observado da variável independente j para a amostra i.

Com o modelo de equações da RLB solucionado pela Equação (16), pode-se aplicá-lo na Equação (13) e obter o modelo probabilístico beta-binomial, tal que:

(

)

( )

1

( )

1

, , , L y 1 L n y

38 Através do modelo apresentado na Equação (17) é possível se obter o valor da probabilidade corrigida para as variáveis consideradas, obedecendo ao paradigma Bayesiano. Em síntese, a Equação (17) considera y possibilidades de sucesso de se encontrar uma classe informacional específica em n possíveis tentativas (todas as classes informacionais), para cada pixel na área da imagem; além de permitir a expressão da opinião pessoal do analista sobre a forma da distribuição, através dos hiperparâmetros α e β, que representam respectivamente a posição e a dispersão da distribuição.

39