• Nenhum resultado encontrado

A teoria de probabilidade permite atribuir um grau de cren¸ca a um evento do mundo real. No contexto de extra¸c˜ao de intera¸c˜oes de IPPs, ´e poss´ıvel assumir que um evento de intera¸c˜ao pode ser detectado de acordo com informa¸c˜oes de outros eventos. Esses eventos poderiam ser, por exemplo, a existˆencia do adv´erbio “not” e de qualquer verbo ser encontrados entre dois nomes de prote´ınas em uma senten¸ca de texto. Na pr´atica, os eventos a serem considerados para a extra¸c˜ao de IPPs s˜ao mais sofisticados.

3.2.1

Espa¸co de Eventos

O conjunto de eventos mensur´aveis, em um espa¸co de todos os resultados poss´ıveis, ´e denotado por R. O espa¸co de resultados poss´ıveis ´e definido como Ω. Cada evento α ∈ R ´e um subconjunto de Ω (Koller e Friedman, 2009).

O grau de cren¸ca ´e atribu´ıdo a cada evento por meio do uso de uma distribui¸c˜ao de probabilidade, a qual ´e definida por P . Essa distribui¸c˜ao deve satisfazer os seguintes axiomas:

• P (α) ≥ 0, ∀α ∈ R. • P (Ω) = 1.

• Se α, β ∈ R e α ∩ β = ∅, ent˜ao P (α ∪ β) = P (α) + P (β).

De acordo com tais axiomas, a probabilidade de um evento ´e sempre um valor posi- tivo. Tamb´em, a probabilidade m´axima, considerando todos os poss´ıveis resultados dos eventos em Ω, ´e 1. A probabilidade de dois eventos mutuamente exclusivos ´e a soma das probabilidades de cada evento.

3.2.2

Vari´avel Aleat´oria

Para atribuir uma probabilidade a um evento, usa-se o conceito de vari´avel aleat´oria. Aqui, letras mai´usculas referem-se a vari´aveis aleat´orias, tais como: A, B, C, . . . , Z. A vari´avel aleat´oria ´e uma fun¸c˜ao que associa um evento em Ω com um valor. Por exemplo, uma vari´avel aleat´oria V P , relacionada com o evento verbo, pode mapear a presen¸ca de um verbo entre duas prote´ınas, isto ´e, a indica¸c˜ao de presen¸ca de um verbo com valores: 1 (“existe verbo”) ou 0 (“n˜ao existe verbo”). Ent˜ao, o evento V P = 1 indica a presen¸ca de um verbo, enquanto que V P = 0 indica a ausen¸ca de um verbo entre duas prote´ınas.

Uma vari´avel aleat´oria pode ser discreta, considerando um conjunto finito de valores. Caso contr´ario, ela pode ser cont´ınua, podendo ter valores reais. Nesta disserta¸c˜ao, ´e

3.2. Conceitos da Teoria de Probabilidade 29 de interesse o uso de vari´aveis discretas. Assim, define-se o conjunto finito de valores de uma vari´avel aleat´oria A como V al(A) e, os valores dessa vari´avel em letras min´usculas: a ∈ V al(A). Em suma, usa-se ai para indicar o i-´esimo valor de A. Assim, V al(A) =

a1, . . . , ak e k = |V al(A)|. Quando k > 2, a distribui¸c˜ao da vari´avel A ´e denominada

multinomial. Por outro lado, no caso k = 2, isto ´e, uma vari´avel bin´aria, a distribui¸c˜ao

´e chamada de Bernoulli. Assim, na vari´avel V P , a distribui¸c˜ao ´e de Bernoulli. Na distribui¸c˜ao de uma vari´avel aleat´oria A, cumpre-se que:

k

X

i=1

P (A = ai) = 1. (3.1)

Por simplicidade, daqui em diante, s˜ao usadas nota¸c˜oes mais curtas para esses concei- tos: P (A = a) como P (a) e, Pk

i=1P (A = ai) como

P

aP (a), e P ((A = a) ∩ (B = b))

como equivalente a P (a, b).

3.2.3

Probabilidade Conjunta

Com n vari´aveis aleat´orias, tal que Xj ´e a j-´esima vari´avel aleat´oria, o conjunto dessas

vari´aveis ´e denotado por X = {X1, . . . , Xn}. A distribui¸c˜ao conjunta envolve a todas as

vari´aveis aleat´orias:

P (X1, X2, X3, . . . , Xn),

e atribui probabilidades aos eventos relacionados com tais vari´aveis. Para indicar a atribui¸c˜ao de valores para as vari´aveis em X , ´e usado ξ ∈ V al(X ). A nota¸c˜ao ξ refere-se `a atribui¸c˜ao de um valor para cada vari´avel em X .

A probabilidade conjunta ´e importante para responder consultas sobre eventos rela- cionados com as vari´aveis aleat´orias, sendo poss´ıvel detectar um evento de intera¸c˜ao. O emprego da probabilidade conjunta para responder consultas ´e descrito na Se¸c˜ao 3.4.

3.2.4

Probabilidade Condicional

A probabilidade condicional ´e representada por P (X | Y ), onde a probabilidade de X est´a condicionada por Y . Quando ´e conhecido que X est´a condicionada por Y , ´e poss´ıvel reescrever a probabilidade conjunta P (X, Y ) como P (Y )P (X | Y ).

A probabilidade condicional pode ser calculada pelo Teorema de Bayes, conforme a Equa¸c˜ao 3.2.

P (X | Y ) = P (X | Y ) P (Y )

P (X) (3.2)

Como uma rede probabil´ıstica baseia seus c´alculos no teorema de Bayes, ela ´e chamada comumente de rede bayesiana.

30 Cap´ıtulo 3. Fundamenta¸c˜ao de Redes Bayesianas A distribui¸c˜ao de probabilidade condicional ´e uma distribui¸c˜ao mais informada sobre a rela¸c˜ao entre vari´aveis, como no caso de X e Y . Isso permite redefinir o c´alculo da probabilidade conjunta, na maiorira dos casos, em termos mais curtos. Por outro lado, se essa distribui¸c˜ao implica um conhecimento de rela¸c˜ao entre vari´aveis, tamb´em existem casos onde ´e conhecida a ausˆencia de rela¸c˜ao entre vari´aveis. Isso ´e detalhado a seguir.

3.2.5

Independˆencia e Independˆencia Condicional

Em alguns casos, a probabilidade condicional entre um par de vari´aveis, X e Y , indica a ausˆencia de rela¸c˜ao entre ambas as vari´aveis. Nesse caso, ambos os eventos s˜ao chamados de independentes entre si. Assim, X ´e independente de Y , se P (X | Y ) = P (X) ou se P (Y ) = 0. Isso ´e denotado por P  (X ⊥ Y ), onde  indica “satisfaz” e, ⊥ denota independˆencia.

Em outro caso, X e Y s˜ao independentes dada uma terceira vari´avel Z. Este caso particular ´e chamado de independˆencia condicional e ´e denotado por: P  (X ⊥ Y | Z), se P (X | Y ∩ Z) = P (X | Y ) ou se P (Y ∩ Z) = 0. Assim, o uso desses conceitos ´e importante no c´alculo da probabilidade conjunta, a fim de estimar o grau de cren¸ca de um evento. Nesse contexto, na pr´oxima se¸c˜ao ´e descrita a importˆancia das probabilidades a priori, a posteriori e condicional.

3.2.6

Importˆancia das Probabilidades a Priori, a Posteriori e Condi-

cional

No estudo das t´ecnicas de aprendizado de redes bayesianas, as probabilidades a priori, a

posteriori e condicional s˜ao conceitos essenciais. No caso da probabilidade a priori (ou

incondicional), ela ´e utilizada na inicializa¸c˜ao de uma rede bayesiana, sendo calculada para cada vari´avel dessa rede. J´a quando a probabilidade de alguma vari´avel ´e atualizada, esse acontecimento ´e denominado evento e aquela ´e chamada vari´avel evento (E). Dessa forma, se na rede bayesiana existir um evento, ent˜ao um algoritmo de inferˆencia probabil´ıstica deve ser utilizado a fim de atualizar tamb´em as probabilidades das vari´aveis relacionadas `a vari´avel evento. Assim, essas novas probabilidades s˜ao chamadas de probabilidades a

posteriori.

Al´em disso, essas rela¸c˜oes entre vari´aveis s˜ao quantificadas pela distribui¸c˜ao de proba- bilidade condicional, que ´e especificada para cada vari´avel. A probabilidade condicional quantifica a rela¸c˜ao entre uma vari´avel conhecida como evento E e uma vari´avel conhecida como hip´otese H. Assim, P (H | E) ´e interpretada como: a probabilidade da hip´otese H, quando observado E (Russell e Norvig, 2010). Por exemplo, na planta Arabidopsis thali-

3.3. Rede Bayesiana 31

Documentos relacionados