Capítulo 2 Material e Métodos
2.4 Procedimentos laboratoriais
2.5.5 Prova de hipóteses
Outros procedimentos para se investigar o relacionamento entre dois indivíduos, complementares ao cálculo dos valores de parentesco genético par-a-par (BLOUIN, 2003), são: i) distinguir, mediante um procedimento estatístico, entre duas hipóteses de relacionamento a priori; e ii) determinar, estatisticamente, quais relacionamentos estão de acordo com os dados genotípicos observados nos indivíduos analisados (intervalos de confiança). O programa computacional ML-RELATE (KALINOWSKI et al., 2006) oferece esses dois testes. A primeira prova pode ser ilustrada com um exemplo: dois ninhegos foram amostrados dentro de um mesmo ninho e se supõe que sejam irmãos- completos (ou seja, que um mesmo casal seja o genitor de ambos). Genótipos em locos múltiplos são obtidos para cada um dos indivíduos e a análise pelo programa ML- RELATE indica que eles são irmãos-completos, mas a verossimilhança de um relacionamento de tipo meio-irmãos é muito semelhante à obtida para irmãos- completos. Neste caso, pode-se utilizar uma prova estatística para se decidir qual dos dois relacionamentos é o “verdadeiro”μ chame-se de Kpresuposto à representação dos coeficientes k para o relacionamento pressuposto pelas observações ecológicas (no caso, o de irmãos-completos) e Kalternativo à representação dos coeficientes k para o relacionamento que resultou em uma verossimilhança um pouco menor daquela do
Miño, CI Material e Métodos
primeiro relacionamento (no caso, a de serem meio-irmãos), define-se a prova estatística Λ comoμ
Λ = Ln [L (Kpresuposto) / L (Kalternativo)] (equação 2 em Kalinowski et al., 2006) (2) A distribuição amostral de Λ é obtida a partir de simulações de genótipos de pares de indivíduos relacionados segundo as duas alternativas e calcula-se Λ para cada par simulado (no presente estudo foram simulados 1.000 pares). Essas simulações são realizadas em duas etapas: na primeira, o número de alelos idênticos por descendência é obtido de K e, na segunda, os genótipos são escolhidos dado um determinado K. Esse procedimento é realizado várias vezes (no presente estudo foram 10.000 vezes) e registra-se a quantidade de eventos em que as simulações chegaram a um valor Λ igual ou maior do que o observado – esse número representa o valor P da prova estatística. Caso esse valor de P seja pequeno, a hipótese alternativa é rejeitada. Caso ele seja grande, ambas as hipóteses (a pressuposta e alternativa) explicam os dados genéticos analisados (KALINOWSKI et al., 2006).
Em muitos casos, o pesquisador não terá um relacionamento pressuposto para avaliar contra uma determinada alternativa. Nesses casos, será útil se ter uma listagem de todos os relacionamentos que estão de acordo com os dados genéticos estudados (KALINOWSKI et al., 2006). O programa ML-RELATE oferece também uma maneira de se obter significância estatística das razões da verossimilhança (likelihood
ratios) e utiliza simulações para obter a distribuição desse parâmetro. Chame-se Knull ao relacionamento possível entre dois indivíduos que será posto a prova, KML a estimativa de K entre dois indivíduos, obtida por máxima verossimilhança, Λ‟ define-se como:
Ln [L(KML) / L(Knull)] (equação 3 em Kalinowski et al. 2006) (3)
A significância de Λ‟ é obtida através de simulações de pares de genótipos com a hipótese nula e calcula-se Λ‟ para cada um dos pares simulados. Isso é realizado várias vezes (o número de vezes é escolhido pelo pesquisador) e registra-se a quantidade de eventos em que as simulações chegaram a um valor Λ‟ igual ou maior ao observado, esse número representa o valor P da prova estatística. Caso esse valor de P seja pequeno, a hipótese nula é rejeitada. Caso ele seja grande, a hipótese nula não é rejeitada e esse relacionamento é incluído na lista dos que estão de acordo com os dados genéticos analisados (KALINOWSKI et al., 2006). Esse procedimento repete-se com todos os relacionamentos de interesse.
Miño, CI Material e Métodos
De maneira análoga ao ML-RELATE, o programa KINGROUP (KONOVALOV et al., 2004), realiza uma análise de tipo “máxima verossimilhança” para calcular a verossimilhança de um determinado par de indivíduos estar relacionado segundo uma hipótese determinada pelo pesquisador (hipótese primária). Testes podem ser feitos, através de simulações, para comparar a significância dessa relação de parentesco com a significância da hipótese alternativa (também especificada pelo pesquisador). Esta abordagem é poderosa, flexível e permite que os indivíduos sejam classificados em categorias de relacionamento ainda que um baixo número de marcadores seja utilizado (HENSHAW et al., 2000; ORTEGA et al., 2003). A abordagem utilizada no programa KINGROUP baseia-se na descrita por Goodnight e Queller (1999) para se distinguir entre hipóteses diferentes de relacionamento entre dois indivíduos, a partir de dados de marcadores moleculares co-dominantes. Este método calcula a probabilidade de dois indivíduos compartilharem alelos por “identidade-por- descendência”, dada uma determinada hipótese de relacionamento (Likelihood of Odds, LOD). Esse LOD é sempre expresso em termos de LOD ratio, ou seja, a razão entre o LOD de uma hipótese primária e o LOD de uma hipótese alternativa, como medida da significância estatística de cada uma das hipóteses. Ambas as hipóteses são especificadas pelo pesquisador, com base nas informações ecológicas disponíveis. Um valor alto da razão LOD favorece a hipótese primária, enquanto que um valor pequeno não lhe dá suporte. Como a determinação da significância estatística dos valores da razão LOD é um processo difícil, o método de Goodnight e Queller (1999) baseia-se em simulações.
O processo de simulação começa escolhendo um genótipo individual ao acaso (X) e utiliza as frequências alélicas do conjunto de dados para calcular a probabilidade do indivíduo apresentar um determinado alelo. Em seguida, a simulação determina o genótipo do indivíduo Y, utilizando as freqüências alélicas populacionais e segundo um relacionamento com o indivíduo X definido pelo pesquisador (por exemplo, irmãos completos). O programa KINGROUP realiza esse processo quantas vezes o pesquisador determine e sempre levando em conta o relacionamento definido como hipótese primária. O valor da razão LOD que exclua 95% desses pares assim criados corresponderá ao nível de significância de Pα = 0.05, e esses valores serão comparados com os valores de P calculados para cada par observado na nossa amostra (GOODNIGHT E QUELLER, 1999). O poder deste método depende, por um lado, das
Miño, CI Material e Métodos
categorias de relacionamentos que se pretende distinguir e, por outro, do número de locos analisados. Algumas categorias de relacionamento são fáceis de serem distinguidas com poucos locos (GOODNIGHT E QUELLER, 1999). De acordo com Goodnight e Queller (ver tabela 3 em GOODNIGHT E QUELLER, 1999), somente dois locos são necessários para aceitar corretamente 50% dos pares relacionados pela hipótese primária, com um nível de significância de Pα = 0.05, quando a comparação
hipótese primária/hipótese alternativa corresponde a irmãos-completos/não- relacionados.
No presente estudo, os programas KINGROUP (KONOVALOV et al., 2004) e ML-RELATE (KALINOWSKI et al., 2006) foram utilizados para realizar as provas de hipóteses da seguinte maneira: uma primeira prova foi realizada considerando como hipótese primária (Ho) a existência de um parentesco de tipo “irmãos-completos”
entre os ninhegos amostrados dentro de um mesmo ninho, e definindo como hipótese alternativa (H1) o “não-relacionamento”. Nos casos em que as primeiras análises de ML realizadas pelo programa ML-RELATE indicaram uma categoria de relacionamento como mais provável entre um determinado par de indivíduos diferente de irmãos- completos, as provas de hipótese foram realizadas definindo aquela categoria como hipótese primaria. Todas as provas foram conduzidas com 10.000 permutações de genótipos/relacionamento.