• Nenhum resultado encontrado

2.2 Material e métodos

2.2.5 Construção dos mapas de ligação

A construção dos mapas de ligação foi baseada na análise de uma amostra de 160

indivíduos F1 oriundos do cruzamento entre os acessos IAPAR-06 e IAPAR-123. Esta amostra

foi genotipada para um total de 369 locos AFLP, sendo 114 locos oriundos do primeiro genitor, 139 oriundos do segundo e 116 locos bi-parentais, presentes em ambos os genitores.

Após a obtenção dos dados moleculares, isto é, a leitura dos locos polimórficos, foi feita a

verificação do padrão de segregação de cada loco. Para a verificação da ocorrência de distorção

de segregação, os locos foram submetidos ao teste de aderência de “qui-quadrado” (χ2). Para cada

teste foi obtido o valor de P, ou seja, a probabilidade sob H0, de se obter um valor igual ou

superior ao χ2 calculado com base na amostra. Por se tratar de um procedimento de testes

múltiplos, deve-se considerar um nível de significância conjunto. O nível de significância é definido, em estatística, como a probabilidade de se cometer um erro Tipo I (rejeitar uma hipótese nula verdadeira). Assim, cometer um erro Tipo I, no presente caso, implica em admitir a existência de distorção de segregação de um loco que, na realidade, não apresenta distorção. Dessa maneira, adotando-se um nível de significância α para cada teste (um para cada marca) em um total de t testes, tem-se um nível de significância conjunto α* dado por: α* = 1 – (1 – α)t , que corresponde à probabilidade de rejeitar pelo menos uma hipótese nula verdadeira. Esse nível de significância cresce à medida que aumenta o número de testes realizados (Silva & Vencovsky, 2002).

Para estabelecer o ponto de corte considerando o nível de significância conjunto do teste (α*) foi usado o critério da ‘razão de falsas descobertas’ (FDR - false discovery rate) proposto por Benjamim & Hocheberg (1995). Esta razão é definida como sendo a proporção de hipóteses nulas

(H0) verdadeiras, entre as hipóteses nulas rejeitadas, ou seja, a proporção de erros devido à falsa

Assim, foram obtidos para cada loco individualmente o valor da estatística χ2 e o correspondente valor de P. Estes valores de P foram ordenados em ordem crescente e a posição do teste individual do rank de probabilidades foi representado pela letra i. Foi adotado como

ponto de corte o nível α*=0,05 para o conjunto dos t testes. O valor de i a partir do qual foi

rejeitada a hipótese H0 (e de todos os i com P valores iguais ou inferiores) foi determinado a

partir da definição: i tPi* α (11)

As marcas que apresentaram distorção das proporções mendelianas no teste de aderência não foram utilizadas na construção do mapa de ligação. Foram descartados também locos com mais de 10% de observações perdidas.

Os locos foram separados em dois conjuntos de dados, um contendo locos do genitor 06 juntamente com os locos bi-parentais e outro contendo as marcas do genitor IAPAR-123 e as marcas bi-parentais. Estes conjuntos foram utilizados para a construção de mapas separados para cada genitor, de acordo com a estratégia do duplo pseudocruzamento teste.

A construção dos mapas de ligação foi feita utilizando-se o programa TreeMap® (Coelho,

2005) e o programa “MAPMAKER/EXP” versão 3.0 (Lander et al., 1987). Primeiramente, os conjuntos contendo os locos de segregação 1:1 e 3:1 de cada genitor foram analisados no

TreeMap®, o qual permite a análise de locos com mistura de segregações.

A atribuição dos locos aos grupos de ligação (GL) é baseada em testes de ligação considerando os locos 2 a 2 (análise de 2 pontos). Todos os pares de locos que têm uma distância menor ou igual a uma distância especificada e um LOD score superior a um LOD mínimo pré-estabelecido são considerados ligados. Na construção dos grupos de ligação é utilizada a propriedade transitiva, ou seja, se o loco 1 estiver ligado ao loco 2, e este, por sua vez, estiver ligado ao loco 3, então os locos 1 e 3 pertencem ao mesmo grupo de ligação. Como critérios para determinar a ligação foi usado LOD score > 5,0 e freqüência de recombinação inferior a 0,35. Para converter as freqüências de recombinação em distâncias de mapa, expressas em centiMorgans, foi utilizada a função de mapeamento de Kosambi (Kosambi, 1944).

A estatística LOD score se baseia na razão de verossimilhanças, em que no denominador é disposta a função de verossimilhança considerando uma distância entre marcas de 0,5 (r = 0,5;

ausência de ligação; hipótese de nulidade) e, no numerador, a função que possui a estimativa de máxima verossimilhança de r (hipótese alternativa). Essa razão é colocada no logaritmo com base 10, sendo esse termo definido como LOD score. O termo LOD é a abreviação de log of the odds, ou seja, razão de chances (Liu, 1998). A interpretação de um LOD de valor z, por exemplo, é que a hipótese alternativa é 10z vezes mais provável que a hipótese de nulidade.

Após a determinação dos grupos, foi determinada a ordem linear dos locos dentro de cada grupo. Para encontrar a ordem mais provável foi usado o critério de ordenação LOD score > 2,0. As marcas não ordenadas no mapa (framework), de acordo com os critérios estabelecidos, foram adicionadas como marcadores acessórios e alocadas ao lado das marcas do framework mais próximas, anotando-se a distância entre elas.

Procurou-se deixar no framework apenas as marcas com segregação 1:1, visto que a ordenação de locos com segregação 3:1 é problemática, (Maliepaard et al., 1997; Conner et al., 1998; Maliepaard et al., 1998) e, também, para que fosse possível a análise dos dados pelo

programa QTLCartographer®, o qual não permite misturas de segregações.

Depois de obtidos os frameworks para cada GL no Treemap®, os marcadores contidos no

mesmo foram analisados pelo programa Mapmaker®. As ordens dos marcadores foram

confirmadas através do comando “ripple”, o qual estabelece uma janela (no default são cinco locos) dentro da qual são feitas trocas entre marcas vizinhas comparando-se a probabilidade das diferentes ordens possíveis. Foi usado como critério de confirmação da ordem um valor de LOD > 2,0, ou seja, a ordem foi admitida como correta quando esta se apresentou no mínimo 100 vezes mais provável que as ordens alternativas. Os GL foram então submetidos à análise multiponto para a determinação das distâncias entre as marcas através do comando “map”.

Para a análise dos dados através do programa Mapmaker® os genótipos da progênie foram

codificados atribuindo-se as letras H e A para representar a condição heterozigótica e homozigótica, respectivamente. Nos géis, H corresponde à presença da banda e A, à ausência de banda.

Para determinar marcas ligadas em fase de repulsão, o conjunto de dados de cada mapa foi duplicado e re-codificado, ou seja, os genótipos H do conjunto original foram codificados como A no conjunto duplicado, e vice-versa. No código usado para identificar o loco no conjunto original acrescentou-se a letra a, e no conjunto duplicado acrescentou-se a letra r, de acordo com procedimento relatado por Nelson et al. (1993). Com esse artifício, todo grupo de ligação

formado tem um grupo espelho constituído pelos mesmos marcadores, os quais são descartados posteriormente da análise.

Documentos relacionados