• Nenhum resultado encontrado

6.3 – Resultados dos Estudos de Simulações

No documento Capítulo 1. Introdução (páginas 101-105)

Os estudos de simulações realizados neste trabalho tiveram como objetivo avaliar a eficiência da busca por QTL’s epistáticos via o algoritmo genético (AG) em comparação com os métodos de busca exaustiva e condicional.

Para esta aplicação foram considerados oito cenários de simulação (Situações 1 a 8 da Tabela 6.8) de marcadores, fenótipos e tamanho amostral. Para as simulações foram utilizados os recursos do WinQTLCart para população F2, com o fenótipo assumindo distribuição N(µ,σ2) para modelos com

dois QTL’s de efeitos aditivos e com o correspondente efeito de epistasia (interação aditivo*aditivo), para mais detalhes, ver Apêndice C – Usos do WinQTLCart. Em todos os casos adotou-se µ=130 e σ = 2,2688, se assemelhando à distribuição dos valores de pressão dos ratos F2. Diferentes tamanhos

102

A Tabela 6.8 apresenta uma descrição dos oito diferentes cenários de simulação. Foram considerados mapas menores com somente 2 cromossomos e 4 marcadores por cromossomo (Situações de 1 a 6) e genomas relativamente maiores com 10 cromossomos. Neste último caso, foram considerados 4 marcadores por cromossomo e distância de 4cM entre os marcadores, e mapas com 10 marcadores por cromossomo e distância de 8cM entre os marcadores. O tamanho do genoma (ngen) nestes casos foi de 24cM, 120cM e 720cM. Na tabela estão indicados ainda os parâmetros adotados no AG: probabilidade de mutação (pm = 0,1 e 0,4), o que corresponde a probabilidades de recombinação iguais a pr = 0,9 e 0,6, respectivamente; número de soluções (ns = 100) e número de gerações (ng = 100 e ng = 1.000).

Observe-se na Tabela 6.8 que n é o tamanho amostral, pm é a probabilidade de mutação, ns é o número de soluções e ng representa o número de gerações.

Tabela 6.8. Dados considerados no estudo de simulação.

SITUAÇÕES MAPA Genoma (cM) n pm ns ng

1 2Chr 4M/Chr 24 50 0,1 100 100 2 2Chr 4M/Chr 24 50 0,4 100 100 3 2Chr 4M/Chr 24 50 0,4 100 1.000 4 2Chr 4M/Chr 24 200 0,4 100 1.000 5 2Chr 4M/Chr 24 200 0,4 100 1.000 6 2Chr 4M/Chr 24 200 0,4 100 1.000 7 10Chr 4M/Chr 120 200 0,4 100 1.000 8 10Chr 10M/Chr 720 200 0,4 100 1.000

Nota-se na Tabela 6.8 que nas Situações de 1 a 3 foi utilizado o mesmo conjunto de dados simulados alterando a probabilidade de mutação de 0,1 para 0,4 (Situações 1 e 2) e o número de gerações de 100 para 1.000 (Situações 2 e 3).

Para as Situações 4, 5 e 6 foram utilizadas diferentes réplicas simuladas a partir do mesmo conjunto de dados sem alterar os parâmetros do modelo (somente “sementes” diferentes).

Já nas Situações 7 e 8 foram utilizados genomas maiores de 120cM e 720cM respectivamente. Na análise de cada um destes conjuntos de dados foram aplicadas as metodologias de busca exaustiva, condicional e por AG, utilizando os critérios de ajuste por SSE, AIC e BIC para os parâmetros pm (probabilidade de mutação), ns (número de soluções) e ng (número de gerações por solução). Para tanto, em todos os casos, o modelo de regressão intervalar com 2 QTL’s de efeitos

103

aditivos e com efeito de epistasia (expressão 3.16) foi ajustado aos dados utilizando-se o programa implementado neste trabalho com os recursos do R (Apêndice B). Além disso, em cada caso aplicou- se o procedimento MIM diretamente do WinQTLCart.

Na Tabela 6.9 estão indicados as porcentagens de convergência (pcvog) para o valor ótimo global resultantes da análise dos dados simulados por algoritmo genético (AG). Nota-se que, nestes casos, que o ponto ótimo global é conhecido, tanto pelos parâmetros definidos nas simulações como também, estes pontos podem ser encontrados diretamente por meio da busca exaustiva, a qual avalia todos os possíveis pares de posições. O pcvog é calculado simplesmente pela razão do número de soluções que atingiram o ponto ótimo global dentre o total de soluções executadas (ns = 100). Os resultados indicam que:

Tabela 6.9. Resultados para diferentes valores de pcvog (em %) para as diferentes funções objetivo.

AG

SITUAÇÕES SSE AIC BIC

1 14 4 4 2 20 6 5 3 36 18 17 4 2 4 1 5 28 18 17 6 32 21 22 7 1 1 1 8 1 0 0

• a porcentagem de convergência para o valor ótimo global (pcvog) aumentou quando a probabilidade de mutação (pm) aumentou de 0,1 para 0,4 (ver Situações 1 e 2) e o número de gerações (ng) aumentou de 100 para 1.000 (ver Situações 2 e 3);

• a pcvog sofreu uma diminuição quando o número de indivíduos aumentou de 50 para 200 (Situações 3 e 4) e quando o tamanho do genoma aumentou (Situações 4 e 7); e

• o método que mais atingiu o pcvog foi o SSE, seguido do AIC, e por último, o BIC.

Após ser concluída a busca por AG, o programa em R executa a rotina implementada para busca exaustiva e então a condicional. Na Figura 6.4 estão apresentados gráficos dos resultados da análise das Situações 1 e 7 para busca exaustiva, considerando os três critérios SSE, AIC e BIC. Todas as combinações possíveis de posições do “genoma” são avaliadas neste caso (sob uma varredura do mapa de 1 em 1 cM) e os valores da função objetivo obtidos foram ordenados para a construção dos

104

gráficos. A abscissa dos gráficos representa o índice do par de posições que compõem o espaço de pesquisa e a ordenada representa os valores ordenados da função objetivo (BIC, AIC e SSE). A primeira linha refere-se a Situações 1 (genoma menor) e a segunda a Situações 7 (genoma maior). Nota-se que o comportamento do BIC e AIC são mais parecidos entre si e diferentes do comportamento do SSE, principalmente para Situações 7. Os gráficos do BIC e AIC mostram um platô com valores intermediários da função que são produzidos por um número muito grande de pares de posições, poucos pares produzem valores altos da função (BIC > 0 e AIC > 50, para Situações 8) e poucos produzem valores mais baixos da função (BIC < -15 e AIC < 35, para Situações 7). O gráfico para SSE mostra um platô para os maiores valores da função (SSE > 440, para Situações 7) e parece haver uma maior discriminação entre os pares de posições para a análise via esta função.

BIC AIC SSE

Figura 6.4. Gráficos dos ajustes ordenados da busca exaustiva para os métodos BIC, AIC e SSE, considerando Situações 1 (primeira linha) e Situações 7 (segunda linha).

A Tabela 6.10 apresenta os pares de posições cromossômicas do ponto ótimo global encontrado para as soluções obtidas pelos métodos de busca por algoritmo genético, exaustiva, WinQTLCart e condicional, para as diferentes funções objetivo e para Situações de 1 a 8.

105

Tabela 6.10. Resultados dos diferentes pares de posições (cM) para os conjuntos de dados simulados obtidos pelos diferentes métodos de busca e diferentes funções objetivo.

METODOLOGIAS

AG BUSCA EXAUSTIVA BUSCA CONDICIONAL

Situações SSE AIC BIC WinQTLCart SSE AIC BIC SSE AIC BIC

1 (5;26) (5;26) (5;26) (3,6;22,4) (5;26) (5;26) (5;26) (5;26) (5;26) (5;26) 2 (5;26) (5;26) (5;26) (3,6;22,4) (5;26) (5;26) (5;26) (5;22) (5;22) (5;22) 3 (5;26) (5;26) (5;26) (3,6;22,4) (5;26) (5;26) (5;26) (5;22) (5;22) (5;22) 4 (1;13) (1;13) (1;13) (3,6;22,4) (1;13) (1;13) (1;13) (9,25) (7,22) (9,22) 5 (5;22) (5;22) (5;22) (3,6;22,4) (5;22) (5;22) (5;22) (5;22) (5;22) (5;22) 6 (5;26) (5;26) (5;26) (3,6;22,4) (5;26) (5;26) (5;26) (5;26) (5;26) (5;26) 7 (104; 113) (104; 113) (104; 113) (103,3;108,9) (104; 113) (104; 113) (104; 113) (104; 113) (100; 113) (104; 113) 8 (9;633) (1;601) (1;641) (8,7;634,1) (9;633) (9;633) (9;633) (9;621) (9;621) (9;621)

Da Tabela 6.10 é possível observar que o melhor ajuste foi encontrado no mesmo par de

No documento Capítulo 1. Introdução (páginas 101-105)