Princípios do mapeamento genético

S. edule é um grupo menor de cana estéril, delimitado na Nova Guiné e nas ilhas vizinhas Os clones desta espécie são provavelmente originados da espécie robustum, bem como

2.7 Mapeamento Genético

2.7.1 Princípios do mapeamento genético

A grande disponibilidade de marcadores moleculares, altamente polimórficos, aliada

a procedimentos estatísticos complexos, tem permitido a construção de mapas genéticos

para a maioria das espécies vegetais de interesse agronômico, até mesmo para aquelas de

longo ciclo de vida, como as florestais e as frutíferas (Carneiro e Vieira 2002).

O mapeamento genético consiste em determinar a posição relativa de marcadores

moleculares no genoma e visa igualmente determinar a distância genética entre dois

marcadores consecutivos. O objetivo principal de um trabalho de mapeamento é ordenar o

de marcadores fortemente ligados a estes genes. Estando o genoma coberto, torna-se

possível à localização precisa de um gene que codifica determinada característica.

Os principais passos para construção de um mapa genético são: (1) Produção de

uma população segregante, sendo BC (backcross), F2, haplóides duplos, linhagens

recombinantes (DH ou SSD) e cruzamentos entre plantas heterozigotas, os principais tipos

de população utilizados. (2) Análise dos marcadores moleculares a fim de escolher os que

são polimórficos entre os parentais da população de mapeamento. (3) Determinação dos

alelos presentes em cada loco na progênie. (4) Construção dos grupos de ligação. (5)

Ordenação dos marcadores dentro de cada grupo de ligação. (6) Computação das distâncias

genéticas entre os marcadores. Os marcadores ideais para um trabalho de mapeamento

genético apresentam como características, herança co-dominante, alto nível de

polimorfismo, grande quantidade e sítio único no genoma com perfil e posição conhecidos.

Os marcadores empregados na construção dos mapas podem ser escolhidos com

base em testes estatísticos da segregação dos alelos na população de mapeamento,

comumente usando a estatística de Qui-quadrado (χ2

O nível de significância empregado na estatística Qui-quadrado é a probabilidade de

se cometer um erro Tipo I, ou seja, a probabilidade de se rejeitar uma hipótese nula

verdadeira. O nível de significância considerado para a realização dos testes é escolhido

pelo pesquisador, sendo os valores mais comuns 5% e 1%. Isso implica na ocorrência de

múltiplos testes, o que leva a um nível de significância conjunto ou genômico (α*) do teste, o qual se apresenta crescente à medida que aumenta o número de testes realizados,

t ) 1 ( 1 * α α = − − , em que:

nível de significância conjunto (ou genômico);

= *

nível de significância para cada teste (individual);

α =

t número de testes realizados (ou número de marcadores, no caso).

Assim, quando fixamos 5% para cada teste (α =0,05) e realizamos, por exemplo, 100 testes (t=100), o nível de significância conjunto passa a ser α*=0,994079, ou seja, certamente seriam detectados inúmeros falsos positivos.

Uma alternativa para contornar tal problema é a utilização da correção de

Bonferroni (Rice 1989). Esta correção consiste em determinar o valor do nível de

significância individual (α) que proporcionará o nível de significância conjunto (α*) e, assim, contornar os problemas resultantes da realização de múltiplos testes. A fórmula

empregada no cálculo da correção é apresentada a seguir, sendo os termos desta os mesmos

já apresentados:

(

)

1 1 ln exp * + ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − = t α α

Tais análises estatísticas permitem a eliminação dos marcadores distorcidos do

estudo de mapeamento, ou seja, descarte dos marcadores que não seguem as segregações

esperadas na população de mapeamento. Assim, quando dispomos de vários marcadores em

segregação em uma população, a primeira etapa consiste em testar a eventual ligação

existente entre eles, seja através do teste de aderência de χ2

, seja através do LOD score

construção dos grupos de ligação. A ordem dos marcadores dentro de cada grupo é

determinada em seguida através de uma análise de multiponto que se baseia geralmente no

método de máxima verossimilhança. Estas análises e a construção final do mapa podem ser

realizadas com o auxílio de programas especializados, como Mapmaker (Lander et al 1987)

e JoinMap (Stam 1993).

Considerando a teoria da ligação genética, os mapas genéticos podem ser elaborados

considerando-se a probabilidade de ocorrência de diferentes classes genotípicas, ou seja,

utilizando a frequência de recombinação existente entre dois locos.

A frequência de recombinação traduz o número de crossing-over produzidos entre

os dois marcadores durante a meiose. A relação entre a frequência de recombinação

(distância genética) e o número de nucleotídeos separando dois marcadores (distância

física) não é universal, podendo variar de um organismo para o outro. Pode igualmente

variar de um lugar para o outro do genoma de um mesmo organismo, como encontrado, por

exemplo, para o tomate (Ganal et al 1989), o arroz (Gustafson e Dillé 1992), o trigo (Chao

et al 1989) e para o milho (Dooner et al 1986).

A frequência de recombinação é traduzida em distância genética, cuja unidade de

medida é centiMorgan (cM). Esta conversão permite a análise dos eventos de recombinação

entre os marcadores, além de dispor de uma medida aditiva da distância. Existem várias

funções de mapeamento, que transformam a frequência de recombinação em distância

genética e determinam de diferentes maneiras a ocorrência real de crossing-over em função

da frequência de recombinação observada, levando ou não em consideração a interferência

(interação entre crossing-over). As mais utilizadas são as funções de Haldane (1919), que

assume não haver interferência, e de Kosambi (1944), que assume haver interferência entre

Em um mapa genético os cromossomos são representados por grupos de ligação,

sob os quais são dispostos os marcadores moleculares, cujas distâncias são expressas em

frequência de recombinação. Em poliplóides, os grupos de marcadores correspondentes aos

cromossomos são denominados grupos de co-segregação, enquanto que o termo grupo de

homologia designa o conjunto de grupos de co-segregação de uma classe de homologia.

O número de marcadores necessários para construção de um mapa genético depende

do tamanho do genoma, do número de cromossomos e da frequência de recombinação

genética. Um mapa pode ser considerado completo quando o número de grupos de ligação

obtido pela análise dos marcadores for igual ao número de cromossomos do organismo e,

também, quando todos os marcadores mapeados estiverem ligados, indicando que todas as

regiões do genoma estão representadas (Guimarães e Moreira 1999a).

No documento Desenvolvimento de marcadores moleculares EST-SSRs e mapeamento funcional em cana-de-açucar (Saccharum spp.) (páginas 58-62)