S. edule é um grupo menor de cana estéril, delimitado na Nova Guiné e nas ilhas vizinhas Os clones desta espécie são provavelmente originados da espécie robustum, bem como
2.7 Mapeamento Genético
2.7.1 Princípios do mapeamento genético
A grande disponibilidade de marcadores moleculares, altamente polimórficos, aliada
a procedimentos estatísticos complexos, tem permitido a construção de mapas genéticos
para a maioria das espécies vegetais de interesse agronômico, até mesmo para aquelas de
longo ciclo de vida, como as florestais e as frutíferas (Carneiro e Vieira 2002).
O mapeamento genético consiste em determinar a posição relativa de marcadores
moleculares no genoma e visa igualmente determinar a distância genética entre dois
marcadores consecutivos. O objetivo principal de um trabalho de mapeamento é ordenar o
de marcadores fortemente ligados a estes genes. Estando o genoma coberto, torna-se
possível à localização precisa de um gene que codifica determinada característica.
Os principais passos para construção de um mapa genético são: (1) Produção de
uma população segregante, sendo BC (backcross), F2, haplóides duplos, linhagens
recombinantes (DH ou SSD) e cruzamentos entre plantas heterozigotas, os principais tipos
de população utilizados. (2) Análise dos marcadores moleculares a fim de escolher os que
são polimórficos entre os parentais da população de mapeamento. (3) Determinação dos
alelos presentes em cada loco na progênie. (4) Construção dos grupos de ligação. (5)
Ordenação dos marcadores dentro de cada grupo de ligação. (6) Computação das distâncias
genéticas entre os marcadores. Os marcadores ideais para um trabalho de mapeamento
genético apresentam como características, herança co-dominante, alto nível de
polimorfismo, grande quantidade e sítio único no genoma com perfil e posição conhecidos.
Os marcadores empregados na construção dos mapas podem ser escolhidos com
base em testes estatísticos da segregação dos alelos na população de mapeamento,
comumente usando a estatística de Qui-quadrado (χ2
).
O nível de significância empregado na estatística Qui-quadrado é a probabilidade de
se cometer um erro Tipo I, ou seja, a probabilidade de se rejeitar uma hipótese nula
verdadeira. O nível de significância considerado para a realização dos testes é escolhido
pelo pesquisador, sendo os valores mais comuns 5% e 1%. Isso implica na ocorrência de
múltiplos testes, o que leva a um nível de significância conjunto ou genômico (α*) do teste, o qual se apresenta crescente à medida que aumenta o número de testes realizados,
t ) 1 ( 1 * α α = − − , em que:
nível de significância conjunto (ou genômico);
= *
α
nível de significância para cada teste (individual);
=
α =
t número de testes realizados (ou número de marcadores, no caso).
Assim, quando fixamos 5% para cada teste (α =0,05) e realizamos, por exemplo, 100 testes (t=100), o nível de significância conjunto passa a ser α*=0,994079, ou seja, certamente seriam detectados inúmeros falsos positivos.
Uma alternativa para contornar tal problema é a utilização da correção de
Bonferroni (Rice 1989). Esta correção consiste em determinar o valor do nível de
significância individual (α) que proporcionará o nível de significância conjunto (α*) e, assim, contornar os problemas resultantes da realização de múltiplos testes. A fórmula
empregada no cálculo da correção é apresentada a seguir, sendo os termos desta os mesmos
já apresentados:
(
)
1 1 ln exp * + ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − − = t α αTais análises estatísticas permitem a eliminação dos marcadores distorcidos do
estudo de mapeamento, ou seja, descarte dos marcadores que não seguem as segregações
esperadas na população de mapeamento. Assim, quando dispomos de vários marcadores em
segregação em uma população, a primeira etapa consiste em testar a eventual ligação
existente entre eles, seja através do teste de aderência de χ2
, seja através do LOD score
construção dos grupos de ligação. A ordem dos marcadores dentro de cada grupo é
determinada em seguida através de uma análise de multiponto que se baseia geralmente no
método de máxima verossimilhança. Estas análises e a construção final do mapa podem ser
realizadas com o auxílio de programas especializados, como Mapmaker (Lander et al 1987)
e JoinMap (Stam 1993).
Considerando a teoria da ligação genética, os mapas genéticos podem ser elaborados
considerando-se a probabilidade de ocorrência de diferentes classes genotípicas, ou seja,
utilizando a frequência de recombinação existente entre dois locos.
A frequência de recombinação traduz o número de crossing-over produzidos entre
os dois marcadores durante a meiose. A relação entre a frequência de recombinação
(distância genética) e o número de nucleotídeos separando dois marcadores (distância
física) não é universal, podendo variar de um organismo para o outro. Pode igualmente
variar de um lugar para o outro do genoma de um mesmo organismo, como encontrado, por
exemplo, para o tomate (Ganal et al 1989), o arroz (Gustafson e Dillé 1992), o trigo (Chao
et al 1989) e para o milho (Dooner et al 1986).
A frequência de recombinação é traduzida em distância genética, cuja unidade de
medida é centiMorgan (cM). Esta conversão permite a análise dos eventos de recombinação
entre os marcadores, além de dispor de uma medida aditiva da distância. Existem várias
funções de mapeamento, que transformam a frequência de recombinação em distância
genética e determinam de diferentes maneiras a ocorrência real de crossing-over em função
da frequência de recombinação observada, levando ou não em consideração a interferência
(interação entre crossing-over). As mais utilizadas são as funções de Haldane (1919), que
assume não haver interferência, e de Kosambi (1944), que assume haver interferência entre
Em um mapa genético os cromossomos são representados por grupos de ligação,
sob os quais são dispostos os marcadores moleculares, cujas distâncias são expressas em
frequência de recombinação. Em poliplóides, os grupos de marcadores correspondentes aos
cromossomos são denominados grupos de co-segregação, enquanto que o termo grupo de
homologia designa o conjunto de grupos de co-segregação de uma classe de homologia.
O número de marcadores necessários para construção de um mapa genético depende
do tamanho do genoma, do número de cromossomos e da frequência de recombinação
genética. Um mapa pode ser considerado completo quando o número de grupos de ligação
obtido pela análise dos marcadores for igual ao número de cromossomos do organismo e,
também, quando todos os marcadores mapeados estiverem ligados, indicando que todas as
regiões do genoma estão representadas (Guimarães e Moreira 1999a).