Apesar de todos os desenvolvimentos recentes, existe uma necessidade de tecnologias que permitam genotipar polimorfismos de sequência em paralelo e em larga escala, ou seja, grandes números de amostras a custos muito reduzidos por genótipo e com elevada robustez analítica. No caso de plantas cultivadas, tecnologias que consolidem todos estes atributos teriam diversas aplicações imediatas e permitiriam a efetiva integração de tecnologias genômicas em procedimentos operacionais de melhoramento genético, estudos de diversidade e distância genética, introgressão de alta precisão de segmentos genômicos, mapeamento genético de alta resolução e genética de associação.
A metodologia DArT (Diversity Arrays Technology) foi desenvolvida para atender várias das limitações de outros métodos. Descrita dez anos atrás (Jaccoud, Peng et al. 2001), apresenta uma série de vantagens que complementam com eficiência as metodologias de análise de polimorfismo ora em utilização, tais como microssatélites, AFLP e SNP. A metodologia DArT envolve tres etapas: 1) Construção de uma biblioteca (representação genômica), a qual reune o DNA genômico total de um grupo de diversos indivíduos que representem o germoplasma de interesse. Este DNA é submetido a um processo de redução da complexidade por meio de corte com enzimas de restrição, as quais reconhecem e cortam preferencialmente em regiões hipometiladas do DNA. As representações genômicas obtidas a partir do pool de DNA são clonadas, criando bibliotecas de insertos individuais, os quais são imobilizados sobre um microarranjo geralmente denominado de "descoberta", pois tem por objetivo permitir a seleção de fragmentos que revelem polimorfismo de sequência. 2) Genotipagem das amostras, na qual o DNA das amostras individuais de estudo ou targets e suas replicas (30%) é cortado com a mesma combinaçao de enzimas de restrição, com o objetivo de gerar a mesma redução de complexidade utilizada anteriormente para o desenvolvimento das bibliotecas, posteriormente os fragmentos
21
obtidos são amplificados via PCR. As replicadas são geradas para poder estabelecer o nível de reprodutibilidade do experimento por meio da homologia dos dados. Os fragmentos são marcados com fluorescência, hibridizados sobre o arranjo de descoberta e submetidos num processo de lavagem para, finalmente, serem escaneados para a detecção dos sinais fluorescentes (Figura 1). 3) Análise de dados, os fragmentos polimórficos detectados mostram sinais de hibridização variáveis entre diferentes indivíduos. Quando a relação de sinal target/referência é similar em todos os slides, os fragmentos são considerados monomórficos, enquanto que se dois clusters (alelos) são distinguidos e a variância da intensidade relativa entre eles é de pelo menos 80% da variância total, os clones são considerados polimórficos e genotipados de forma binaria como “0” ou “1”. A capacidade do software de posicionar o sinal em um dos clusters (0 ou 1) é medida pela qualidade do marcador (Q) (Figura 1). Quando a diferencia da intensidade do sinal não é suficiente para poder posicionar os clones dentro de um dos dois cluster, estes são considerados como dados faltantes. A porcentagem de genótipos que são chamados de “0” ou “1” para cada clone em todos os targets é representado pelo parâmetro Call Rate (Sansaloni et al., 2010). Estas etapas da técnica estão padronizadas, embora possam precisar de pequenas modificações dependendo da espécie alvo.
O método baseia-se na hibridização de DNA com sondas relativamente longas (300-500 pb) derivadas de regiões de baixo número de cópias. A metodologia DArT, normalmente, fornece sinal consistente mesmo entre espécies relacionadas, um recurso especialmente valioso em Eucalyptus. Os clones de DNA que compõem o arranjo podem ser sequenciados e as sequências compartilhadas e usadas como marcadores âncoras robustos para mapeamentos de QTL comparativos ou para explorar o genoma referência em projetos de clonagem posicional. DArT fornece uma plataforma de genotipagem padronizada de alto rendimento através de milhares de marcadores, milhares de amostras podem ser facilmente testadas em paralelo.
A tecnologia DArT vem sendo amplamente utilizada nos últimos anos em mais de 60 espécies de plantas, incluindo espécies florestais como Eucalyptus (Sansaloni, Petroli et al. 2010) e Pinus (Alves-Freitas, Kilian et al. 2010). Devido aos diferentes aperfeiçoamentos na robustez e reprodutibilidade, esta técnica tem se revelado
22
altamente interessante para diversas aplicações, desde a análise de variabilidade genética em populações, mapeamento genético de alta densidade e em apoio a projetos de montagem de genomas. Entretanto, a maior vantagem desta classe de marcadores é a rapidez de genotipagem e o custo reduzido por genótipo (data point), o que torna esta tecnologia útil para a efetiva aplicação em procedimentos operacionais de seleção assistida por marcadores.
O primeiro microarranjo de genotipagem DArT para Eucalyptus com 7.680 marcadores foi desenvolvido, demonstrando seu potencial para a análise da diversidade e estudos de mapeamento de ligação em espécies do gênero (Sansaloni, Petroli et al. 2010). Recentemente, o microarranjo DArT para Eucalyptus tem demonstrado ser muito útil na diferenciação de espécies, identificação de híbridos interespecíficos e resolução de disjunções biogeográficas entre espécies (Steane, Nicolle et al. 2011). Este mesmo microarranjo já foi utilizado na construção de alguns mapas genéticos, demonstrando um alto grau de sintenia e colinearidade entre populações de Eucalyptus (Hudson, Kullan et al. 2011; Kullan, van Dyk et al. 2012).
23
Figura 1: Procedimento de desenvolvimento de marcadores DArT. Na primeira etapa é
construída a biblioteca genômica posteriormente impressa no microarranjo. Na segunda etapa, a progênie de uma população segregante ou indivíduos para estudos de diversidade são genotipados por meio da hibridação da representação genômica (i.e. amostra tecnicamente denominada “target” na metodologia DArT) sobre os slides (i.e. microarranjo). Software específico identifica clones polimórficos que são marcados como presente (1) ou ausente (0) na representação genômica.
24 1 1 0 0 -1.5 -1 -0.5 0 0.5 1 -1.5 -0.5 0.5 1.5 log (sin al do targe t/sin al da referê ncia ) -1 -0.5 0 0.5 1 1.5 log (target/ref.) Q = 50% Q = 95% polimórfico monomórfico
0
1
Probabilidade de cada clone individual pertencer a um cluster Aplicação de parâmetros de qualidade para filtrar clones Aceito RejeitoFigura 2. Interpretação de dados calculado pelo programa DArTSoft mostrando a diferença
de intensidade entre genótipos. À esquerda, os gráficos mostram o log (sinal do taget/sinal da referência), quanto maior é a diferença de intensidade entre clusters (Q=95%), maior é o polimorfismo dos marcadores. Se a intensidade é homogênea (Q<50%), os marcadores são monomórficos. À direita está exemplificada a diferença de intensidades entre amostras representadas como ausência (0) e presença (1).