• Nenhum resultado encontrado

Uma característica intrigante acerca dos genomas eucarióticos é o fato de que os genes, que possuem maior significado funcional, ocupem apenas uma pequena fração do genoma. Já o DNA repetitivo ocupa a maior parte do genoma e determina a estrutura em larga escala dos cromossomos (Schmidt & Heslop-Harrison, 1998).

Neste trabalho, foi investigada a natureza do DNA repetitivo presente no subgenoma A de amendoim. O amendoim cultivado é um alotetraploide do tipo AB (Smartt et al., 1978; Smartt & Stalker, 1982). Em termos de investigação acerca da estrutura genômica de leguminosas, o amendoim pode ser considerado muito informativo, pois filogeneticamente, ele é um grupo separado da maioria das outras leguminosas de importância econômica (Lavin et al., 2001; Lewis et al., 2005). Além disso, o amendoim torna-se um importante objeto de estudo, em virtude dos componentes genômicos A e B proximamente relacionados. A partir de alguns estudos foi possível estimar a data de divergência entre esses dois componentes genômicos em 3 – 3,5 milhões de anos atrás (Nielen et al., 2012; Moretzsohn et al., 2013). Apenas muito recentemente eles se uniram por meio de um evento de poliploidização (Bertioli et al., 2011).

Em trabalhos anteriores, hibridizações in situ por fluorescência (FISH) feitas utilizando como sondas 27 clones BAC de Arachis duranensis, selecionados quanto à presença de genes, apresentaram sinais de hibridização dispersos principalmente nos cromossomos A de amendoim (Araújo et al., 2012). A observação do padrão difuso desses sinais foi semelhante ao observado quando retrotransposons identificados em Arachis foram utilizados como sondas (Nielen et al., 2010; 2012), sendo claramente diferentes de sinais pontuais obtidos para hibridização com sondas contendo o gene Ara h2 (alérgeno de amendoim) e Ara h 6 (relacionado à conglutina) em Arachis spp. (Laura Ramos et al., 2006). Essas observações indicaram que os sinais eram característicos de hibridização com sequências de DNA repetitivo, o que induziu a uma investigação da natureza e frequência desses elementos repetitivos em amendoim, assim como da especificidade pelo genoma por meio do sequenciamento de alguns clones BACs.

Foram utilizados os métodos Sanger e 454 para o sequenciamento desses clones. Para um clone específico, foram comparadas montagens obtidas por ambos os métodos. Apesar dos resultados do sequenciamento terem sido amplamente consistentes, algumas inversões e regiões de baixa complexidade (segmentos A/T e outros) foram detectadas nesse clone,

corroborando a grande dificuldade para gerar uma representação completamente correta de sequências genômicas que contêm elementos repetitivos e que utilizam essas tecnologias de sequenciamento (Kuhn et al., 2012). Em relação ao sequenciamento pela técnica Illumina (http://www.illumina.com/), que gera sequências de menor tamanho, esses problemas tendem a ser mais agudos. A montagem de sequências genômicas mais curtas, por exemplo, são muitas vezes realizadas a partir do descarte de sequências repetitivas, pois estas dificultam a montagem. Em contrapartida, sequências repetitivas perfazem a maior parte do genoma, o que torna complicado o estudo de forma mais abrangente.

Juntamente com a localização de sequências de cópias únicas (genes) pela técnica de FISH, mapeamento genético e sequenciamento do genoma, a localização de sequências repetitivas nos clones podem auxiliar o entendimento acerca dos processos evolutivos que ocorrem no genoma a longo, médio e curto prazo, além de proporcionar uma visão mais aprofundada acerca da organização em larga escala de sequências repetitivas específicas do genoma de amendoim.

No total, 1,26 Mb de sequência genômica derivadas de 12 regiões genômicas do genoma A de A. duranensis foram analisadas. Para identificar sequências repetitivas foram utilizadas plotagens, buscas por similaridade com sequências depositadas em bancos de dados e softwares como o LTR_FINDER. Plotagens comparativas utilizando as sequências dos clones BACs contra elas mesmas e umas contra as outras mostraram que todas essas sequências continham trechos repetitivos, indicando a presença de retrotransposons LTR. Foram identificados dez diferentes tipos de retrotransposons LTR completos nos clones BAC analisados: FIDEL e Matita, retrotransposons de amendoim já identificados (Nielen et al, 2010; 2012), e oito novos retrotransposons.

O elemento mais abundante, denominado Feral, apresentou alta similaridade com as sequências dos LTRs e na região 3' não traduzida de FIDEL, porém com uma grande diferença nas regiões de codificação e região 5' não traduzida. Além disso, enquanto FIDEL é um retrotransposon autônomo que codifica todas as proteínas essenciais para sua transposição, o retrotransposon Feral não codifica a enzima transcriptase reversa, portanto, é considerado como um elemento não-autônomo. Parece mais provável que Feral seja um parasita de FIDEL. Além de retroelementos completos, foram identificadas muitas sequências repetitivas fragmentadas, especialmente LTR-solos e sequências remanescentes de elementos de transposição. No total, os elementos completos e fragmentos derivados dos elementos

FIDEL e Feral compõem cerca de um sexto das regiões analisadas do genoma de A. duranensis.

O terceiro elemento mais frequente foi o retrotransposon Pipa. Este elemento não possui regiões que codificam proteínas conhecidas presentes em retrotransposons, o que provavelmente o tornou do tipo não-autônomo. No entanto, ele possui uma ORF com função desconhecida próxima a região do LTR 5’. Um retrotransposon autônomo com similaridade significativa à sequência de Pipa também foi identificado e chamado de Pipoka.

Uma característica interessante entre Feral e Pipa é que ambos codificam proteínas que são completamente diferentes daquelas codificadas por seus prováveis pares autônomos. Estudos anteriores demonstraram que os transposons de DNA e retrotransposons podem "capturar" sequências de genes (Alix et al., 2008) e a amplificação de tais sequências de codificação podem desempenhar um papel importante não só na amplificação de genes, mas também na divergência entre genomas. Embora não possamos atribuir qualquer significado biológico para os elementos não-autônomos descritos neste trabalho, torna-se evidente que Feral e Pipa não são derivados de seus pares autônomos simplesmente pela degradação mutacional e exclusão de partes de sequências. Eles provavelmente evoluíram por meio de mecanismos complexos ou atípicos para se tornarem elementos não-autônomos.

Outro elemento abundante, chamado de Gordo, possui repetições em tandem dentro de seus LTRs e também é do tipo não-autônomo. Retrotransposons menos abundantes e autônomos foram denominados de Curu (que tem LTRs excepcionalmente longos com 3448 pb), RE-128, Mico e Grilo.

Estes oito novos retrotransposons ocupam uma proporção surpreendente das regiões genômicas analisadas (1,26 Mb). FIDEL e Feral, juntamente com Pipa e Pipoka perfazem um quarto das sequências, e estes quatro, juntamente com Gordo e Curu, perfazem um terço.

A frequência de elementos repetitivos nos genomas deve ser analisada levando-se em conta o tipo de sequenciamento e as estratégias de montagem utilizadas, além do tamanho do genoma. A presença elevada de retrotransposons LTR de Classe I, observada no gênero Arachis nesse estudo, já havia sido documentada em muitas monocotiledôneas e dicotiledôneas, tais como Sorghum bicolor (55%), milho (79%), arroz (26%) (Paterson et al., 2009), Medicago truncatula (26,5%) (Medicago truncatula Genome Project), soja (42%) (Schmutz et al., 2010) e Lotus japonicus (19,23%) (Sato et al., 2008). Além disso, elementos não-autônomos abundantes e de origem recente, LTRs-solo e agrupamentos de retroelementos

dentro de outros, têm sido observados em outros genomas de plantas (Wawrzynski et al., 2008; Schmutz et al., 2010).

A evidência de que os componentes repetitivos presentes nas sequências genômicas A e B de Arachis têm divergido rapidamente é apoiada pela constatação de que os retrotransposons mais abundantes estão predominantemente localizados nos cromossomos de apenas um genoma (Nielen et al., 2010). É também corroborada pelo fato de que, quase todos os eventos de transposição determinados têm menos de 3,5 milhões de anos, que é a data estimada para a divergência evolutiva entre os genomas A e B (Nielen et al., 2012; Moretzsohn et al., 2013). No total, 14% das regiões sequenciadas do componente genômico A de A. duranensis está ocupada por retrotransposons completos inseridos a menos de 3,5 milhões de anos.

O padrão granular presente nos gráficos de plotagem são relativos à presença de sequências curtas com baixa complexidade que se acumulam numa escala de tempo evolucionário longa em virtude do “deslize” da DNA polimerase durante a replicação. Este padrão está ausente nos gráficos quando são observados os exons de genes, presumivelmente, porque mutações em exons tendem a ser eliminadas pela seleção natural. Esse padrão também está ausente nos retrotransposons completos e nas sequencias remanescentes, provavelmente em virtude de uma origem recente.

O software FGENESH previu muitos genes ao longo das sequências dos clones BAC analisados. Esses resultados foram corroborados pela comparação com sequências disponíveis no banco de dados do PfamA, sequências de proteínas de Arabidopsis ou soja e, com ESTs de Arachis, que forneceram fortes evidências da ocorrência de transcrição a partir de retrotransposons.

Caso não sejam identificados corretamente, os retrotransposons e suas sequências remanescentes podem tornar confusa a anotação do genoma de amendoim que está em andamento. Além disso, como observado por Wang et al. (2012), genes relacionados a retrotransposons podem ser anotados dentro da fração gênica, subestimando o conteúdo repetitivo do elemento no genoma.

Para as duas regiões homeólogas dos genomas A e B de Arachis que foram comparadas, as porções microssintênicas estão flanqueadas por regiões de DNA repetitivo que eram completamente diferentes nos genomas A e B. Em ambos os casos, dentro das regiões microssintênicas, existem segmentos altamente conservados (com aproximadamente 95% de

identidade), pontuados por segmentos sem homologia significativa. Possivelmente estes segmentos pertenciam a uma classe repetitiva.

Esses dados indicam o papel fundamental de DNA repetitivo na erosão de similaridade de sequência desde a divergência estrutural dos genomas A e B. Esta divergência não é distribuída uniformemente, e sim concentrada principalmente nas regiões intergênicas. Portanto, as sequências dos genes e a ordem entre eles permanecem altamente conservadas. Isso fornece uma solução para o aparente paradoxo da dinâmica entre elementos repetitivos e a conservação das frações gênicas na estrutura de genomas.

No documento Estudo dos genomas A e B de Arachis (páginas 85-90)

Documentos relacionados