• Nenhum resultado encontrado

4.6. PROCEDIMENTOS E ANÁLISES MOLECULARES

4.6.3. Sequenciamento de Nova Geração (NGS, Next Generation Sequencing)

Nos últimos anos, com o desenvolvimento de novas tecnologias, inovadoras formas de sequenciamento do material genético têm surgido.

O sequenciamento de nova geração tem proporcionado, a partir de diferentes plataformas, uma revolução no sequenciamento do DNA. Uma única reação pode gerar uma gigantesca quantidade de informações sobre milhões de pares de bases de forma rápida e precisa, devido ao desenvolvimento da clonagem in vitro e de sistemas de suporte sólido (chips) para as unidades de sequenciamento (CARVALHO; SILVA, 2010).

Entretanto, a velocidade com que os dados são obtidos é diretamente proporcional ao volume de informações geradas o que estabelece uma nova limitação referente à capacidade de armazenamento, processamento e interpretação das informações obtidas.

4.6.3.1. Plataforma SOLiD™ (Sequencing by Oligonucleotide Ligation and Detection) – Sequenciamento Exômico Completo (Whole exome sequencing)

Tendo em vista a identificação de possíveis genes candidatos localizados na região previamente delimitada pela análise de ligação (região alvo) e, também considerando a sua grande extensão, o uso do sequenciamento de nova geração buscou identificar de forma rápida, possíveis variações relacionadas ao fenótipo.

O sequenciamento foi realizado utilizando-se o Sistema SOLiD™ 5500xl (Applied Biosystems®) a partir da criação de uma biblioteca genômica com o kit SureSelectXT Human All Exon V4+UTRs (Agilent Technologies®) o qual permitiu a captura das sequências exônicas, 5´UTRs (região 5´ não traduzida - untranslated 5` region) e 3`UTRs (região 3´ não traduzida - untranslated 3` region) em todo genoma. A partir da aquisição dos dados de sequenciamento de todos os éxons no genoma, a região alvo foi selecionada e, analisada utilizando-se de ferramentas de bioinformática.

4.6.3.1.1. Preparação da biblioteca genômica

Informações detalhadas referentes aos procedimentos quanto à preparação das bibliotecas com o uso do kit SureSelect XT (Agilent Technologies®) específico para a Plataforma SOLiD™ 5500 (Applied Biosystems®) estão disponíveis em http:// www.chem.agilent.com/ Library/usermanuals/Public/G7530-90004_SureSelect_SOLiD 5500Multiplexed.pdf. A figura 4 representa esquematicamente, os procedimentos envolvidos nas etapas de preparação da biblioteca.

Figura 4. Esquema representando a sequência de etapas para a montagem da biblioteca genômica.

4.6.3.1.2. PCR em Emulsão e Sequenciamento

Partindo-se de 50ul [500pM] de cada uma das bibliotecas, essas foram misturadas em frações equimolares e emulsionadas, com a utilização do kit SOLiD™ EZ Bead™ Emulsifier E80 (Applied Biosystems®) em uma mistura de água e óleo contendo reagentes de PCR (PCR em emulsão) para a amplificação clonal dos fragmentos de fita simples (bibliotecas).

Diluição das amostras para o início do sequenciamento

Avaliação da qualidade do DNA e quantidade de cada código de barras da biblioteca

Amplificação das sequências alvo selecionadas e adição do código de barras (SureSelectXT Barcode for SOLiD™ ) Seleção das sequências alvo específicas (hibridizadas)

com o uso de esferas magnéticas com estreptavidina Hibridização da biblioteca (tampões especificos +

biblioteca de RNA marcada (biotinilada) de alta especificidade

Amplificação por PCR da biblioteca com os adaptadores ligados

Adição de adaptadores específicos (LT5500) para a Plataforma SOLiD™ 5500

Procedimentos para o reparo das extremidades 5´ e 3´ dos fragmentos de DNA

DNA fragmentado (Fragmentos de 150pb a 200pb)

DNA genômico Fragmentação do DNA

por sonicação (Covaris™)

Purificação por esferas magnética; Qualidade e quantidade de DNA (Agilent2100 Bioanalyzer/DNA 1000

Bioanalyzer Assay)

Purificação por esferas magnética

Purificação por esferas magnética

Purificação por esferas magnética; Qualidade e quantidade de DNA (Agilent2100 Bioanalyzer/DNA 1000

Bioanalyzer Assay)

Purificação por esferas magnética

Qualidade e quantidade de DNA (Agilent2100 Bioanalyzer/Hight

Sensitivity DNA kit) Quantificação do código de barras por qPCR (ViiA™ 7 Real-Time PCR System

- Applied Biosystems® )

A mistura de óleo e água é responsável pela formação de pequenas micelas, chamadas de microrreatores, que captam as microesferas metálicas. Desta maneira, cada micela produzirá muitas cópias idênticas de um mesmo fragmento isoladamente, a partir de um microssuporte (DRESSMAN et al., 2003) e que representarão, em conjunto, a sequência alvo completa.

Após o isolamento das microesferas ligadas aos fragmentos de fita simples (moldes), essas foram depositadas numa placa de sílica à qual estão ligadas covalentemente - SOLiD® ChiP-Seq kit (Applied Biosystems®). Uma vez no equipamento, aos moldes ligados às microesferas foram combinados com iniciadores universais para os adaptadores, com a enzima ligase e com sondas, iniciando assim ciclos de ligação, detecção do sinal da fluorescência e clivagem (METZKER, 2010) e, portanto, o sequenciamento.

4.6.3.1.3. Processamento dos dados de sequenciamento

A sequência de sinais (cores) e, portanto a sequência de bases, foram interpretadas e ordenadas utilizando o programa LifeScope™ Genomic Analysis v.2.5.1 (Applied Biosystems®) a partir do uso dos dados da sequência de referência humana - fevereiro/2009 (GRCh37/hg19) produzida pelo Genome Reference Consortium e disponibilizada pelo UCSC Genome Browser (disponível em: http://genome.ucsc.edu/cgi-bin/hgGateway).

As variações SNVs (Single Nucleotide Variants) e indels (inserções e deleções) foram identificadas pelo módulo diBayes (algoritmo para detecção de variações) do programa LifeScope™ Genomic Analysis v.2.5.1 (Applied Biosystems®).

O banco de dados gerado pelo LifeScope™ Genomic Analysis v.2.5.1 (Applied Biosystems®) foi utilizado pelo programa ANNOVAR (WANG; LI; HAKONARSON, 2010) (disponível em: http://www.openbioinformatics.org/annovar/) para a identificação de potenciais variações envolvidas com o fenótipo.

O programa ANNOVAR (WANG et al., 2010) é uma poderosa ferramenta de bioinformática, atualizada diariamente, com informações integradas sobre as variações genéticas detectadas em diversos genomas estudados por sequenciamento de nova geração. Dentre as informações que podem ser obtidas pelo programa ANNOVAR (WANG et al., 2010) destacam-se:

x Posição de início e término das variações;

x Sequências nucleotídica de referência e, observada;

x Informações sobre os genes envolvidos (nome do gene, número do éxon, número do íntron, por exemplo);

x Classificação da variação – mutação silenciosa, mutação com perda de sentido, mutação sem sentido, deleção ou inserção;

x Quanto à troca de aminoácido – integrado por informações fornecidas pelos programas de previsão dos efeitos funcionais da proteína no organismo como SIFT score (NG; HENIKOFF, 2003), PolyPhen score (RAMENSKY; BORK; SUNYAEV, 2002), LRT score (DONIGER; FAY, 2007), Mutation Taster score (SCHWARZ et al., 2010);

x Quanto ao grau de conservação em diversos organismos - integrado por programas como PhyloP conservation score (SIEPEL; POLLARD; HAUSSLER, 2006); GERP++ conservaton score (COOPER, G. M. et al., 2005);

x Banco de dados de SNPs (The Single Nucleotide Polymorphism database – dbSNP) (disponível em: http://www.ncbi.nlm.nih.gov/ projects/ SNP/); x Frequências alélicas a partir dos bancos de dados de projetos - 1000

Genomes Project (disponível em: http://www.1000genomes.org/) e Exome Sequencing Project (ESP6500) (disponível em:

http://evs.gs.washington.edu/EVS/).

Por se tratar de um grande volume de informações, os dados processados tanto pelo LifeScope™ Genomic Analysis v.2.5.1 (Applied Biosystems®) quanto pelo programa ANNOVAR (WANG et al., 2010) foram combinados e organizados em um banco de dados utilizando o programa Filemaker®Pro 11 (FileMaker, Inc.).

Para a visualização gráfica das sequências dos fragmentos, da qualidade e localização das regiões cobertas, alinhamento de diferentes amostras, entre outras funções utilizou-se o programa IGV (Integrative Genomics Viewer) (ROBINSON et al., 2011). Arquivos (.bam), gerados pelo LifeScope™ Genomic Analysis v.2.5.1 (Applied Biosystems®), e arquivos (.bed) disponibilizados pelos SureSelectXT Human All Exon V4+UTRs kits (Agilent Technologies®) foram utilizados pelo programa IGV

(Integrative Genomics Viewer) (ROBINSON et al., 2011) para a construção integrada do mapa de cobertura do sequenciamento (APÊNDICE C).

Após o processamento dos dados de sequenciamento de nova geração, seleção (pós-filtragem dos dados) e identificação de potenciais SNVs, estas foram sequenciadas pelo método de Sanger (SANGER; NICKLEN; COULSON, 1977) com DNA genômico, para a confirmação ou não, das variações previamente identificadas. O desenho dos primers (APÊNDICE D), padronização das reações e análise das sequencias seguiram os mesmo procedimentos anteriormente descritos.

Documentos relacionados