• Nenhum resultado encontrado

Domínio

9.5. Imunoprecipitação da Cromatina

9.5.3. O experimento de ChIP-Seq

Nosso experimento piloto de ChIP-Seq foi realizado utilizando anticorpos para a RNA Pol II (ab5408) e IgG (Controle). Foi realizada 1 corrida na plataforma 454 (Roche) utilizando 2 gaskets. O experimento conduzido obteve 503.753 leituras para o controle IgG e 556.788 leituras para a RNA Polimerase II (e um total de 1.060.541), dentro do esperado para a plataforma de sequenciamento 454.

As leituras obtidas foram utilizadas para comparação utilizando BLASTN (corte de 1e-15) contra as bases de dados: shotgun cana do genoma da variedade SP80-3280, 105 BACs em um contig da cana variedade R570, Sorgo (Sbicolor_79) (Paterson et al., 2009), banco de sequências repetitivas (Ouyang and Buell, 2004) adicionado de uma database local organizada pelo laboratório da profa Marie-Anne Van Sluys, IB-USP) e um banco de contaminantes local (contendo os organismos

Agrobacterium radiobacter, Bacillus thuringiensis, Enterobacter sp., Escherichia coli, Flavobacterium johnsoniae, Gluconacetobacter diazotrophicus, Pseudomonas fluorescens, Saccharomyces cerevisiae, Xanthomonas axonopodis, Xanthomonas campestris, Xylella fastidiosa, Homo sapiens, Dictyostelium discoideum, Zea mays

18S small subunit ribosomal RNA gene, Platanus occidentalis internal transcribed spacer 1, 5.8S ribosomal RNA gene and internal transcribed spacer 2, complete sequence, Lambertia inermis 26S ribosomal RNA gene e Salmo salar). O projeto de sequenciamento do genoma do cultivar SP80-3280 está em andamento pelo grupo sendo que 10.8 Gb de sequências shotgun utilizando-se o 454 já foram obtidas. O grupo possui 21 mil contigs de até 6 kb de cDNAs completos (93% full lenght) e em colaboração com o grupo da Dra. Marie-Anne Van Sluys está finalizando o

CAP2. Resultados 142 sequenciamento de 300 BACs do cultivar R570 (com perspectivas de fechamento de 1000 BACs nos próximos 2 anos).

O alinhamento por BLAST dos contaminantes contra o ChIP-Seq da RNA Pol II mapeou 53.636 leituras (9,63 % do total de leituras da RNA Pol II), sendo que 49.713, ou 92,68% das leituras mapeadas, são de contaminações com sequências de humano. Já para o BLAST dos contaminantes contra o ChIP-Seq do IgG identificamos 117.787 leituras (23,38 % do total de leituras do IgG), sendo que 113.727, ou 96,55% deste total são de contaminações com sequências de humano. Se considerarmos as leituras mapeadas de ambos os experimentos, identificamos um total de 171.423 leituras correspondentes a possíveis contaminações (16,16 % do total de leituras obtidas), o que é um valor considerado alto.

O alinhamento por BLAST dos 105 BACs contra o ChIP-Seq da RNA Pol II identificou 162.089 leituras (29,11 % do total da RNA Pol II), sendo que do ChIP-Seq IgG identificou 119.876 sequências (23,80 % do total IgG).

O alinhamento por BLAST contra o shotgun do ChIP-Seq da RNA Pol II identificou 348.770 leituras (62,64 % do total RNA Pol II), sendo que do ChIP-Seq IgG identificamos 247.632 (49,16 % do total IgG).

O alinhamento por BLAST contra o sorgo do ChIP-Seq da RNA Pol II identificou 163.898 leituras (29,44 % do total RNA Pol II), sendo que do ChIP-Seq IgG identificamos 111.254 (22,09 % do total IgG).

O alinhamento por BLAST contra o Repeats do ChIP-Seq da RNA Pol II identificou 69.958 leituras (12,56 %), sendo que do ChIP-Seq IgG identificamos 53.528 leituras (10,63 %).

CAP2. Resultados 143

IgG RNA Pol II Total

Leituras totais 503753 556788 1060541 Contaminantes 117787 (23,38%) 53636 (9,63%) 171423 BACs 119876 (23,79) (29,11%) 162089 281965 Shotgun 247632 (49,16) (62,63%) 348770 596402 Sorgo 111254 (22,08) 163898 (29,43) 275152 Repeats (10,62) 53528 (12,56) 69958 123486 SCEN 145 143 288

Tabela 9.3. Mapeamento por BLASTN das leituras obtidas pelo ChIP-Seq nas base de dados utilizadas. Foi realizado um mapeamento utilizando o BLASTN com um cuttof de 1e-

15 contra as bases de dados locais shotgun, BACs, Contaminantes, Repeats, a região repetitiva controle SCEN e o genoma do sorgo. É importante ressaltar que os valores totais não levam em considerações as leituras que se repetem em outro mapeamento.

Algumas observações importantes podem ser comentadas nas leituras do ChIP-Seq IgG: Primeiro, quando comparamos as leituras que mapearam nos BACs com as que mapearam no shotgun, observamos que os BACs têm apenas 98 leituras exclusivas, o que evidencia que os dados de shotgun cobrem praticamente todos os dados dos BACs. Segundo, quando comparamos as leituras que mapearam em sorgo com as que mapearam em cana (BAC e shotgun), observamos que existem 1.234 leituras exclusivas de sorgo, o que nos mostra que os dados que temos disponível de cana cobrem praticamente todos os dados de sorgo. Terceiro, a comparação entre as leituras que mapearam em cana (shotgun/BACs) com as que mapearam nos contaminantes, identificou 110.919 leituras exclusivas dos contaminantes, e isto corresponde a 94.17% das leituras contaminantes, e isto evidencia que estas regiões são devido à contaminação do procedimento. Quarto, as leituras que mapearam nos Repeats que são únicas quando comparadas com as que mapearam em cana (shotgun/BACs) correspondem a 455, o que nos mostra

CAP2. Resultados 144 que apesar do cuidado que tivemos em nosso experimento, ainda estamos tendo a precipitação de regiões repetitivas.

Observações similares podem ser retiradas das leituras do ChIP-Seq RNA Pol II: Comparações entre as leituras que mapearam nos BACs com as que mapearam no shotgun nos mostraram que os BACs têm apenas 151 leituras exclusivas. Além disto, comparações das leituras que mapearam em sorgo com as que mapearam em cana (BAC e shotgun) evidenciaram 1.928 leituras exclusivas de sorgo. Outra comparação realizada entre as leituras que mapearam em cana (shotgun/BACs) com as que mapearam nos contaminantes, identificaram 48.337 leituras exclusivas dos contaminantes (90.12% das leituras). Já as leituras que mapearam nos Repeats que são únicas quando comparadas com as que mapearam em cana (shotgun/BACs) correspondem a 445.

Quando juntamos todas as leituras mapeadas nas databases, obtemos um total de 759.119 leituras mapeadas, ou seja, 71,58 % das sequências. As demais acreditamos que não foram mapeadas porque incluem erros de sequenciamento, sequências ainda desconhecidas em cana no genoma disponível até o momento ou contaminações não testadas. Um resumo dos dados anteriores está colocado está na tabela 9.4.

CAP2. Resultados 145

Shotgun BACs Shotgun/BACs Sorgo Repeats Contaminantes

Shotgun IgG 98 BACs IgG Shotgun/BACs IgG 1234 455 110919 (94.17%) Shotgun Pol II 151 BACs Pol II Shotgun/BACs Pol II 1928 445 48337 (90.12%)

Tabela 9.4. A tabela evidência as leituras exclusivas obtidas quando comparamos as databases. A tabela representa o número de leituras exclusivas dos dados colocados na

horizontal quando comparamos com os dados colocados na vertical. Por exemplo, quando comparamos as leituras obtidas pelo mapeamento do ChIP-Seq IgG nos BACs e no shotgun, identificamos que os BACs possuem apenas 98 leituras exclusivas, e que as demais, são comuns com o shotgun.