The next generation
sequencing
Cesar Martins (cmartins@ibb.unesp.br) Departamento de Morfologia
Instituto de Biociências , UNESP Universidade Estadual Paulista Botucatu, SP
Sequenciamento de próxima geração
1 - melhor custo-benefício para projetos de alta demanda de dados; 2 custo por bp muito menor;
3 sequenciamento muito mais rápido e eficiente (> 40 Gbase/corrida). 4 versatilidade Genomas, expressão gênica, diagnóstico, gen. população, epigenética, metagenômica, entre outros
Análise genômica 2013
The next generation technologies
Roche 454
Solid
Illumina/Solexa
Ion Torrent
PacBio
Nanopore
Sequenciamento de
segunda geração
Sequenciamento de
terceira geração
Sequenciamento de
quarta geração
5.292,39 0,09 -500,00 500,00 1.500,00 2.500,00 3.500,00 4.500,00 5.500,00 Se pte m be r-2001 Mar ch -2002 Se pte m be r-2002 Mar ch -2003 O cto be r-2003 Ja nu ar y-2004 Apr il-2004 Ju ly -2004 O cto be r-2004 Jan ua ry -2005 Apr il-2005 Jul y-2005 O cto be r-2005 Jan ua ry -2006 Apr il-2006 Jul y-2006 O cto be r-2006 Jan ua ry -2007 Apr il-2007 Jul y-2007 O cto be r-2007 Jan ua ry -2008 Ap ril -2008 Jul y-2008 O cto be r-2008 Jan ua ry -2009 Apr il-2009 Jul y-2009 O cto be r-2009 Jan ua ry -2010 Apr il-2010 Jul y-2010 O cto be r-2010 Jan ua ry -2011 Apr il-2011 Jul y-2011 Jan -2 01 2 (E ST ) http://genome.gov/splash.htm
CUSTO DO SEQUENCIAMENTO POR BASE
Roche 454 Illumina Solid e Helicos Análise genômica 2013 95.263.072 7.950 0 10.000.000 20.000.000 30.000.000 40.000.000 50.000.000 60.000.000 70.000.000 80.000.000 90.000.000 100.000.000 Se pt em be r-2001 Mar ch -2002 Se pte m be r-2002 Mar ch -2003 O cto be r-2003 Jan uar y-2004 Apr il-2004 Ju ly -2004 O cto be r-2004 Januar y-2005 Apr il-2005 Ju ly -2005 O cto be r-2005 Jan uar y-2006 Apr il-2006 Ju ly -2006 O cto be r-2006 Jan uar y-2007 Apr il-2007 Ju ly -2007 O cto be r-2007 Jan uar y-2008 Apr il-2008 Ju ly -2008 O cto be r-2008 Jan uar y-2009 Ap ril -2009 Ju ly -2009 O cto be r-2009 Jan uar y-2010 Apr il-2010 Ju ly -2010 O cto be r-2010 Jan uar y-2011 Apr il-2011 Jul y-2011 Jan -2 01 2 (E ST )
Genoma humano U$ 2 bi; ~3 bilhões bp; 11 anos; ~12X Genoma U$ 2.500,00; ~1 bilhão bp; alguns dias; ~40X
CUSTO DO SEQUENCIAMENTO POR GENOMA
http://genome.gov/splash.htm
Roche 454 Illumina
e on DNA sequencing t echnology. Nat ur e, 2011.
Mardis. Science 2011 100 Gbase
Análise genômica 2013
Kahn SD. Science 2011
Análise genômica 2013
Genoma humano - ~3 bilhões x 1= ~800 Alberts, 10 anos
Genoma da tilápia- ~1 bilhão x 40= ~40 bilhões = ~10.600 Alberts, alguns dias
Antes e hoje
Objetivo rastrear as variações genéticas em populações humanas
Objetivo gerar conhecimento sobre o genoma de câncer com o intuito de gerar tratamentos e diagnósticos
Hoje
Análise genômica 2013
Objetivo analisar o genoma de 10 mil espécies de vertebrados
Hoje
Objetivo analisar o genoma de 5 mil espécies de insetos e outros artrópodos
Maiores problemas dos
sequenciamentos em
larga escala!!!
Estocagem Montagem Análise Análise genômica 2013454 Roche
Vídeo http://www.wellcome.ac.uk/Education- resources/Teaching-and-education/Animations/DNA/WTX056046.htm
Illumina
Vídeo http://www.wellcome.ac.uk/Education- resources/Teaching-and-education/Animations/DNA/WTX056051.htm
Sequenciamento de
segunda geração
Roche 454
Solid
Illumina/Solexa
Ion Torrent
Análise genômica 2013 2004-2005Roche 454 Life science
Utiliza tecnologia de pirosequenciamento - 1986
Análise genômica 2013
Princípio
Mecanismo do
Pirosequenciamento
ATP-sulfurilase Conversão PPi ATP
Luciferase Usa ATP p/ converter luciferina oxyluciferina =
LUZ
Apirase degrada os ATPs e nucleotideos livresZhou et al., 2010. Protein Cell http://www.youtube.com/watch?v=bFNjxKHP8Jc http://www.youtube.com/watch?v=JNqXgLKOzKU Biotin tag Streptavidin Análise genômica 2013
Análise genômica 2013
Amplificação maciça utilizando
uma emulsão com milhares de
beads de agarose, com primers
ancoradores aos adapt. A reação
de PCR é realizada e o sequen.
ocorre na placa PTP (picotite
plate).
Roche GS FLX System
12
Análise genômica 2013SOLiD
Life Technologies
Emulsion PCR 13 2 Overview of Sequencing Technology Platformswhich the sequencing reactions begin. These high-throughput sequencing systems,
with the exception of PacBio RS, require
cation of the sequencing library
DNA to form spatially distinct and detectable sequencing features (Fig.
2.3
).
cation can be performed in situ, in emulsion or in solution to generate
clus-ters of clonal DNA copies. Sequencing is performed using either DNA polymerase
synthesis for uorescent nucleotides or the ligation of uorescent oligonucleotides
Fig. 2.3 Generation of sequencing features. High-throughput sequencing systems have taken
different approaches in the generation of the detectable sequencing features. ( a ) Emulsion PCR is applied in the GS FLX and SOLiD systems. Single enrichment bead and sequencing library fragment are ed inside an aqueous reaction bubble. PCR is then applied to populate the surface of the bead by clonal copies of the template. Beads with immobilized clonal DNA collections are deposited onto a Picotiter plate (GS FLX) or on a glass slide (SOLiD). ( b ) Bridge-PCR is used to generate the in situ clusters of ed sequencing library fragments on a solid support. Immobilized cation primers are used in the process. ( c ) Rolling circle cation is used to generate long stretches of DNA that fold into nanoballs that are arrayed in the CGA technology. ( d ) Biotinylated DNA polymerase binds to bubble adapted template in the PacBio RS system. Polymerase/template complex is immobilized on the bottom of a zero mode w ave guide (ZMW)
P1andP2 adaptors http://gtc.soe.ucsc.edu/content/solid-technology-overview
SOLiD
Life Technologies
Análise genômica 2013Análise genômica 2013
Comparando metodologias
454, Solid
Illumina
Análise genômica 2013
Não utiliza scaner e câmeras
Análise genômica 2013
1 dNTP de cada vez
ñ utiliza nucleotídeos modificados e cascatas enzimáticas ñ utiliza detecção óptica (fluorescência e
quimioluminescência)
Chip: Array of microwells
DETECÇÃO DO SINAL
Chip: Array of microwells
ISFET IonSensitiveField-EffectTransistor
http://www.youtube.com/user/iontorrent
DETECÇÃO DO SINAL
Análise genômica 2013
PacBio RS sequencer
Nanopore
Sequenciamento de quarta
geração
Constituintes Principais
Camada lipídica
Análise genômica 2013Constituintes Principais
Exonuclease
Análise genômica 2013Oxford Nanopore
Technologies, based in Oxford, UK expects to start selling its new machine in the second half of this year and also plans to launch the
sequencer the MinION which
will retail for less than US$900.
Plataf. Comp (bp) Tempo de corrida (dias)
Gb por corrida Prós Contras
FLX
500-1kb 0,35 0,45 Reads longos; agilidade
Alto custo dos reagentes; alto erro *Illumina 100-150 9 35 Plataforma mais
utilizada
Baixa capacidade multiplexar amostras SOLiD 3 50 14 50 Sistema de correção
de erros
Demora na corrida PacificBioscience 3-20kb ? ? Reads mais longos Alto erro Nanopore 100kb 15 min ? Reads mais longos Alto erro
* HiSeq2000 gera um output com 600 Gb por corrida. Maior output atual.
Análise genômica 2013
...5ª geração, quando
será que sai??!!
Sequenciamento de próxima geração, 2ª, 3ª, 4ª geração!!!! AHHHHHH...
Assim eu não aguento!!!
Análise genômica 2013
08-11 de Julho de 2013
Instituto de Biociências, UNESP, Botucatu, SP Curso de Férias