Ivan G. Costa Filho
igcf@cin.ufpe.br
Centro de Informática
Universidade Federal de Pernambuco
Medição de Expressão Gênica
Microarrays
Tópicos
• Medição de Expressão Gênica
– metodos mais usados
• Microarrays
– Funcionamento básico
– Pipeline experimental
– plataformas
• cDNA e Affymetrix
http://www.cin.ufpe.br/~igcf/aeg.html
Métodos de Medição
• SAGE/RNA Seq
– Pros: precisão
– Contras: custo (tempo)
• RT-PCR, Northen Blot
– Pros: alta precisão
– Contras: baixa escala, custo
• Microarrays (cDNA e Oligoarrays)
– Pros: larga escala, baixo-custo
– Contras: ruído
SAGE – Serial Analysis of
Gene Expression
• separar celulas
• mRNA → cDNA
• cortar cDNA com enzima
• tagging
• ligar tags
SAGE – Serial Analysis of
Gene Expression
• Características:
– não é preciso conhecer genes
– exato – quantas copias de RNA em
uma celular
– requer poucas celulas
– custo (financeiro,tempo e pessoal)
– Novas tecnologias -
Northern Blotting
• Baseado no uso de enzima
de restricições e gels de
agarose
• Características:
– exato, baixa escala,
custo (tempo)
• Usado na validação de
experimentos
Microarrays
Microarrays
• Características:
– alta escala (genomas
completos)
– custo baixo (tempo,
financeiro)
Microarray
Microarrays - Etapas
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
1 Qual a hipotese biológica a
ser explorada?
2 Que sondas devem estar no
array? Qual plataforma?
3 Escanear array; Medir
expressão de cada gene;
4 Análise dos dados;
Classificação e Agrupamento
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Desenho
Experimental
Design do
microarray
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Aquisição e
processamento dos dados
Análise (alto nivel)
dos dados
Design Experimental (1)
• Qual o objetivo do experimento
biológico?
– enteder processos celulares
• expressão em relação ao tempo
– diagnóstico de cancer
• expressão de diversos pacientes e tipos de
câncer
– desenvolvimento de drogas
• expressão de uma celula de acordo com
varias dosagens/tipos de medicamento
Design Experimental (2)
• Medir replicações de condições medidas
– replica técnica
•usa mesmo material biológico
•reduzir efeitos de ruído
– Replica biologica
•usa diversos materiais biológicos
(em mesmas condições)
Design do Microarray (1)
• Definir sondas no microarray
– devem ser especifica de um gene <70%
de similaridde (cross-hidridization)
– tamanho de 50-70 bases
– não devem ter extrutura secundaria
– baixo conteudo de CG
Design do Microarray (2)
• Uso de multiplas sondas por gene
– evitar ruidos
• São especificos do organismo e estudo
• i.e. incluir apenas genes de interesse de
cancer, imunologia
• Plataformas Comerciais
Aquisição e Processamento
de Dados
• Extração dos valores de
expressão
– identificação do spot
– calcular intesidade do
sinal
– normalizar valores
entre arrays
– detecção de ruidos
Cond A
Cond B
Cond C
Gene 1
1,1
0,1
1,5
Gene 2
3,1
3,4
2,1
Gene 3
2,2
1,9
3
...
...
...
B
C
B
C
A
Analise Dados
(alto nivel)
• Extração de
informação
– expressão
diferencial
– classificação
– agrupamento
– ...
Microarrays Plataformas
cDNA array
Affymetrix Chip
Affymetrix Chip
Agilent
• Cada plataforma tem suas caracteristicas
– costumização, preço, padronização,
cDNA
cDNA Microarray
• Confecção: uso de um robô para
depositar sondas em um vidro
• Requer design do array e equipamentos
in house
• Características: barato, requer trabalho
inicial, customização
cDNA Microarray
Confecção
• Bancos de clones com
as sequencias das
sondas
• Sondas tem sequencias
de 400-1000 bases
• Uma sonda por gene
• ~12.000 por chip
• Processo de
amplificacao pode gerar
contaminação
cDNA Microarray
Experimento
• Requer sempre 2
amostras (referencia e
controle)
• Cada amostra é
marcada com verde
(Cy3) ou vermelho (Cy5)
• Retorna apenas
expressao relativa (Cy5/
Cy3)
verde
(cy5)
vermelho
(cy3)
cDNA Leitura - Exemplo
• Imagen é dividida em 2
canais (verde e vermelho)
• Grid é usado para
identificar sondas
• Mediana da intesidade de
cada circulo
• Expresão final é dada por
– log(cy3/cy5)
200
50
Affymetrix
Microarray
• Confecção: uso de um processo de
litografia
• Tecnologia Comercial
• Plataformas de arrays já definidas:
– Human U133, Mouse 430, ...
• Características: barato, não requer
design, padronização
Affymetrix
Affymetrix
Confecção (2)
• Confecção das
mascaras é caro
• Escolha das sondas é
feita de forma a
minimizar o numero de
mascaras
• Sondas vizinhas podem
se contaminar
Affymetrix
Confecção (3)
• Sondas tem de 20 a 25
bases
• 20 sondas por genes
(PF perfect match)
• Para cada uma sonda
mismatch (MM)
– uma base distinta
– vizinho a sonda PM
Affymetrix
Experimento
• Marcador radiotivo
• Mede uma amostra por
vez
• Razao pode ser obtida a
partir do desenho
Affymetrix
Leitura
• Grid quadrado é
usado para marcar
sondas
• Expressao absoluta
do gene
PM
PM
MM
PM
PM
PM
PM
1
= 300
PM
1
= 0
PM
2
= 2000
PM
2
= 100
Affymetrix X cDNA
• Padronização X Customização
• Custo Inicial:
– Baixo X Caro
• Custo de Larga Escala:
– Medio X Baixo
• Qualidade
Biologia In Silico - Centro de Informática - UFPE