• Nenhum resultado encontrado

Pré-processamento e Normalização de Microarrays

N/A
N/A
Protected

Academic year: 2021

Share "Pré-processamento e Normalização de Microarrays"

Copied!
52
0
0

Texto

(1)

Ivan G. Costa Filho

igcf@cin.ufpe.br

Centro de Informática

Universidade Federal de Pernambuco

Pré-processamento e

(2)

Tópicos

• Microarrays e Ruídos

• Aquisição dos dados de microarray

– análise da imagem

– medição da expressão

• Pré-processamento e normalização

– normalização dos dados

(3)

Aquisição e Processamento

de Dados

• Extração dos valores de

expressão

– identificação do spot

– calcular intensidade

do sinal

– normalizar valores

entre arrays

– detecção de ruídos

Cond A

Cond B

Cond C

Gene 1

-1,1

0,1

1,5

Gene 2

3,1

3,4

2,1

Gene 3

-2,2

-1,9

-3

...

...

...

B

C

B

C

A

(4)

Fontes de Variabilidade (1)

• Sistemáticos

– quantidade total de RNA

– transcriptase reversa

– etiquetagem (label)

– processo de escaneamento da imagem

• Efeitos similares em muitos dados

(5)

Fontes de Variabilidade (2)

• Estocásticos

– defeito em sondas

– deficiência do processo de detecção de

spots

– cross-hibridização ou hibridização não

específica

• Efeitos específico de cada sonda

– requerer modelos ruído

(6)
(7)

Conceitos Basicos

R

uid

o

P

ou

co

R

uid

o

(8)

Processamento de

Imagem

(9)

Processamento de

Imagem

• Arquivo GAL identifica o

posicionamento das sondas

– especifico da plataforma

• Processamento

(10)

Processamento de

Imagem

• Arquivo GAL identifica o

posicionamento das sondas

– especifico da plataforma

• Processamento

(11)

Processamento de

Imagem

• Arquivo GAL identifica o

posicionamento das sondas

– especifico da plataforma

• Processamento

– Posicionamento dos grids

– Identificação dos spots

(12)

Identificação Spots

• Identificar bordas

• Custoso, boa detecção

• Centralizar círculos

• Simples, baixa

(13)
(14)

Valor do Spot

Saturação

• Calibragem do scanner pode levar

muitos pixels a ter valores máximos

– 16bits – 65,535

• Mediana resolve com poucos pontos

saturados

(15)

verde

(cy5)

vermelho

(cy3)

cDNA Leitura - Exemplo

• Imagem é dividida em 2

canais (verde e vermelho)

• Mediana da intensidade de

cada circulo

• Expressão final é dada por

– cy3

mediana

/cy5

mediana

200

50

(16)

Detecção de Background

• Problemas:

– falha na lavagem do

array, luminosidade,

hibridização não

específica

• Uso de intensidade local

como sinal de

(17)

verde

(cy5)

vermelho

(cy3)

cDNA Leitura - Exemplo

• Imagem é dividida em 2

canais (verde e vermelho)

• Inclusão de background na

medida

• Expressão final é dada por

– (cy3

sinal

-cy3

background

)/

(cy5

sinal

-cy5

background

)

200

50

(18)

Leitura Affymetrix

Exemplo

• Grid quadrado é

usado para marcar

sondas

• Expressão absoluta

do gene

PM

PM

MM

PM

PM

PM

PM

1

= 300

PM

1

= 0

PM

2

= 2000

PM

2

= 100

(19)

Leitura Affymetrix

Exemplo

• Expressão absoluta

do gene

• Formula original

pode gerar valores

negativos

PM

PM

MM

PM

PM

PM

PM

1

= 300

PM

1

= 0

PM

2

= 2000

PM

2

= 100

Avg. diff =

j∈ A

w

j

PM

j

MM

j

A∣

j∈ A

w

j

1if PM

MM

0

(20)

Qualidade de Leitura

• u

• Fontes de ruído

– Defeito de fabricação, distribuição, erro no

processo de identificação do spot, bolha de

ar, poeira, cabelo, buracos negros

• Qualidade do spot:

– Luminosidade: razão do sinal/background

– Uniformidade: variação da intensidade do

pixel

(21)

Qualidade de Leitura

• u

• Ações:

– Definir valores como NA (missing values)

•i.e.

(cy3

sinal

-cy3

background

) < c

– normalização locais para reduzir problemas

como poeira

– usar indicadores de qualidade em estágios

posteriores da análise.

(22)
(23)
(24)
(25)
(26)

Normalização

e

x

p

re

ss

ã

o

(27)

Normalização

• Problemas

– Intensidade dos canais, calibragem do

scanner, ...

• Princípios básicos

– a maioria dos genes medidos mantem

mesma expressão

– a quantidade total de RNA

apresentado é igual

(28)

Normalização

Localização

Corrigir viés

espacial

Escala

igualar

variabilidade

Os microarrays devem

{

(29)

Normalização

Escalonamento

Rescalonamento

Mediana é usada por

ser mais robusto

Todos arrays tem a

mesma localização

(30)

Normalização

Escalonamento (2)

Como medir o fator de escalonamento?

todos os genes

genes house-keeping

controles spike-in

Correção do Background

global - Usar 5% percentile

Local - ???

(31)

Controle de Qualidade

Swirl data

log(red)/log(gre

en)

(32)
(33)
(34)
(35)

Escalonamento

Problemas

Scatter Plot MA Plot

(36)

Normalização Loess

Existe um viés

dependente da

intensidade

Viés = f(x)

e

med

= f(x) + e

real

Encontra f e

calcular e

med

-f

Calcular f com

(37)

Normalização Loess

Exemplo

(38)

Normalizacao

Metodo de Quantil

Todos os histogramas devem ser

(39)

Normalizacao

Metodo de Quantil

Normalizacao

(40)

Normalizacao

Metodo de Quantil

Normalizacao

(41)

Normalizacao

Metodo de Quantil

Normalizacao

(42)

Normalizacao

Metodo de Quantil

Normalizacao

(43)

Normalizacao

Estabilizacao de

Variancia

• Usa transformacao arcsin ao invez

do log

• Usa metodos de maxima

verossimilhanca para calcular

valores de escalonamento e

normalizacao

• Ussume um erro aditivo e

multiplicativo

(44)

Normalizacao

Estabilizacao de

Variancia

(45)

Normalizacao

Estabilizacao de

Variancia

(46)

Normalizacoes

• A principio todas as normalizacoes

retornam bom resultados

– Escalonamento local

– Loess

– Quantil

(47)
(48)
(49)

Filtros

Alguns genes nao hidridizam com

suas sondas

Problemas de confeccao da sonda

Solucoes

Usar sondas multiplas

Filtrar genes com baixa expressao

(50)

Conclusoes

• Pre-processamento

– Obtenco dos dados

– Requer varios niveis de checagem de

qualidade

• Sonda, array, gene

– Exercicio importante na analise de

dados!

(51)

Software

Bioconductor

Implementa maioria dos metodos:

vsn, limma, affy, …

Affymetrix, Agilent

tem software proprio implementando

(52)

Agradecimentos

Slides foram retirados de

apresentacoes de Christine

Steinhof e Tim Beissbarth

Referências

Documentos relacionados

No primeiro, destacam-se as percepções que as cuidadoras possuem sobre o hospital psiquiátrico e os cuidados com seus familiares durante o internamento; no segundo, evidencia-se

Esta realidade exige uma abordagem baseada mais numa engenharia de segu- rança do que na regulamentação prescritiva existente para estes CUA [7], pelo que as medidas de segurança

17.1 A Alfa Seguradora se reserva o direito de a qualquer tempo, durante a vigência deste contrato, proceder inspeção no local do Seguro, devendo o Segurado proporcionar todos

Nesse contexto, o presente trabalho tem como objetivo realizar testes de tração mecânica e de trilhamento elétrico nos dois polímeros mais utilizados na impressão

The challenges of aging societies and the need to create strong and effective bonds of solidarity between generations lead us to develop an intergenerational

Este ap´ os fazer a consulta ` a base de dados e carregar toda a informa¸ c˜ ao necess´ aria para o preenchimento da tabela envia-a para o Portal de Gest˜ ao onde a interface

Veem o soalho da tribuna, as gelosias 4 que dão para a capela real, e amanhã, à hora da primeira missa, se entretanto não regressarem aos veludos e à arca, hão de ver

Quando os dados são analisados categorizando as respostas por tempo de trabalho no SERPRO, é possível observar que os respondentes com menor tempo de trabalho concordam menos que