Biologia In Silico - Centro de Informática - UFPE
Ivan G. Costa Filho
igcf@cin.ufpe.br
Centro de Informática
Universidade Federal de Pernambuco
Regulação Gênica e
Inferência de Redes
Biologia In Silico - Centro de Informática - UFPE
Tópicos
O que é regulação gênica?
Extração de Sinais regulatórios
Processamento de seqüência
Experimentos de Chip
Métodos Computacionais
Co-expressão
Inferência de Redes
Regulatórios
Biologia In Silico - Centro de Informática - UFPE
Dogma Central
e Controle de Expressão
• Dogma: fluxo de
informação
DNA
→
mRNA
→
Proteína
• Qual processo determina
quando/quantos mRNA
são produzidos?
Biologia In Silico - Centro de Informática - UFPE
Até o momento …
Expressão Gênica
Biologia In Silico - Centro de Informática - UFPE
Controle da Regulação
Gênica
Sinal
polimerase
Sinal
Operador (TF)
Biologia In Silico - Centro de Informática - UFPE
Exemplo Iteração
DNA-Proteína
Biologia In Silico - Centro de Informática - UFPE
Tipos de Regulação
Biologia In Silico - Centro de Informática - UFPE
Controle da Regulação
Gênica Eucarióticos
Biologia In Silico - Centro de Informática - UFPE
Controle de Regulação
Redes de Regulação
Biologia In Silico - Centro de Informática - UFPE
Controle de Regulação
Redes de Regulação
TF A
TF B
TF C
TF D
TF E
TF F
TF G
TF C
TF A
TF G
Gene 1
TF B
TF F
TF G
Gene 1
Biologia In Silico - Centro de Informática - UFPE
Exemplo Rede
Regulatória
Desenvolvimento
em Ouriços
Biologia In Silico - Centro de Informática - UFPE
Como inferir tal redes?
•
Análise de seqüência/Chip
– Quais TF são possíveis
reguladores
•
Expressão Gênica
– Quais genes estão
ligados/desligados em uma
condição;
– Uso de interferencia de RNA
•
Solução:
– Buscar todas as possibilidades de
redes com suporte dos dados ...
Biologia In Silico - Centro de Informática - UFPE
Analise de Regiões
Promotoras
Biologia In Silico - Centro de Informática - UFPE
Regiões Promotoras
•
Região promotora - DNA em volta do
inicio do gene
•
Fatores de Transcrição (TF)
– Proteínas que se ligam a seqüência e
iniciam ou reprimem a transcrição
•
A seqüência de ligação TF-DNA é
especifica de cada TF
Biologia In Silico - Centro de Informática - UFPE
Fatores de
Transcrição
•
Motifs indicam a
preferência de
ligação
Biologia In Silico - Centro de Informática - UFPE
Motifs Fatores de
Transcrição
A partir de seqüências
de TF
•
representações dos
motifs.
Bases de dados com
Motifs de humanos,
camundongo, …
- Transfac
- Jasper
Biologia In Silico - Centro de Informática - UFPE
Position Weigth
Matrices
- Representação probabilística de motifs.
Uma entrada na matriz acima
p
i
(x) – probabilidade da base x na
posição i
( , )
( )
i
i
Biologia In Silico - Centro de Informática - UFPE
Análise de Regiões
Promotoras
Calcular o valor de cada matriz sobre uma
seqüência promotora de um gene.
ACGGTTCAGGGTACGTTTGATCCCAGGCGGTTCAGGGTACGTTTGATCCCAGG
Usar teste estatístico para descobrir picos
relevantes.
Biologia In Silico - Centro de Informática - UFPE
Analise de Regioes
Promotoras
• Repetir a análise para todos os
genes e TF em um organismo.
• Resultado – Tabela de TF-genes
Tf1 Tf2 Tf3 Tf4 Tf5 Tf6 …
Gene 1
1
0
0
1
1
1
…
Gene 2
0
1
1
0
0
0
…
Gene 3
1
0
0
1
1
1
…
Gene 4
0
0
0
0
0
0
…
…
…
…
…
…
…
…
…
Biologia In Silico - Centro de Informática - UFPE
Análise de Regiões
Promotoras
• Tais tabelam permitem inferir as
arestas do gráfico de regulação
• Problemas:
– Falso positivos (muitos!)
• motifs são pequenos e
degenerados
Biologia In Silico - Centro de Informática - UFPE
Biologia In Silico - Centro de Informática - UFPE
Imuno Precipitação de
Cromatina
• Experimento biológico para medir
iteração DNA-proteína
• Chip permite recuperar o DNA
ligado a uma determinada
proteína
– microarray/sequenciamento permite
indicar a seqüência do DNA
Biologia In Silico - Centro de Informática - UFPE
Biologia In Silico - Centro de Informática - UFPE
Chip-chip
• Promoters Microarrays
– tem um design especial
• Mede uma TF/condição biológica
por vez.
• Requer vários microarrays por
experimento (20-40 por
experimento)
– alternativa – sequenciamento
(Chip-Seq)
Biologia In Silico - Centro de Informática - UFPE
Chip-chip
• Análise pré-processamento
– Sondas com valor alto indica
interação do TF com a região
genomica.
• Problemas - Contem falso
negativos
– algumas iterações TF-DNA não são
observadas na condição
Biologia In Silico - Centro de Informática - UFPE
Biologia In Silico - Centro de Informática - UFPE
Co-expressão e
Co-regulação
Genes com mesma expressão no
tempo/processo biológico são
potencialmente regulados pelo
Biologia In Silico - Centro de Informática - UFPE
5‘ UTR
ORF
Modulo Regulatórios
Ciclo Celular
G
rup
o
1
G
ru
p
o
2
G
rup
o
3
Gr
u
p
o
4
YIR017C YJL118W YER019W YDR113C YJR043C YPL016W YBR156C YKR010C YPR141C ... YDL093W YER016W YNL126W YKL053W YJL099W YDL198C YCR085W YBR043C YDR325W ...---Tf 3
Tf 2
tf1
Usar teste hipergeométrico para
Identificar p-value
Biologia In Silico - Centro de Informática - UFPE
Modulos Regulatorios
• Metodologia Simples
• Só retorna algumas arestas do
gráfico de regulação (TF-gene)
• Não captura iterações entre TFs.
• Disponível em vários softwares de
gene sets/Analise de
Biologia In Silico - Centro de Informática - UFPE
Dinamica de Regulacao
• Como saber qual dos caminhos da
via esta sendo usado e em qual
condição biológica?
Biologia In Silico - Centro de Informática - UFPE
Regulação
Series Temporais
TFs no grupo verde são candidatos a
possíveis reguladores dos genes
Biologia In Silico - Centro de Informática - UFPE
Rede de Regulação
Ciclo-Celular da
Levedura (Lee et
al.)
• Ligações
extraídas de
Chip-chip
• Ordem da rede
a partir de
expressão
gênica
(detecção de
picos)
Biologia In Silico - Centro de Informática - UFPE
Interferência de RNA
Interferência de RNA (RNAi)
- protocolo para bloquear a expressão
de um determinado gene.
Para um dado organismo/célula:
- aplicar o processo em vários genes
- medir cada vez a expressão com
microarrays.
Biologia In Silico - Centro de Informática - UFPE
Inferência de Redes -
RNAi
Biologia In Silico - Centro de Informática - UFPE
Interferência de RNA
• Normalmente se baseia em poucos
genes de uma via
• Normalmente necessita discretizar
valores
• Abordagens usam modelos
probabilísticos.
Biologia In Silico - Centro de Informática - UFPE
Inferência de Redes
Bar-Joseph
Biologia In Silico - Centro de Informática - UFPE
Redes Bayesianas
Biologia In Silico - Centro de Informática - UFPE
Resumo
• Muitas alternativas apresentando
soluções para pequenas redes com
media acurácea
• Problemas:
– Qualidade dos dados
• microarrays, chip-chip, seqüência
– Integração de dados
– Visão simplificada do processo de
regulação
• mecanismos de epigenetica, regulação
pos-transcripcional, …
Biologia In Silico - Centro de Informática - UFPE