MODELAGEM E ANÁLISE DE
REDES DE REGULAÇÃO
GÊNICA UTILIZANDO REDES
BAYESIANAS
Marcos Vinícius Ferretti Walter José Horning Junior
DOGMA CENTRAL DA BIOLOGIA
CELULAR
•
Organismo vivo = rede de moléculas
conectadas por reações químicas
•
Regulação controlada pelo RNA
MICROARRAYS DE DNA
•
Permitem a medida do nível de
descrição de cada gene no genoma
•
Uma gota por spot•
Cada gota contém sequências específicas de um único gene•
Imagem scaneada usando um marcadorREDES DE REGULAÇÃO GÊNICA
•
Representam as regulações entre genes em um grafo direcionado (G)•
V(G) = Genes e E(G) = regulações entre os genes•
Vários Modelos computacionais propostos:• Redes booleanas
• Redes Neuronais
• Equações Diferenciais
REDES DE REGULAÇÃO GÊNICA
•
Esses modelos estão divididos em 3 classes:
• Lógicos
• Contínuos
REGRA DE BAYES
𝑃 𝑥 𝑦 =
𝑃𝑦 𝑥
𝑃 𝑦× 𝑃 𝑥REGRA DE BAYES
𝑃 𝑥 𝑦1, … , 𝑦𝑛 =
𝑃𝑦1, … , 𝑦𝑛 𝑥
𝑃 𝑦1,…,𝑦𝑛 × 𝑃 𝑥REDES BAYESIANAS
•
Modelo gráfico que representa de formasimples as relações de casualidade das variáveis de um sistema
•
Encontrar o grafo que melhor descreve o conjunto de dados (e suas relações)•
Cálculo de alguma métrica:• Minimal Description Length (MDL)
REDES BAYESIANAS
•
Para cada variável A que possui
como pais B1, ..., Bn, existe uma
probabilidade 𝑃 𝐴 𝐵1, … , 𝐵𝑛
𝑃
𝐵1, … , 𝐵𝑛 𝐴
× 𝑃 𝐴 𝑃 𝐵1,…,𝐵𝑛INFERÊNCIA COM REDES
BAYESIANAS
•
Na rede ao lado, o gene A não tem relação com nenhum outro gene (ou relações fracas).• O gene D tem relação com B e C (ou relações fortes com esses genes)
• Em todo caso, a rede ao lado é a rede que melhor representa as relações
desses genes.
BANJO
•
Bayesian Network Inference with Java Objects•
Ferramenta desenvolvida em Java na Duke University•
Ferramenta para inferência de redes de regulação gênica•
Modelo contínuoBANJO
• Searcher:
• Simulated Annealing
• Greedy
• Proposer:
• Random Local Moves
• All Local Moves
• Cycle Checker
• Depth First Search
• Breadth First Search
• Evaluator:
• Equivalência Bayesiana de Dirichlet (BDe)
• Decider
• Greedy
EXPERIMENTOS
•
Searcher Greedy, utilizando All Local Moves não gera resultados•
Poucas observações = grafo enorme e impreciso•
Análises sobre:• Searcher Greedy / Proposer Random Moves
• Searcher SimAnneal / Proposer Random Moves
• Searcher SimAnneal / Proposer All Local Moves
CONCLUSÃO
•
Searcher Greedy é o algoritmo com menor
eficiência para nossos experiementos
•
Critério de discretização por intervalo é
melhor do que por quantil, para essa análise
•
Parâmetro de discretização x=3 é melhor
que x=5
•
Simulated Annealing melhora com
A principal vantagem de raciocínio probabilístico sobre raciocínio lógico é fato de que agentes podem tomar decisões racionais mesmo quando não existe informação suficiente para se provar que uma ação funcionará