• Nenhum resultado encontrado

Extracção de Conhecimento de Dados obtidos por Simulação da Desnaturação Proteica

N/A
N/A
Protected

Academic year: 2021

Share "Extracção de Conhecimento de Dados obtidos por Simulação da Desnaturação Proteica"

Copied!
21
0
0

Texto

(1)

Extracção de Conhecimento de Dados obtidos

por Simulação da Desnaturação Proteica

Dissertação de Mestrado em Análise de Dados e Sistemas de Apoio

à Decisão

Faculdade de Economia

por Elisabeth Silva Fernandes

Orientador: Professor Alípio Jorge

(2)

Motivação

Objectivo

Estudar o processo de desnaturação da proteína

TTR.

O monómero de TTR tem 127 aminoácidos.

Duas variantes de TTR: WT-TTR wild type e

L55P-TTR variante mutada.

Dados

10 simulações da desnaturação da TTR.

Cada corrida com 127 séries temporais.

Medida em estudo: distância do C

a

de cada

aminoácido ao centro de massa da proteína.

Cada série temporal tem 10001 valores (um por

cada pico segundo).

Figura 1- (A) TTR; (B)

Monomero de TTR

(3)

Processo de Extracção de Conhecimento

Dados

10 Simulações Dim: 10001 x 127 Análise de Clusters Partição consenso Eventos Regras de Associação

Extracção

de

Conhecimento

Clustering para cada variante de TTR (Partição I e II) Aminoácidos Representativos Análise Exploratória

(4)

126 series temporais, 10 simulações de desnaturação da TTR

14 Clusters dos 127 aminoácidos

Análise de Clusters - Partição Consenso

Optimização dos Índices G2 e G3 de Milligan e Cooper

Clustering hierárquico para cada corrida (Método de Ward e

Distância Euclideana): 10 Partições dos 126 aminoácidos;

Clustering hierárquico sob o quadro das classificações

(Método da Ligação Média e Medida de dissemelhança

definida): Partição Consenso

(5)

Processo de Extracção de Conhecimento

Dados

10 Simulações Dim: 10001 x 127 Análise de Clusters Partição consenso Eventos Regras de Associação Extracção de Conhecimento

Clustering para cada variante de TTR (Partição I e II) Aminoácidos Representativos Análise Exploratória

Extracção

de

Conhecimento

(6)

15 elementos representativos

Aminoácidos Representativos

Elemento representativo de um cluster:

- Aminoácido mais próximo do centróide da classe.

Nas 10 Partições:

O aminoácido representativo é o mais votado;

Caso de empate: deixa-se para escolher no final e dos mais

(7)

Processo de Extracção de Conhecimento

Dados

10 Simulações Dim: 10001 x 127 Análise de Clusters Partição consenso Eventos Regras de Associação Extracção de Conhecimento

Clustering para cada variante de TTR (Partição I e II) Aminoácidos Representativos Análise Exploratória

Extracção

de

Conhecimento

(8)

LEU_17

CM

GLU_42

Identificação de Eventos

1.

Comparação de Aminoácidos dois a dois

Evento Nº 1 - “troca de posição entre dois aminoácidos

(9)

LEU_17

CM

GLU_42

Identificação de Eventos

Evento Nº2 - “duas trocas entre dois aminoácidos”

(10)

Identificação de Eventos

“Procura de alterações significativas por aminoácido”

66 aminoácidos com

alterações bruscas de

comportamento

Verifica-se a ocorrência de um

evento quando, para uma

janela de 200ps, a linha que

passa pelo ponto de máximo e

pelo mínimo tem declive

(11)

Processo de Extracção de Conhecimento

Dados 10 Simulações Dim: 10001 x 127 Análise de Clusters Partição consenso Eventos Regras de Associação Extracção de Conhecimento

Clustering para cada variante de TTR (Partição I e II) Aminoácidos Representativos Análise Exploratória

Extracção

de

Conhecimento

(12)

Regras de Associação

Evento Nº 1 -“troca de posição entre dois aminoácidos”

Regra nº1: ASN_98_spw_SER_77 & ASN_124_spw_GLU_63  L55

Support=0.5; Confidence=1; Lift=2;

Regra nº2: GLU_42_troca_2x_A_ALA_91 L55

Support=0.4; Confidence=1; Lift=2;

Se o amino

ácido ASN_98 alterna de comportamento com SER_77,

relativamente ao centro de massa, e o mesmo ocorre com entre os

amino

ácidos ASN_124 e GLU_63 então a variante de TTR é L55P-TTR

(13)

Regra Nº1:

ASN_98_spw_SER_77

& ASN_124_spw_GLU_63  L55

Variante

WT-TTR

(14)

Regra Nº1:

ASN_98_spw_SER_77

& ASN_124_spw_GLU_63  L55

Variante

L55P-TTR

(15)

Regra Nº 1:

ASN_98_spw_SER_77 & ASN_124_spw_GLU_63  L55

Variante

WT-TTR

(16)

Regra Nº1:

ASN_98_spw_SER_77 & ASN_124_spw_GLU_63  L55

Variante

L55P-TTR

(17)

Regras de Associação

Procura de eventos ao longo das séries dos 127 aminoácidos

Regra Nº3:

GLY_83  L55

Support= 0.4 Confidence=1; Lift=2

A probabilidade de estarmos perante a variante L55P-TTR

quando o aminoácido GLY_83 muda abruptamente de

(18)

Regras de Associação

Procura de eventos ao longo das séries dos 127 aminoácidos

Regra Nº3:

GLY_83  L55

Support= 0.4 Confidence=1; Lift=2

A probabilidade de estarmos perante a variante L55P-TTR

quando o aminoácido GLY_83 muda abruptamente de

comportamento é 100%

Regra Nº4:

PRO_86  WT

(19)

Só foram analisadas 10 simulações da desnaturação da TTR?!

Como controlar o risco de falsas descobertas?

Trabalho Futuro: Desenvolver técnicas para controlar o risco de falsas

descobertas

Quantas simulações precisamos?

Trabalho Futuro: Desenvolver um modelo para calcular o número

esperado de exemplos que precisamos para este tipo de problema.

Qual é a probabilidade de uma regra aleatória dar o mesmo

resultado (ou melhor) do que uma dada regra?

Exemplo: Para a Regra Nº4 temos que a probabilidade é de 0.0198.

(20)

• A partição consenso fornece uma partição dos aminoácidos que

considera n simulações.

• Para cada cluster obteve-se o aminoácido representativo

simplificando-se a complexidade do problema, reduzindo-se o número

de séries em estudo.

• A identificação de eventos é uma fase importante deste processo,

podendo caracterizar-se o processo a um nível superior.

• Com as Regras de Associação podemos identificar padrões que

descriminam as variantes de TTR.

(21)

Referências

Documentos relacionados

A finalidade do “Documento de Arquitetura de Software - DAS” é definir um modelo arquitetural para ser aplicado ao desenvolvimento dos jogos do Desafio SEBRAE, bem como

 Numéricos das das Propriedades Propriedades do do Ar Ar Úmido, Úmido, Cartas Cartas Psicrométricas, Psicrométricas, Processos Processos Psicrométricos, Psicrométricos,

A variação do pH da fase móvel, utilizando uma coluna C8 e o fluxo de 1,2 mL/min, permitiu o ajuste do tempo de retenção do lupeol em aproximadamente 6,2 minutos contribuindo para

Assim, se os Valores do Critério Holandês forem usados na avaliação da contaminação em Diques, a Solvay deve providenciar a amostragem suficiente para permitir uma

As principais indicações para a realização foram a suspeita de tuberculose (458 pacientes) e uso de imunobiológicos (380 pacientes).. A maior prevalência de resultado positivo

O processo de certificação conta com o envolvimento de uma Comissão de Avaliação que, para além da Fórum Oceano, integra um conjunto de entidades, nomeadamente: Turismo de

Este presente artigo é o resultado de um estudo de caso que buscou apresentar o surgimento da atividade turística dentro da favela de Paraisópolis, uma

Changes in the gut microbiota appears to be a key element in the pathogenesis of hepatic and gastrointestinal disorders, including non-alcoholic fatty liver disease, alcoholic