Bioinformática
O que é Bioinformática?
“The mathematical, statistical and computing methods that aim to solve biological problems using DNA and amino acid sequences and related Information”.
Fredj Tekaia (Institut Pasteur)
O que é Bioinformática?
DNA RNA Proteína
Bases da Bioinformática
Sobre a Estatística ...
Há três tipos de mentiras: mentiras, mentiras descabeladas, e estatísticas.
Benjamin Disraeli (primeiro-ministro britânico, falecido em 1881)
Comentários sobre as bases da bioinf...
Sobre a Biologia ...
Em condições de pressão, temperatura, volume, umidade e outras variáveis rigorosamente controladas, o organismo funcionará como bem entender.
Lei de Murphy (Harward Law)
Sobre a Computação ...
O computador veio resolver os problemas que você nunca teve.
Anônimo
• A Bioinformática “estima”, você é que afirma.
Bioinformática Aplicada ao estudo do Câncer
Notas sobre a Bioinformática
• Quanto mais informações corretas você puder dar, melhor será o resultado.
• Sempre há um resultado. Pode ser bom ou ruim, mas como julgar?
• Se você explorar os dados o suficiente, eles irão revelar qualquer coisa.
• Não há fuga da bancada.
Por que a Bioinformática está em evidência?
Nature (2/15/01) Human Genome Issue
Science (2/16/01) Human Genome Issue
Estratégias para o seqüenciamento do Genoma Humano
Francis Collins
Estratégias para o seqüenciamento do Genoma Humano
Craig Venter
Por que a Bioinformática está em evidência?
Onde estão as informações?
A complexidade das relações biológicas
Repositórios de seqüências Domínios de proteínas
Busca de similaridade Bancos de SNPs
Estruturas 3D de proteínas
Bancos de mapeamento Bancos de seqüências
de bactérias
Fatores de transcrição Vias metabólicas
Outras informações Bancos de mutações humanas
Abordagem computacional vs câncer
Projeto Genoma Humano do Câncer
Mitochondria rRNA
Bacteria Repeats
Known Human Genes Unigene Contigs Non-unigene ESTs
Human protein (Paralogs) Non-Human Protein (Orthologs)
ESTs DNA No matches
30.301 (4.72%) 17.102 (2.66%) 38.258 (5.96%) 38.731 (6.03%) 112.358 (17.50%) 161.694 (25.18%) 40.532 (6.31%) 5.088 (0.64%) 7.820 (1.22%) 32 (0.00%) 126 (0.02%) 189.993 (29.59%) TOTAL Number of sequences: 642.035
Last update : Mon Sep 11 18:00:00 EST 2000
43.220
250.000
O que são SNPs?
O que são SNPs ?
• Todas mutações pontuais são consideradas SNPs?
• São as formas mais abundantes de variação humana
• Polimorfismos simples de base única
Aplicações
• Associação Genética
• Estudos funcionais e farmacogéticos
• Estudos de antropologia biológica
• Mapeamento genômico
Aplicações
Em genes (cSNPs) Em seqüências genômicas (gSNPs)
Lista de SNPs funcionais Mapeamento genômico
Banco de Dados Banco de Dados
Metodologia
Database
Metodologia
Metodologia
Metodologia
Bioinformática / HCGP- SNPs
Parálogos
Bioinformática / HCGP- SNPs
**SINONIMA**
ANCHOR: Hs.169780 AF040707 Homo sapiens candidate tumor suppressor gene 21 protein isoform I mRNA, complete cds.
MEMBER: CM0-CT0054-150799-022-h09 CM0-CT0054-150799-022-c10 POSICAO: 913
CODON: ctg-ttg VAR_SEQUENCE: C-T
POS_SEQUENCE: 1 VAR_AA: L-L TAMANHO: 1143
P_SNP: 0.669159811628094
SEQUENCE: ttggccgccacccccagcag(C/T)tgcagcatgttgatgaacgga
**NAO-SINONIMA**
ANCHOR: Hs.139226 AF045555 Homo sapiens wbscr1 (WBSCR1) and replication factor C subunit 2 (RFC2) genes, complete cds.
MEMBER: CM0-HT0245-031199-085-g05 CM0-CT0054-150799-022-e08 POSICAO: 56624
CODON: ccc-cac VAR_SEQUENCE: C-A
POS_SEQUENCE: 2 VAR_AA: P-H TAMANHO: 61360
P_SNP: 0.859732995470433
SEQUENCE: gatcggccacctcagcctcc(C/A)caagtgctgggattacaggca
Relatório
Estatística
ORESTES CDSbd
Bibliotecas
ORESTES Com Variação % 43.220
7.943
1.555
6.308
1.240
771
14.6
14.4
49.6
Seqs com Variação: 171 Genes com variação: 50 Bibliotecas com variação: 31
Sinônima
Não sinônima
%
Estatística
Abordagem computacional vs câncer