1. INTRODUÇÃO 1
1.4 Ferramentas bioinformáticas para o Estudo do Proteoma Oral 13
A disponibilidade de uma grande diversidade e quantidade de dados de genómica e
proteómica origina um dos maiores desafios atuais, na organização e integração de dados. A
análise e gestão de todos estes dados torna-se confusa e impraticável se não estiverem
devidamente integrados em bases de dados com ferramentas bioinformáticas associadas que
organizem os diferentes tipos de informação (16). As ferramentas bioinformáticas são
essenciais para a compreensão da contribuição do microbioma humano para a saúde e para o
estudo de alvos terapêuticos em caso de doença (8). Nas secções seguintes são apresentadas
algumas das ferramentas bioinformáticas usadas neste estudo.
1.4.1OralOme e OralCard
O OralCard é uma ferramenta bioinformática criada por investigadores portugueses do
Departamento de Ciências da Saúde da Universidade Católica Portuguesa do Centro Regional
das Beiras juntamente com investigadores do Instituto de Engenharia Electrónica e
Telemática da Universidade de Aveiro. O OralCard – Web Information System for Oral
Health, disponível através do link http://bioinformatics.ua.pt/OralCard/, tem como objetivos a
integração e compilação dos microrganismos e proteínas presentes na cavidade oral. Esta
informação é integrada numa só base e pode ser usada para a clarificação dos mecanismos
moleculares da biologia oral humana (34). Através da compilação das proteínas presentes no
microbioma oral é possível a identificação de marcadores moleculares úteis no diagnóstico de
diversas patologias orais e sistémicas e a identificação de novas moléculas como potenciais
alvos terapêuticos (6, 27).
Em Dezembro de 2011 foram adicionadas ao OralCard 3397 proteínas de origem
humana (32). Estas proteínas foram identificadas em estudos de proteómica da saliva e
revistas manualmente. Em Abril de 2012 foram adicionadas à base de dados mais 1212
proteínas determinadas em estudos experimentais no decorrer de mais um trabalho de
investigação (23). Neste momento já se encontram presentes no OralCard 3528 proteínas
humanas e 1346 microbianas (6). No entanto é expectável que existam muito mais proteínas
microbianas do que aquelas que até agora estão identificadas nos estudos de proteómica de
amostras orais (5), e, neste sentido, este trabalho foi proposto para permitir a atualização da
base de dados OralOme, que serve de suporte à ferramenta bioinformática OralCard (6).
Os diversos estados patológicos não têm como responsáveis apenas um
microrganismo, mas sim o resultado das interações entre comunidades microbianas, e do seu
potencial patogénico (2, 10). Cada processo biológico deve ser encarado como uma rede de
interações moleculares, e não como resultado de uma ação independente de cada interveniente
(26).
Deste modo é importante esclarecer estas interações à luz da proteómica, o que se torna
viável através da adição destes dados em ferramentas bioinformáticas, nomeadamente o
OralCard (6) e outras ferramentas em desenvolvimento como o OralInt (artigo submetido).
1.4.2 UniProtKB
A base de dados UniProtKB foi criada através de um consórcio entre várias
associações, nomeadamente a Swiss Institute of Bioinformatics (SIB), European
Bioinformatics Institute (EBI) e a Protein Information Resource (PIR). O principal objectivo
deste consórcio criado em 2002, foi fornecer à comunidade científica uma fonte útil e fiável
de informação de dados relativos a proteínas (35).
O UniprotKB ou Uniprot Knwoledgebase é o principal produto deste consórcio, e
consiste numa base de dados, associada a diversas ferramentas bioinformáticas acessíveis
através do site http://www.uniprot.org. Neste site encontram-se depositados dados relativos a
proteínas, nomeadamente as suas sequências e informações funcionais. Esta base de dados de
conhecimento, como o próprio nome sugere, é composta por duas secções distintas: a
UniprotKB/Swiss-Prot, na qual os dados existentes foram manualmente anotados e revistos e
conjunto a cobertura de todas as proteínas caracterizadas até ao momento ou inferidas através
das sequências de nucleótidos (35).
1.4.3 STRAP
O programa STRAP, Software Tool for Researching Annotations of Proteins , consiste
numa ferramenta bioinformática muito prática e abrangente de análise de proteínas e da
compreensão do seu significado biológico nos diversos contextos (1). Esta ferramenta inclui
uma base de dados onde estão presentes proteínas identificadas por espectrometria de massa e
por outras técnicas, juntamente com a anotação de informação relativa a essas mesmas
proteínas. Esta informação passa pela descrição das funções das proteínas, pela identificação
de interações proteína-proteína e das associações entre as proteínas às diferentes vias
metabólicas (1). Este software permite ao utilizador aceder a todos estes dados de uma forma
simplificada e intuitiva através de representações gráficas e tabelas que organizam a
informação, permitindo assim economizar tempo na análise de dados.
O STRAP contém meta-informação sobre estas proteínas e permite ainda a obtenção
dos termos gene ontology (GO) sobre as mesmas através das bases de dados UniprotKB
(Uniprot Knwoledgebase) e EBI GOA (Gene Ontology Annotation). Estes termos GO
consistem numa ontologia criada por investigadores e laboratórios, para permitir a existência
de uma linguagem universal para a anotação de funções, especificação da localização celular
e designação dos processos biológicos em que estão envolvidas as proteínas identificadas (1).
Nesta ferramenta bioinformática é possível visualizar os dados de uma amostra de
proteínas através de gráficos circulares, que as organizam em termos de processo biológico,
função molecular e componente celular, e através de gráficos de barras, que permitem a
comparação de conjuntos de amostras. Esta potencialidade do STRAP auxilia
significativamente a interpretação de grandes conjuntos de dados de proteómica
possibilitando a realização de análises diferenciais (1).
No documento
OralOme : o contributo dos microrganismos revelado por estudos de proteómica
(páginas 33-37)