Bioinformática Estrutural
Aula 2
03 de Junho de 2013
Paula Kuser-Falcão
Paula.kuser-falcao@embrapa.br
Laboratório de Bioinformática Aplicada Embrapa Informática Agropecuária
CRISTALOGRAFIA DE PROTEÍNAS
Determinação da Estrutura
tri-dimensional de Proteínas
utilizando
difração de Raios-X
O processo completo
consiste em produzir cristais de proteínas (>0.1 mm na sua menor dimensão), nos quais as moléculas estejam razoavelmente bem
ordenadas para que o feixe de raios-X incidente sobre esse
cristal seja difratado gerando um
padrão de reflexões que, através da análise dos dados
cristalográficos, produzam um
mapa tri-dimensional de densidade eletrônica da molécula. Um modelo
da proteína com sequência conhecida deve então ser modelado neste mapa.
CRISTALOGRAFIA DE PROTEÍNAS
POR QUE RAIOS-X ?
Adaptado de http://www.ipac.caltech.edu/Outreach/Multiwave/
O uso de radiação eletromagnética para visualizar
objetos requer que a radiação tenha um comprimento de onda comparável às menores características que
desejamos resolver. Os raios-X tem um comprimento de onda de 1.54Å. Este valor é próximo à distância entre átomos de carbono numa ligação peptídica, sendo então ideal para estudar estruturas de proteínas.
Incidir Raios-X sobre uma única molécula resultaria num sinal extremamente fraco que nunca poderia ser detectado acima do nível de barulho, gerado pelo espalhamento da água e do ar. Um cristal arranja um número grande de moléculas na mesma orientação, então as ondas espalhadas podem ser adicionadas em fase aumentando o sinal a um nível que possa ser medido.
O cristal atua como um amplificador.
POR QUE CRISTAIS?
Obtenção de cristais
A obtenção de cristais
adequados
é o maior
gargalo no processo de elucidação de uma
nova estrutura
Cristal adequado significa: - altamente ordenado;
- difrata a alta resolução; - tamanho suficiente.
•
Uma gota é formada misturando-se volumes iguais de solução de proteína e de uma solução precipitante. gota contendo proteína e precipitante 1. Cristalização da proteína•
Inicialmente a concentração de precipitante na gota é metade da sua concentração no poço.•
Um volume bem maior de precipitante é colocado em um reservatório abaixo da gota.Método de
difusão de
vapor com
a gota
sentada
GP120 - uma glicoproteína do envelope exterior do vírus HIVtipo 1 Universidade de Columbia EUA Proteína que liga
quitina Tjaard Pijning RU Groninger Lisozima Eddie Snell NASA Dihidrolipoamida desidrogenase Tassie & Roeber NASA
Biliverdina-IX redustase complexada com NADP Rosa Perez-Luque IBMB-CSIC Barcelona
Exemplos de cristais de proteínas já estudados
1. Cristalização da proteína
TIM Aparício LNLS
Raios-X e Cristais de
Proteínas
O Experimento :
Uma vez obtido, o cristal da proteína é irradiado com Raios-X
2. Irradiar os cristais com Raios-X e coletar os padrões de difração
Placa de Imagem
Espelhos para focalizar o feixe de raios-x
Os raios-X são difratados pelo cristal
Padrão de Difração
de Raios-X
O espalhamento do feixe de
raios-X pelo cristal produz o padrão de difração;
2. Irradiar os cristais com Raios-X e coletar os padrões de difração
A organização dos pontos
no padrão está relacionada com a distribuição de
moléculas no cristal;
Diferenças de intensidade
relacionam-se com a distribuição dos átomos na molécula.
Mapa de densidade
eletrônica
O resultado do experimento não é a figura dos átomos , mas um mapa de distribuição dos elétrons na molécula, isto é, um mapa de densidade eletrônica. No entanto, uma
vez que os elétrons são mais localizados ao redor do núcleo, o mapa de densidade eletrônica nos dá uma boa
idéia da molécula.
Resolução baixa: poucos detalhes além do formato da
molécula podem ser observados.
Resolução média: é possível discernir o dobramento da
molécula, embora vão ocorrer muitas quebras no mapa de densidade.
Resolução alta: a maioria ou todos os átomos da molécula
podem ser resolvidos,o que significa que podemos ter suas coordenadas (x,y,z)
7.0 Å é uma resolução
baixa para proteína 3.0 Å é uma resolução média 1.6 Å é alta resolução
Posição do CO não está bem definida Quebra na densidade eletrônica
Resolução
Todos os modelos tem uma incerteza na posição dos átomos.
Valores numéricos pequenos para resolução significam uma pequena incerteza, então resolução alta; valores altos significam uma grande incerteza, então resolução baixa.
A resolução é medida em Ångstroms (Å).
Está diretamente relacionada com a distância mínima a que dois objetos podem estar e ainda serem vistos como dois objetos.
Para resolver questões em nível atômico (catálise enzimática, ligantes, interação proteína-ácido
nucléico, etc) a alta resolução é mais útil.
Resolução é um indicador do nível de detalhes disponível no dado experimental.
Low resolution: <3.0A
Medium resolution: 1.8-3.0A High Resolution: 1.0 – 1.8A Atomic Resolution: >1.0A
Nem todas as partes da estruturas tem
Mapa de densidade
eletrônica Átomos são inseridos na densidadepara construir o modelo da proteína
Ajustando o modelo
na densidade
eletrônica
5. Construção do modelo da proteína
Uma vez obtido o mapa de densidade eletrônica, é necessário colocar a sequência de aminoácidos da proteína dentro da densidade para construir o modelo:
Refinamento
O modelo inicial geralmente possui muitos erros porque erros ocorrem durante o experimento. Para poder
explicar a biologia do modelo é preciso melhorar esse modelo inicial. Isso é feito com:
Refinamento: ajuste automático dos parâmetros do
modelo para e imposição de algumas regras físico-químicas, como distâncias mínimas, cargas, etc;
Controle de qualidade: verificação se o modelo parece
como uma proteína real;
Reconstrução manual: ajuste manual do modelo para
Uma vez obtida a estrutura tri-dimensional da proteína podemos utilizá-la para: entender seu funcionamento...
… visualizar partes específicas de uma proteína como sítios de ligação, para entender como a ligação acontece...
Azul: cargas positivas
… visualizar a distribuição de cargas na superfície da proteína, etc.
Vermelho: cargas negativas
A informação estrutural é essencial para entender como as moléculas biológicas funcionam e fornece conhecimento para a obtenção de novos medicamentos para cura de doenças como AIDS, Câncer, anemia, diabetes, etc.
HIV protease ligado a um inibidor
Validação e Qualidade
Erros nas estruturas
Completely wrong
Wrong trace, incorrect fold of protein
Register errors, where trace of protein is not in keeping with sequence order.
Partial errors
Incorrectly built loops.
Wrong residues built into the structure (i.e., Proline instead of Aspartic acid).
Bad data quality
Bad geometry and stereochemistry.
Incorrect positioning of ligands etc due to lack of experimental evidence.
This is supposed to be
Phenylalanine and should look
like:
BUT….
This is supposed to be a sugar and should look like:
BUT….
•
This is supposed to
be another sugar
(sucrose) and
should look like:
BUT….
Wrong Structures !!
PDB entry 1PTE PDB entry 3PTE
UAB Researcher involved in fraud !
After a thorough examination of the available data, which included a re-analysis of each structure alleged to have been fabricated, the committee found a preponderance of evidence that structures 1BEF, 1CMW, 1DF9/2QID, 1G40, 1G44, 1L6L, 2OU1, 1RID, 1Y8E, 2A01, and 2HR0 were more likely than not falsified and/or fabricated and recommended that they be removed from the public record. The former employee was H.M. Krishna Murthy, who was found by the Investigation Committee to be solely responsible for the fraudulent data.
The coordinates for 2HR0 do not form a connected network of molecules in the crystal lattice.
Algumas Verdades sobre as Estruturas
•
Nunca acredite numa estrutura logo de
cara.
•
Qualquer estrutura é apenas tão boa
quando o dado experimental que foi usado
na sua determinação.
•
Apenas porque foi publicada na
Nature/Cell/Science não significa que a
estrutura não pode ter falhas.
Ground rules for Bioinformatics
Não acredite sempre no que os programas lhe dizem
Muitas vezes eles podem lhe induzir para a conclusão errada e algumas vezes estão errados!
Não acredite sempre no que os bancos de dados lhe
dizem
Muitas vezes eles podem lhe induzir para a conclusão errada e algumas vezes estão errados!
Não acredite sempre no que os professores lhe dizem
Muitas vezes eles podem lhe induzir para a conclusão errada e algumas vezes estão errados!
Ou seja, seja um usuário crítico
Indicadores de Qualidade das Estruturas
1.
Diagrama de Ramachandran
2.
Geometria and Estereoquímica
3.
R-factor/FreeR-factor (X-ray
crystallography)
4.
Correlação entre dado experimental e
estrutura
5.
Resolução dos dados no qual a estrutura
foi baseada ( X-ray crystallography
)Ramachandran Plot
Um exemplo real. Todos os resíduos não glicina estão em regiões permitidas.
• Idealmente, não deve haver
valores discrepantes no
Diagrama de
Ramachandran, exceto
glicina e prolina, que são aminoácidos "especiais".
• No entanto, pode haver
alguma explicação
racional para o cientista depositar a estrutura com outliers. (Consulte sempre a publicação!).
• Numa boa estrutura
espera-se encontrar 85-90% dos
resíduos nas regiões
vermelhas.
Verificação da Geometria e Estereoquímica
•
Sempre olhe a
estrutura em
visualizadores
gráficos.
•
Use ferramentas como
PDBeAnalysis,
PDBSum para
analisar as
estruturas.
R-Factor
•
R-factor is a measure of the
agreement between the
crystallographic model and the
experimental X-ray diffraction
data.
Então o que você deve procurar…
Estruturas com resolução maior Boa geometria e estreoquímica R-factor baixo
Grande correlação entre dado experimental e estrutura Estruturas completas (preste atenção na Sequência e
quanto dela está representada na estrutura), sem conflitos de sequência
Estruturas complexadas com ligantes bound podem ser mais
úteis para análise do que a forma sem ligante (apo-form).
Nota: Essas são regras gerais que podem ajudá-lo a
escolher a melhor estrutura para sua análise, quando mais do que uma estrutura para a mesma proteína está
Alguns programas para Validação da Estrutura Procheck http://www.biochem.ucl.ac.uk/~roman/procheck/proche ck.html WHATCHECK: http://swift.cmbi.ru.nl/gv/whatcheck/ JCSG Validation: http://www.jcsg.org/scripts/prod/validation1.cgi PDBeAnalysis: http://www.ebi.ac.uk/pdbe-as/PDBeValidate
Validação: programas
O que você pode conseguir
trabalhando com Bioinformática
Estrutural?
Grandes chances de ganhar um Nobel Prize
(1946, 1962, 1962, 1972, 1982, 1988, 1991,
1997, 2002, 2003, 2006, 2009), todos em
X-ray crystallography com exceção de 2002.
Ilhas
• Perutz Glacier 67° 37' S, 66° 25W.
• Bragg Islands 66° 28' S, 66° 27' W.
• Pauling Islands