2015 Dr. Walter F. de Azevedo Jr.

(1)

© 2 0 1 5 Dr . W a lte r F . d e A z e v e d o Jr . 1 000000000000000000000000000000000000000 000000000000000000000000000000000000000 000000000000111111111110001100000000000 000000000001111111111111111111000000001 000000000111111111111111111111111000000 000000000111111111111111111111111000000 000000000011111111111111111111100000000 000000001111111111111111111111111000000 000011111111111111111111111111111000000 001111111111111111111111111111110000000 111111111111111111111111111110000000000 111111111111111111111111111110000000000 000011111111111111111111111111111110000 001111111111111111111111111111111111000 011111111111111111111111111111111111000 001111111111111111111111111111111111100 000000011111111111111111111111111111110 000000001111111111111111111111111111110 000000000001111111111111111111111111110 000000000000011111111111111111111111110 000000000000000111111111111111111111000 000000000000000000000000001111000000000 000000000000000000000000000000000000000 000000000000000000000000000000000000000 000000000000000000000000000000000000000 www.python.org 1

(2)

Resumo

Programa para calcular o fator de vibração (B-factor) para cada resíduo de um arquivo PDB. O programa gera um gráfico do B-factor médio de cada resíduo de aminoácido. No eixo x temos os números dos resíduos e no eixo y o valor médio do B-factor para cada resíduo. Os dados dos valores de B-factor são mostrados na forma de três linhas. Uma para o B-factor de todos os átomos de cada resíduo, outro para o B-factor médio só para os átomos da cadeia principal de cada resíduo e o último para os B-factors médios dos átomos da cadeia lateral de cada resíduo. Só serão calculados os valores médios para a

Gráfico de B-factor de um arquivo PDB (versão 2)

Programa: bfactor_plot2.py

Programa: bfactor_plot2.py

(3)

# Main program

# Calls function to read PDB my_list_of_atoms = read_PDB()

# Calls function to calculate mean B-factor for each residue (protein atoms only)

my_bfactors = calc_prot_bfactors(my_list_of_atoms)

# Creates a list of legends

list_legends = ["All","Main-chain","Side-chain"]

# Calls function to plot B-factor

plot_mult_array(my_bfactors,"Residue Number","B-factor(A**2)",list_legends) 3

No programa principal temos, como na versão anterior, a função read_PDB(). Para calcularmos os fatores de vibração térmica médios, para cada porção da estrutura, temos uma nova função, chamada calc_prot_bfactors(my_list_of_atoms), que tem como parâmetro uma lista de átomos, obtida de função read_PDB(). A nova função retorna um array com os B-factors para cada trecho da estrutura, armazenados em colunas distintas do array. Assim temos um array com quatro colunas, a primeira traz os números dos resíduos, a segunda os B-factors para todos os átomos de cada resíduo, a terceira para a cadeia principal e a quarta para a cadeia lateral. A última função faz o gráfico. Veja que criamos uma lista, antes da chamada da função plot_mult_array(), para as legendas do gráfico. Esta lista está atribuída à variável list_legends.

(4)

def calc_prot_bfactors(list_of_atoms_in):

"""Function to calculate average B-factor for each residue in a protein PDB""" import numpy as np

list_mc = ["CA","C ","O ","N ","OX"] # List of main-chain atoms all_atoms = [] # Sets lists for all, main-chain and side-chain atoms mc_atoms = []

sc_atoms = []

for line in list_of_atoms_in: # looping through all atoms in the list if line[0:6] == "ATOM ":

all_atoms.append(line) # Picks all atoms

if line[13:15] in list_mc: # Picks main-chain atoms mc_atoms.append(line)

else:

sc_atoms.append(line) # Picks side-chain atoms

nres, bf_all = calculate_bfactors(all_atoms) # Calls function calculate_bfactors() nres, bf_mc = calculate_bfactors(mc_atoms) # Calls function calculate_bfactors() nres, bf_sc = calculate_bfactors(sc_atoms) # Calls function calculate_bfactors() columns = 4

rows = len(nres)

bf = np.array([[0]*columns]*rows,float) # Sets initial matrix as a NumPy array bf[:,0] = nres # Gets residue number

O código da função

calc_prot_bfactors() está

mostrado ao lado. As

strings com os tipos de átomos da cadeia principal, foram atribuídos à variável

list_mc. Esta lista é usada

num loop for, para a

seleção das linhas para cada tipo de átomo. Temos uma lista com todos os

átomos, atribuídos à

variável all_atoms, a lista com os átomos da cadeia principal são atribuídos à

variável mc_atoms. As

linhas com os átomos das

(5)

def calc_prot_bfactors(list_of_atoms_in):

"""Function to calculate average B-factor for each residue in a protein PDB""" import numpy as np

list_mc = ["CA","C ","O ","N ","OX"] # List of main-chain atoms all_atoms = [] # Sets lists for all, main-chain and side-chain atoms mc_atoms = []

sc_atoms = []

for line in list_of_atoms_in: # looping through all atoms in the list if line[0:6] == "ATOM ":

all_atoms.append(line) # Picks all atoms

if line[13:15] in list_mc: # Picks main-chain atoms mc_atoms.append(line)

else:

sc_atoms.append(line) # Picks side-chain atoms

nres, bf_all = calculate_bfactors(all_atoms) # Calls function calculate_bfactors() nres, bf_mc = calculate_bfactors(mc_atoms) # Calls function calculate_bfactors() nres, bf_sc = calculate_bfactors(sc_atoms) # Calls function calculate_bfactors() columns = 4

rows = len(nres)

bf = np.array([[0]*columns]*rows,float) # Sets initial matrix as a NumPy array bf[:,0] = nres # Gets residue number

bf[:,1] = bf_all[:rows] # Gets all atom B-factors bf[:,2] = bf_mc[:rows] # Gets main-chain atom B-factor bf[:,3] = bf_sc[:rows] # Gets side-chain atom B-factor

return bf 5

Depois chamamos a antiga função calculate_bfators(), para cada lista de átomos. Esses valores de B-factors são atribuídos a um novo

array, como quatro

colunas. Sendo a primeira

coluna do array, a do

número dos resíduos. As colunas restantes trazem

os B-factors. O array é

retornado da função.

(6)

def plot_mult_array(x,x_label_in,y_label_in,list_legends_in): """Function to plot two multi-dimensional arrays"""

import matplotlib.pyplot as plt

num_var = len(x[0,:]) # Number of variables

x1 = x[1:,0] # Gets array for number of residues(column 0)

# Looping variables to get B-factor arrays for i in range(1,num_var):

x2 = x[1:,i] # Gets each column (1-3) for B-factors plt.plot(x1,x2,label=list_legends_in[i-1]) # Generates plot

plt.legend(loc='upper left') # Positioning the legends plt.xlabel(x_label_in) # Adds axis label

plt.ylabel(y_label_in) # Adds axis label

plt.grid(True) # Adds grid to the plot

A função plot_mult_array() gera o gráfico de um array. No caso, o número de colunas do array é obtido com num_var = len(x[0,:]), que fixa na linha zero, e

retorna o número de

colunas. A linha x1 =

x[1:,0], atribui o número de

resíduos à variável x1. Em seguida temos um loop for, que atribui cada coluna de

B-factors do array à

variável x2, que será usada na função plt.plot(). Veja que o loop for inicia na segunda coluna e vai até a

última. Os dados da

(7)

Abaixo temos o resultado de rodarmos o código para o arquivo 1kxy.pdb.

7

www.python.org

(8)

Resumo

Programa que lê um arquivo FASTA e gera um gráfico de barras, indicando a quantidade de cada tipo de resíduo de aminoácido, encontrada na sequência lida. Ou seja, o eixo x indicará os vinte aminoácidos naturais com o código de uma letra. A altura das barras do gráfico, indica quanto de cada resíduo de aminoácido foi encontrado na sequência lida do arquivo de entrada FASTA. O programa gera o arquivo bar.png.

Gráfico de Barras de um arquivo FASTA

Programa: plot_bar_FASTA.py

Programa: plot_bar_FASTA.py

(9)

# Main program

# Calls read_FASTA() my_seq = read_FASTA()

# Calls function edit_seq(my_seq) my_seq = edit_seq(my_seq)

# Calls count_res(my_seq)

my_res_count, list_aa = count_residues(my_seq)

# Calls plot_bar()

plot_bar(list_aa,my_res_count,"Amino acid","Number of Amino Acids") 9

O código do programa principal está mostrado abaixo. Usamos as funções

read_FASTA() e edit_seq(), vista em outro programa. O programa traz duas novas

funções, a count_residues(my_seq), que tem como parâmetro uma string com a sequência lida do arquivo FASTA. Esta função retorna um array com o número de cada tipo de aminoácido e uma lista com os 20 aminoácidos naturais. Por último, temos a função plot_bar(), que gera o gráfico de barras, para o array com os números de ocorrência de cada aminoácidos e para lista dos aminoácidos.

(10)

def count_residues(seq_in):

"""Function to count residues""" import numpy as np res_count = np.zeros(20,int) my_list =["A","R","N","D","C","E","Q","G","H","I", "L","K","M","F","P","S","T","W","Y","V"] i = 0 for aa in my_list:

A função count_residues(seq_in) recebe a sequência, na forma de string, e conta a ocorrência de cada tipo de aminoácido, que é atribuído como elemento do array

res_count. Os códigos de uma letra dos aminoácidos estão na forma de lista e

atribuídos à variável my_list. Um loop for varre os elementos da lista my_list e conta cada aminoácido na sequência. A função retorna o array res_count e a lista my_list.

(11)

def plot_bar(x,y,x_label_in,y_label_in): """Function to generate bar plot""" import numpy as np import matplotlib.pyplot as plt x1 = np.arange(20) # Generates plot plt.bar(x1,y) plt.xticks(x1+0.4,x)

plt.xlabel(x_label_in) # Adds axis label plt.ylabel(y_label_in) # Adds axis label # Shows plot

plt.show()

# Saves plot on png file plt.savefig("bar.png")

11

Para gerar o gráfico de barras, usamos a função plot_bar(), mostrada abaixo. Os parâmetros da função são o array y e a lista x. Além de parâmetros para os rótulos dos eixos. À variável x1, é atribuído um array com 20 números. O gráfico de barras é gerado com a função plt.bar(x1,y).

(12)

def plot_bar(x,y,x_label_in,y_label_in): """Function to generate bar plot""" import numpy as np import matplotlib.pyplot as plt x1 = np.arange(20) # Generates plot plt.bar(x1,y) plt.xticks(x1+0.4,x)

plt.xlabel(x_label_in) # Adds axis label plt.ylabel(y_label_in) # Adds axis label

# Shows plot

Para termos os códigos de uma letra no eixo x, usamos o comando plt.xticks(x1+0.4,x) .

O “0.4”, somado ao x1, é para deslocarmos o centro onde será escrito o código de uma

letra no eixo x. As strings atribuídas à variáveis x_label_in e y_label_in, são usadas como rótulos dos eixos. O gráfico é gerado e salvo no arquivo bar.png.

(13)

Abaixo temos o resultado de rodarmos o código para o arquivo 1kxy.fasta.

Type information about protein sequence (FASTA file). Type input file name => 1kxy.fasta

13

(14)

Frequentemente digitamos informações erradas nos programas que desenvolvemos, como no exemplo abaixo.

Ao digitarmos, como arquivo de entrada, 1kxa.fasta o programa tenta abrir um arquivo inexistente. Temos a mensagem de erro FileNotFoundError. Em Python temos como tratar tais situações, chamadas de exceções. Para isto, usamos a função try/except. Funciona de forma similar ao if/else. Se uma tentamos um bloco de comandos, vinculados ao try, caso tenha um erro, o bloco de comandos, vinculados ao except é executado.

Tratando exceções

www.python.org

Type information about protein sequence (FASTA file). Type input file name => 1xya.fasta

Traceback (most recent call last):

File "C:\Users\Walter\workspace\Bionfo_Aula15\plot_bar_FASTA.py", line 78, in <module>

my_seq = read_FASTA()

File "C:\Users\Walter\workspace\Bionfo_Aula15\plot_bar_FASTA.py", line 18, in read_FASTA

my_fo = open(input_file_name,"r")

(15)

Abaixo temos um trecho da função read_FASTA(), onde lemos o arquivo FASTA. Veja que temos o comando try, antes da função open(). A função open() está recuada com relação ao comando try. Caso o arquivo não exista, não podemos realizar a leitura. Temos uma exceção do tipo IOError, exceção de entrada/saída O bloco de comandos, vinculado ao except, será executado, caso o arquivo FASTA não exista. No bloco, vinculado ao except, além de duas funções print(), temos o sys.exit(), que finaliza a

execução do programa. A nova função read_FASTA() está no programa

new_plot_bar_FASTA.py. Execute o código, usando um nome de arquivo FASTA que

não exista.

www.python.org

15

try:

# Opens FASTA file

my_fo = open(input_file_name,"r") except IOError:

print("Error! I can't find file ",input_file_name) print("Finishing program execution!")

(16)

Além da exceção IOError, o Python tem um arsenal de outras exceções. A tabela a seguir traz uma lista com as principais.

www.python.org

Tipo de exceção Descrição da exceção

IOError Erro em leitura ou escrita de arquivo.

IndexError Erro em índice, quando uma sequência é indexada com um número não existente.

KeyError Erro de chave, ocorre quando uma chave de dicionário não existe.

NameError Erro de nome, ocorre quando uma variável ou função não existente é chamada.

SyntaxError Erro de sintaxe de linguagem.

TypeError Erro de tipo, ocorre quando uma função é aplicada a um objeto de tipo inadequado, por exemplo, o parâmetro de uma função pede um float e é passado uma string.

(17)

Exercício de programação: Refaça os programas da lista abaixo, onde agora as

exceções são do tipo IOError são tratadas.

bfactor_plot1.py bfactor_plot2.py movePDB3.py ssBondPDB5.py Tratando exceções www.python.org 17

(18)

A figura mostrada abaixo traz a estrutura tridimensional dos resíduos de aminoácido alanina 2 e prolina 3, da estrutura tridimensional da chiquimato quinase (código de acesso PDB: 1WE2). O arquivo PDB traz as coordenadas atômicas que foram usadas para gerar a figura. Para cada átomo mostrado na figura, temos uma posição atômica no arquivo PDB. Lembre-se, as coordenadas atômicas dos arquivos PDB estão em angstrom (Å), 1 Å = 10-10 _m. ATOM 1 N ALA A 2 26.424 27.695 8.672 1.00 38.67 N ATOM 2 CA ALA A 2 26.646 26.892 9.925 1.00 38.14 C ATOM 3 C ALA A 2 28.080 27.086 10.395 1.00 36.44 C ATOM 4 O ALA A 2 29.031 26.973 9.615 1.00 36.87 O ATOM 5 CB ALA A 2 26.357 25.374 9.691 1.00 37.83 C ATOM 6 N PRO A 3 28.256 27.322 11.685 1.00 35.89 N ATOM 7 CA PRO A 3 29.592 27.533 12.232 1.00 32.15 C ATOM 8 C PRO A 3 30.578 26.368 12.108 1.00 31.97 C ATOM 9 O PRO A 3 30.179 25.186 12.111 1.00 32.12 O ATOM 10 CB PRO A 3 29.292 27.869 13.700 1.00 31.84 C ATOM 11 CG PRO A 3 27.920 28.471 13.656 1.00 31.93 C ATOM 12 CD PRO A 3 27.228 27.520 12.720 1.00 33.67 C

Trecho do arquivo PDB para os resíduos Ala2 e Pro3

Coordenadas Atômicas

(19)

ATOM 1 N ALA A 2 26.424 27.695 8.672 1.00 38.67 N ATOM 2 CA ALA A 2 26.646 26.892 9.925 1.00 38.14 C ATOM 3 C ALA A 2 28.080 27.086 10.395 1.00 36.44 C ATOM 5 CB ALA A 2 26.357 25.374 9.691 1.00 37.83 C ATOM 4 O ALA A 2 29.031 26.973 9.615 1.00 36.87 O ATOM 6 N PRO A 3 28.256 27.322 11.685 1.00 35.89 N 19 ATOM 7 CA PRO A 3 29.592 27.533 12.232 1.00 32.15 C ATOM 9 O PRO A 3 30.179 25.186 12.111 1.00 32.12 O ATOM 8 C PRO A 3 30.578 26.368 12.108 1.00 31.97 C ATOM 10 CB PRO A 3 29.292 27.869 13.700 1.00 31.84 C ATOM 11 CG PRO A 3 27.920 28.471 13.656 1.00 31.93 C ATOM 12 CD PRO A 3 27.228 27.520 12.720 1.00 33.67 C Coordenadas Atômicas www.python.org

Abaixo temos o detalhamento da estrutura, onde vemos as coordenadas atômicas usadas para gerar as posições para cada átomo da figura, exceto os hidrogênios. As coordenadas atômicas estão em angstrom (Å). A legenda de cores dos átomos está mostrada abaixo à direita.

(20)

i j

Representação Vetorial das Coordenadas Atômicas

CA2 www.python.org k k j i r_CA2 26,646 26,892 9,925

As coordenadas atômicas, armazenadas nos arquivos PDB, permitem a determinação direta de diversos parâmetros estruturais, tais como, distâncias, ângulos de ligação e ângulos de torção. Os átomos na estrutura podem ser representados por vetores, onde as coordenadas x,y,z dos átomos são as coordenadas dos vetores, como indicado para o carbono alfa (CA) abaixo. Lembrando-se, vetores apresentam direção, sentido e magnitude (tamanho do vetor). O tamanho do vetor também é chamado de módulo.

(21)

21

CA2

www.python.org i j k k j i r_CA2 26,646 26,892 9,925

A coordenada ao longo de x é multiplicada pelo vetor unitário i, a coordenada ao longo de y é multiplicada pelo vetor j, e a coordenada ao longo z pelo vetor k. Assim, o vetor

r_CA2 = 26,646i + 26,892j + 9,925k indica a posição do átomo carbono alfa da alanina 2 da estrutura 1WE2, como mostrado abaixo. A representação vetorial será usada para determinação dos parâmetros estruturais já citados.

(22)

Como destacado, vetores apresentam direção e sentido, indicado pela flecha abaixo. Além disso, apresentam módulo, indicado pelo tamanho da flecha. Para o cálculo do módulo do vetor r = xi + yj + zk, usamos a seguinte equação:

Onde x,y,z são as coordenadas do vetor r.

Usamos as barras verticais || para representar o módulo, assim |r_CA2| é o módulo do vetor r_CA2.

2 2 2

x



y



z



r

CA2 (Equação 1)

(23)

Exemplo 1. Determine o módulo do vetor r_CA2.

Solução

Para determinarmos r_CA2 usamos a equação 1, como segue:

23



 



39,137 9,925 26,892 26,646 2 2 2     CA2 CA2 r r CA2 Å

(24)

Para determinarmos o vetor diferença entre os vetores r₁ = x₁i + y₁j + z₁k e r₂ =x₂i + y₂j + z₂k, usamos a seguinte equação:

A figura abaixo indica o vetor diferença r₁ - r₂ , entre os pontos P₁ e P₂.

r₁ – r₂



 

i

 

j



k

r

₁



₂



x

₁



x

₂



y

₁



y

₂



z

₁



z

₂ P₁ P₂ (Equação 2)

www.python.org

z

y

x

₁

i

₁

j

₁

k

r

₁





z

y

x

₂

i

₂

j

₂

k

r

₂





(25)

Assim, para determinarmos as distância (d₁₂) entre dois pontos P₁ e P₂, basta determinarmos o módulo do vetor diferença entre os pontos P₁ e P₂. Como já temos uma equação para o vetor diferença, basta calcularmos o módulo deste vetor, com a seguinte equação:

Usando-se as coordenadas atômicas de um arquivo PDB para um par de átomos teremos a distância em Å (10-10 _m). 25 r₁ – r₂



 



2 2 1 2 2 1 2 2 1 12

x

y

z

d



r

₁



r

₂













P₁ P₂ Distância Interatômica (Equação 3) www.python.org

z

y

x

₁

i

₁

j

₁

k

r

₁





z

y

x

₂

i

₂

j

₂

k

r

₂





(26)

Exemplo2. Determine a distância interatômica para os átomos CA2 e N2, indicados

na estrutura abaixo.

CA2 N2

Distância Interatômica (Exemplo 2)

www.python.org i j k k j i r_CA2 26,646 26,892 9,925 k j i r_N2 26,424 27,695 8,672

(27)

Exemplo 2 (Solução). Os vetores são os seguintes:

A distância é dada pela equação 3, como segue:

27 CA2 N2



 





 





 



1,504 2.264102 1,253 0,803 -0,222 672 , 8 925 , 9 695 , 27 892 , 26 424 , 26 646 , 26 2 , 2 2 , 2 2 2 2 2 , 2 2 2 2 2 2 1 2 2 1 2 2 1 2 , 2                  N CA N CA N CA N CA d d d z z y y x x d Å i j k k j i r_CA2 26,646 26,892 9,925 r_N2 26,424i27,695j8,672k

Distância Interatômica (Exemplo 2)

www.python.org k j i r_CA2 26,646 26,892 9,925 k j i r_N2 26,424 27,695 8,672

(28)

Resumo

Programa que lê um arquivo PDB e mostra as distâncias médias entre os átomos da cadeia principal. A lista terá as distâncias N-CA, CA-C, C-O e C-N, esta última envolvendo resíduos consecutivos.

Distância interatômica num arquivo PDB

Programa: interatomic_dist_PDB.py

Programa: interatomic_dist_PDB.py

(29)

Definimos produto escalar (.) entre os vetores r₁ = x₁i + y₁j + z₁k e r₂ =x₂i + y₂j + z₂k,

pela seguinte equação:

A partir do ângulo  entre os vetores r₁ e r₂ , podemos usar a seguinte equação para determinarmos o produto escalar (.):

29 Produto Escalar 2 1 2 1 2 1

x

y

z

x







₂ 1

r

P₁ P₂



cos

2 1 2 1

r





 (Equação 4) (Equação 5) www.python.org

z

y

x

₁

i

₁

j

₁

k

r

₁





z

y

x

₂

i

₂

j

₂

k

r

₂





(30)

Para calcularmos o ângulo  de um sistema com três pontos, temos que ter as distâncias entre os pontos. A relação matemática que usaremos é a lei dos cossenos. Para revisar o conceito, consideremos o triângulo ABC qualquer abaixo.

O triângulo não é retângulo, mas se traçarmos uma perpendicular à linha AC, a partir do vértice B, temos dois triângulos retângulos, como mostrado abaixo.

Ângulos de Ligação A B C  B h www.python.org

(31)

O cos  é dado pelo cateto adjacente (AD) dividido pela hipotenusa (AB), como segue:

Se usarmos os dois triângulos internos e o teorema de Pitágoras, podemos determinar (AD) em função dos lados do triângulo externo ABC. Considere o triângulo ABD, temos pelo teorema de Pitágoras:

(AB)2 _{= x}2 _{+ h}2 _{=> h}2 _{= (AB)}2 – x2

Do triângulo BCD temos: (BC)2 _{= (CD)}2 _{+ h}2_{=> (BC)}2 _{= ((AC)} –x)2 _{+ h}2

31

 

AB

AD

cos





(BD) = h (AD) = x (CD) = (AC) - x (Equação 6) (Equação 7) (Equação 8) A B C  D h Ângulos de Ligação www.python.org

(32)

Só lembrando onde queremos chegar, procuramos uma equação para o cos  em função dos lados do triângulo ABC. Assim, a equação 6 tem a seguinte forma:

Substituindo-se a equação 7 na equação 8, chegaremos a uma expressão para x, como segue:

(BC)2 _{= ((AC)} –x)2 _{+ h}2

h2 _{= (AB)}2 – x2

Assim temos:

(BC)2 _{= ((AC)} –x)2 _{+ h}2 _{= (AC)}2 _{-2x(AC) + x}2 _{+ (AB)}2 – x2

(BC)2 _{= (AC)}2 _{-2x(AC) + (AB)}2 _{=> 2x(AC) = (AC)}2 _{+ (AB)}2 _{- (BC)}2

 

AB

(

)

AD

cos

AB

x





(Equação 6) (Equação 8) (Equação 7) Ângulos de Ligação www.python.org

(33)

33

Resumindo-se, chegamos a duas equações:

Substituindo-se a equação 9 na equação 6, chegamos a:

A equação 10 traz o cosseno do ângulo  em função dos lados do triângulo ABC.

Nosso objetivo é obtermos o ângulo , em função da informação sobre os tamanhos dos lados do triângulo ABC ou, de forma equivalente, as distâncias entre os pontos dos vértices do triângulo ABC. Assim faremos uso da função inversa do cosseno, a função arco-cosseno, como segue.

 

AB

(

)

AD

cos

AB

x





     

 

AC

BC

AC

AB

x

2

2 2 2







 



     

AB

 

AC



BC

AC

AB

)

(

2 AB

AD

cos

2 2 2









 

   













_



(AB)(AC)

BC

-

AC

AB

α

2 arccos

2 2 2 (Equação 6) (Equação 9) (Equação 10) (Equação 11) Ângulos de Ligação www.python.org

(34)

O ângulo de ligação (), entre as ligações AB e AC, mostrado na figura abaixo, pode ser determinado a partir da seguinte equação:

Onde AB, AC e BC são as distâncias entre os pontos, ou no caso molecular, as distâncias interatômicas, determinadas usando-se a equação da distância interatômica (equação 3), descrita anteriormente.

 B

 

   













_



(AB)(AC)

BC

-

AC

AB

α

2 arccos

2 2 2 (Equação 11) Ângulos de Ligação www.python.org

(35)

Exemplo 3. Determine o ângulo de ligação  formados pelos átomos N2 CA2 C2.

35

CA2 N2 C2

Ângulos de Ligação (Exemplo 3)

www.python.org i j k k j i r_CA2 26,646 26,892 9,925 k j i r_N2 26,424 27,695 8,672 k j i r_C2 28,080 27,086 10,395

(36)

Solução

Passo 1: Inicialmente usamos a equação 3 para determinar as seguintes distâncias

interatômicas: d_C2,CA2, d_CA2,N2 e d_C2,N2. O cálculo é feito a partir da aplicação direta da equação 3, como vimos no exemplo 2. Por isso não iremos repeti-lo aqui. Usaremos os valores das distâncias para os próximos passos.

CA2 N2 C2 470 , 2 1,504 520 , 1 2 , 2 2 , 2 2 , 2    N C N CA CA C d d d Å Å Å

(37)

Solução (Continuação)

Passo 2: Usamos as distâncias interatômicas e substituímos na equação 11, como

segue:

O ângulo de 109,5º _{era o}

esperado para um carbono tetraédrico, como o

carbono alfa (CA).

37 CA2 N2 C2

 



 







o o 2 2 2

109,5

0,3343

-arccos

4,57216

6,1009

2,262016

2,3104

arccos

504 ,

1

52 ,

1

2

47 ,

2

504 ,

1

52 ,

1 arccos

α

-

α

)

)(

(

-

α































_



(38)

Resumo

Programa que lê um arquivo PDB e mostra as ângulos médios entre os átomos da cadeia principal. A lista terá os seguinte ângulos N-CA-C, CA-C-O e CA-C-N, este último envolvendo resíduos consecutivos.

Ângulo de ligação num arquivo PDB

Programa: bond_angle_PDB.py

Programa: bond_angle_PDB.py

(39)

O ângulo de torção é medido considerando-se duas ternas de pontos,

como no sistema de quatro pontos

mostrado ao lado, indicados por P₁, P₂, P₃ e P₄. Os pontos P₁, P₂ e P₃ definem um

plano, e os pontos P₂, P₃ e P₄ um

segundo plano. O ângulo de torção

envolvendo os pontos P₂ e P₃ é definido como o ângulo formado entre os planos

P₁, P₂ e P₃ e P₂, P₃ e P₄.

P

₁  

P

₂

P

3

P

₄ Ângulos de Torção 39 www.python.org

(40)

Para entendermos a equação do ângulo de torção (), necessitamos de alguns conceitos básicos de geometria analítica. Usaremos o conceito de vetor, para

determinarmos a interação entre os

pontos no sistema. Manteremos a

notação de usarmos letras em negrito

para representar vetores. Assim, os

vetores que indicam as posições dos pontos P₁, P₂, P₃ e P₄ são dados por:

i j k z x y   p₁ p₂

P

₄

P

₃

P

₂

P

₁

k

j

i

p

₁



x

₁



y

₁



z

₁

k

j

i

p

₂



x

₂



y

₂



z

₂

k

j

i

p

₃



x

₃



y

₃



z

₃

k

j

i

p

₄



x

₄



y

₄



z

₄ Ângulos de Torção www.python.org

(41)

O vetor entre os pontos P₁ e P₂, aqui chamado de vetor q₁, é o vetor subtração,

p₂ – p₁. Em coordenadas cartesianas tem a seguinte expressão:

q

₁

= (x

₂

– x

₁

)i + (y

₂

– y

₁

)j + (z

₂

– z

₁

)k

De forma análoga temos os vetores q₂ e

q₃, como segue: x y  

q

₂

= (x

₃

– x

₂

)i + (y

₃

– y

₂

)j + (z

₃

– z

₂

)k

q

₃

= (x

₄

– x

₃

)i + (y

₄

– y

₃

)j + (z

₄

– z

₃

)k

q₁ q₂ q₃ z 41 p₁ p₂

P

₄

P

₃

P

₂

P

₁ i j k Ângulos de Torção www.python.org

(42)

Para determinarmos o ângulo de torção,

precisamos de mais uma definição

relacionadas aos vetores, o produto

vetorial (x). O produto vetorial entre os

vetores q₁ e q₂ é um terceiro vetor

perpendicular ao plano, definido por estes dois vetores, assim, na figura ao lado, temos que o vetor n₁ é perpendicular aos vetores q₁ e q₂ e . O vetor n₁ é chamado vetor normal ao plano e é dado pela seguinte equação: x y   

P

₄

P

₃

P

₂

P

₁ q₁ q₂ q₃ p₁ p₂ n₁ 2 1 2 1 1

q

n







q₁xq₂ i j k Ângulos de Torção www.python.org

(43)

Uma forma alternativa de representarmos o produto vetorial, é a forma cartesiana, definida como segue:

q₁x q₂ =

= (ai + b j + c k) x (d i + e k + f k)

O “x” indica o produto vetorial. Podemos obter o produto vetorial a partir do determinante da matriz abaixo.

i j k a b c d e f 43 Ângulos de Torção www.python.org x y    z

P

₄

P

₃

P

₂

P

₁ q₁ q₂ q₃ p₁ p₂ n₁ q₁xq₂ i j k

(44)

Calculamos o determinante da seguinte forma:

q

₁

x q

₂

= i ( b f

+ j (d c

- e c )

- a f )

i j k a b c d e f Ângulos de Torção www.python.org x y   

P

₄

P

₃

P

₂

P

₁ q₁ q₂ q₃ p₁ p₂ n₁ q₁xq₂ i j k

(45)

Como já vimos na equação 5, o produto escalar entre dois vetores q₁ e q₂ é dado por:

q₁ . q₂ = |q₁||q₂| cos 

O resultado do produto vetorial é um vetor, enquanto o resultado do produto escalar é um número puro.

Vimos, também, que podemos calcular o produto escalar a partir das coordenadas cartesianas dos vetores, como segue:

Onde a, b e c são as coordenadas cartesianas do vetor q₁ e d, e, f são as coordenadas do vetor q₂. 45

f

c

e

b

d

a

.



.



.





₂ 1

q

x y    z

P

₄

P

₃

P

₂

P

₁ q₁ q₂ p₁ p₂ n₁ q₁xq₂ q₂xq₃ n₂  i j k Ângulos de Torção www.python.org q₃

(46)

Os programas que calculam ângulos de torção, usam a geometria da figura ao

lado para construir uma equação

computacionalmente eficiente, baseada na função arco-tangente, especificamente

uma implementação desta função é

chamada atan2. Bem, para usamos a função atan2, temos que usar os vetores unitários normais aos planos pelos pontos P₁, P₂, e P₃ e P₂, P₃ e P₄ . Chamando-se

n₁ o vetor normal ao primeiro plano e n₂ vetor normal ao segundo plano temos:

e    2 1 2 1 1

q

n





n₁ _n 2

P

₄

P

₃

P

₂

P

₁ q₂ q₃ q₁xq₂ q₂xq₃ q₁ 3 2 3 2 2

q

n





Ângulos de Torção www.python.org

(47)

Definimos os vetores unitários pelas equações abaixo:

O cosseno e seno de  são dados por:

O ângulo  é dado por

47 1 3 2 2 2 3 2 1

u

q

u

n

u





2 1 1 1 u n u n . . cos    



sen



















2 1 1 1

u

n

u

n

2 tan

a



Ângulos de Torção www.python.org  _n   1 _n 2

P

₄

P

₃

P

₂

P

₁ q₂ q₃ q₁xq₂ q₂xq₃ q₁

(48)

Resumindo-se, para o cálculo do ângulo

de torção  de um sistema de quatro

pontos, como o mostrado ao lado, temos os seguintes passos:

1) Determinar os vetores q₁, q₂ e q₃:

2) Calcular os produtos vetoriais q₁ x q₂ e q x q .

q

₂

= (x

₃

– x

₂

)i + (y

₃

– y

₂

)j + (z

₃

– z

₂

)k

q

₁

= (x

₂

– x

₁

)i + (y

₂

– y

₁

)j + (z

₂

– z

₁

)k

q

₃

= (x

₄

– x

₃

)i + (y

₄

– y

₃

)j + (z

₄

– z

₃

)k

P

₄

P

₃

P

₂

P

₁ q₂ q₃ q₁xq₂ q₂xq₃ q₁

(49)

3) Calcular as normais aos planos:

4) Calcular os vetores unitários

ortogonais:

5) Calcular o ângulo de torção :

49



















2 1 1 1

u

n

u

n

2 tan

a



2 1 1 1

u

n

u

n

.

cos











sen

2 1 2 1 1

q

n





3 2 3 2 2

q

n





1 3 2 2 2 3 2 1

u

q

u

n

u





P

₄

P

₃

P

₂

P

₁ q₂ q₃ q₁xq₂ q₂xq₃ q₁

(50)

Exemplo 4. Determine o ângulo de torção

, dos planos formados pelos pontos P₁,

P₂, P₃ e P₄, sabendo-se que as

coordenadas dos pontos são as

seguintes:

Ângulos de Torção (Exemplo 4)

k

j

i

p

₁



8,326



10,351



0,000

9,000

i

j

k

p

₂





k

j

i

p

₃



10,325



9,000



0,000

k

j

i

p

₄



11,096



7,766



0,000

P₁ q₂ q₃ 8.326 10.351 0.000 9.000 9.000 0.000 10.325 9.000 0.000 11.096 7.766 0.000 P₂ P₃ P₄ q₁ www.python.org

(51)

Solução

Passo 1: Para determinar o ângulo de

torção, dos planos formados pelos pontos P₁, P₂, P₃ e P₄ , precisamos inicialmente calcular os vetores p, como segue:

51

q

₂

= (x

₃

– x

₂

)i + (y

₃

– y

₂

)j + (z

₃

– z

₂

)k = (1,351)i + (0 )j = 1,351i

q

₁

= (x

₂

– x

₁

)i + (y

₂

– y

₁

)j + (z

₂

– z

₁

)k = (0,674)i + (-1,351)j = 0,674i - 1,351j

q

₃

= (x

₄

– x

₃

)i + (y

₄

– y

₃

)j + (z

₄

– z

₃

)k = (0,771)i + (-1,234)j = 0,771i -1,234j

(52)

Passo 2: Agora com os vetores q

determinados, podemos calcular os

produtos vetoriais como segue:

Regra do produto vetorial:

i x i = 0 j x j = 0 k x k = 0 i x j = k j x k = i k x i = j

q

₁

x q

₂

= (0,674i - 1,351j ) x (1,351i) = 1,8252k

q

₂

x q

₃

= (1,351i) x (0,771i -1,234j) = - 1,6671k

Passo 3: Calcularemos as normais aos planos:

k

q

n

2 1 2 1 1









1,8252



(53)

Passo 4: Calcularemos os vetores unitários:

53

j

-k

i

u

i

q

u

-k

n

u

1 3 2 2 2 3 2 1











)

(

1,351

Passo 5: Finalmente o ângulo de torção:

 

1 .

-1

.

cos



















j

k

u

n

k

u

n

2 1 1 1



sen

o

a

180

1

2 tan























www.python.org P₁ q₂ q₃ 8.326 10.351 0.000 9.000 9.000 0.000 10.325 9.000 0.000 11.096 7.766 0.000 P₂ P₃ P₄ q₁

(54)

Exemplo 5. Determine o ângulo de torção

, dos planos formados pelos pontos P₁,

P₂, P₃ e P₄, sabendo-se que as

coordenadas dos pontos são as

seguintes:

i

p

₁



0 

2

p

j

p

₃



k

j

p

₄





i j k x y

P

₄

P

₃

P

₂

P

₁  www.python.org

(55)

Passo 1: Para determinar o ângulo de

torção, dos planos formados pelos pontos P₁, P₂, P₃ e P₄ , precisamos inicialmente calcular os vetores p, como segue:

55

q

₂

= (x

₃

– x

₂

)i + (y

₃

– y

₂

)j + (z

₃

– z

₂

)k = (0

– 0 )i + (1 – 0 )j + (0 – 0 )k = j

q

₁

= (x

₂

– x

₁

)i + (y

₂

– y

₁

)j + (z

₂

– z

₁

)k = (0

– 1 )i + (0 – 0 )j + (0 – 0 )k = - i

q

₃

= (x

₄

– x

₃

)i + (y

₄

– y

₃

)j + (z

₄

– z

₃

)k = (0

– 0 )i + (1 – 1 )j + (1 – 0 )k = k

(56)

Passo 2: Agora com os vetores q

determinados, podemos calcular os

produtos vetoriais, como segue:

q

₁

x q

₂

= -i x j = -k

q

₂

x q

₃

= j x k = i

Passo 3: Calcularemos as normais aos planos:

k

1 k

-q

q

n

2 1 2 1 1













www.python.org

Regra do produto vetorial:

i x i = 0 j x j = 0 k x k = 0 i x j = k j x k = i k x i = j i x k = - j j x i = -k k x j = -i

(57)

Passo 4: Calcularemos os vetores unitários: 57

-k

i

j

u

j

q

u

i

n

u

1 3 2 2 2 3 2 1











Passo 5: Finalmente o ângulo de torção:

 

   

1 .

0 .

cos























k

u

n

i

k

u

n

2 1 1 1



sen

o

a

90

0

1

2 tan























i j k x y z

P

₄

P

₃

P

₂

P

₁  = 90o

(58)

Resumo

Programa que calcula o ângulo de torção em graus para um sistema de quatro pontos (P1,P2,P3,P4). O ângulo de torção é definido por dois planos, o primeiro determinado pelos pontos P1, P2 e P3 e o segundo pelos pontos P2, P3 e P4. O resultado é mostrado na tela em graus. As coordenadas cartesianas dos pontos estarão no próprio código fonte.

Ângulo de Torção de Um Sistema com 4 Átomos

Programa: torsion_angle.py

Programa: torsion_angle.py

(59)

Na cadeia polipeptídica a definição do enovelamento da proteína depende dos ângulos de torção anterior ao carbono alfa, chamado de ângulo fi (phi em inglês) (), e do ângulo de torção após o carbono alfa, chamado ângulo psi (). A análise da

rotação desses ângulos levou à

identificação de regiões permitidas, onde não há choques entre os átomos, e regiões não-permitidas, onde há choques entre os átomos. CA C O N CB i i+1 i + 2 i + 3   CAC N CB O N CA 59 Diagrama de Ramachandran www.python.org

(60)

Gerando-se o gráfico para cada resíduo de aminoácido, o ângulo  (fi) e  (psi), temos um diagrama bidimensional, onde as regiões permitidas e proibidas são identificáveis, tal diagrama é chamado de diagrama de Ramachandran. A cadeia principal apresenta um terceiro ângulo de torção, chamado ômega (). Este ângulo envolve a ligação parcialmente dupla entre o carbono da carbonila do resíduo de aminoácido i+1, com o nitrogênio do

aminoácido i+2, ou seja, a ligação

peptídica entre dois resíduos de

aminoácido.

Devido ao caráter parcialmente duplo

desta ligação, não há a liberdade

estrutural observada para os ângulos  (fi)

CA C O N CB i i+1 i + 2 i + 3   CAC N CB O N CA Diagrama de Ramachandran www.python.org

(61)

Os eixos, fi () e psi (), no diagrama de Ramachandran, variam de -180o _{a +180}o,

as regiões no interior das áreas

demarcadas no gráfico são regiões

permitidas. Fica claro, a partir da análise do gráfico, que a área não permitida é maior do que a permitida. As regiões, não permitidas são possíveis de ocupação para a glicina, pois sua cadeia lateral restringe-se a um átomo de hidrogênio, permitindo mais liberdade para os ângulos

 (fi) e  (psi).



(

o

)



(

o

)

61 Diagrama de Ramachandran www.python.org

(62)

Em 1993 Laskowski e col. elaboraram o programa Procheck que define 4 regiões no diagrama de Ramachandran, são elas: região permitida (indicada em vermelho),

região adicionalmente permitida

(amarelo), região generosamente

permitida (amarelo claro) e região proibida

(branco). O programa Procheck usa

dados da estrutura cristalográfica de 118 proteínas resolvidas a uma resolução melhor que 2,0 Å, para definir as regiões permitidas e proibidas do diagrama.

Diagrama de Ramachandran

(63)

O programa Procheck indica as glicinas como triângulos, e estas podem ocupar

qualquer região do diagrama de

Ramachandran, visto que sua cadeia lateral restringe-se a um hidrogênio, que

permite maior flexibilidade da cadeia

principal. Os resíduos localizados nas

regiões generosamente permitida e

proibida são indicados em vermelho. Na figura ao lado o resíduo Val116 está na

região generosamente permitida do

gráfico.

63

(64)

O Procheck oferece diversas informações, em outros gráficos, ou mesmo no gráfico principal. Uma delas é a estatística geral dos ângulos  (fi) e  (psi), indicando a porcentagem de resíduos de aminoácido em cada região, na estrutura 1WE2 (Pereira et al., 2004) temos 92,7 % dos resíduos da região permitida, 6,6 % na região adicionalmente permitida, e 0,7 % na região adicionalmente permitida. Para estruturas resolvidas a resolução acima de 2,0 Å espera-se acima de 90 % dos resíduos nas regiões permitidas.

(65)

A análise da qualidade estereoquímica de modelos de proteínas é uma ferramenta poderosa na análise estrutural, sejam obtidos experimentalmente ou obtidos por

modelagem molecular. O Programa

Procheck facilita a análise dos modelos estruturais. Há versões do Procheck para Mac OS X, Windows e Linux, bem como, sites dedicados a análise on-line de proteínas.

65

(66)

Como exemplo do uso do programa Procheck na análise da qualidade estereoquímica de modelos estruturais de proteínas, considere a proteína humana Purina Nucleosídeo Fosforilase (PNP, EC. 2.4.2.1). A PNP foi resolvida inicialmente em 1990 por Ealick et

al. 1990 (código de acesso no PDB: 1ULA), a 2,75 Å de resolução. Uma nova estrutura foi refinada a 2,3 Å (De Azevedo et al., 2003) (Código de acesso PDB: 1M73).

Referências:

De Azevedo, W. F., Canduri, F., Santos, D. M., Silva, R. G., Oliveira, J. S., Carvalho, L. P. S., Basso, L. A., Mendes, M. A., Palma, M. S., and Santos, D. S. Crystal structure of human purine nucleoside phosphorylase at 2.3 A resolution. Biochem.

Biophys. Res. Commun., 308(3), 545-552, 2003.

Ealick, S. E., Rule, S. A., Carter, D. C., Greenhough, T. J., Babu, Y. S., Cook, W. J., Habash, J., Helliwell, J. R., Stoeckler, J.

(67)

67

(68)

A análise dos dois diagramas de Ramachandran, indica claramente que a estrutura de coordenadas atômicas 1M73

apresenta melhor estatística

estereoquímica. Na realidade, uma

análise detalhada da estrutura

tridimensional, resolvida de 2,3 Å, indicou

que a estrutura 1ULA apresentava

diversos erros, inclusive no sítio ativo. A estrutura 1ULA previa a participação de Lys244 no sítio ativo da enzima, a estrutura a mais alta resolução revelou que esta lisina estava a mais de 9 Å da posição inicialmente prevista. A análise do gráfico de Ramachandran, por si só, não valida a estrutura de uma proteína, mas é uma ferramenta valiosa na análise da

(69)

O programa VMD tem a opção de gerar o diagrama de Ramachandran para uma estrutura de proteína carregada no sistema. Após carregar um arquivo PDB com a

estrutura de uma proteína clique nas seguintes opções no VMD Main:

Extensions>Analysis>Ramachandran Plot. Você terá o gráfico de Ramachandran na

tela, clique em Molecule para selecionar o arquivo PDB para o qual será gerado o diagrama. Depois de gerado o digrama teremos o gráfico, como mostrado abaixo.

69 Cada quadrado amarelo indica os ângulos phi e psi de cada aminoácido presente na estrutura. Se clicarmos sobre o quadrado amarelo teremos o valor dos ângulos de torção mostrados na tela.

(70)

Resumo

Programa que lê um arquivo PDB e gera o gráfico de Ramachandran.

Diagrama de Ramachandran

Programa: plot_Rama1.py

Programa: plot_Rama1.py

(71)

-BRESSERT, Eli. SciPy and NumPy. Sebastopol: O’Reilly Media, Inc., 2013. 56 p.

-DAWSON, Michael. Python Programming, for the absolute beginner. 3ed. Boston: Course Technology, 2010. 455 p. -HETLAND, Magnus Lie. Python Algorithms. Mastering Basic Algorithms in the Python Language. Nova York: Springer Science+Business Media LLC, 2010. 316 p.

-IDRIS, Ivan. NumPy 1.5. An action-packed guide dor the easy-to-use, high performance, Python based free open source NumPy mathematical library using real-world examples. Beginner’s Guide. Birmingham: Packt Publishing Ltd., 2011. 212 p.

-KIUSALAAS, Jaan. Numerical Methods in Engineering with Python. 2ed. Nova York: Cambridge University Press, 2010. 422 p. -LANDAU, Rubin H. A First Course in Scientific Computing: Symbolic, Graphic, and Numeric Modeling Using Maple, Java, Mathematica, and Fortran90. Princeton: Princeton University Press, 2005. 481p.

-LANDAU, Rubin H., PÁEZ, Manuel José, BORDEIANU, Cristian C. A Survey of Computational Physics. Introductory Computational Physics. Princeton: Princeton University Press, 2008. 658 p.

-LUTZ, Mark. Programming Python. 4ed. Sebastopol: O’Reilly Media, Inc., 2010. 1584 p.

-MODEL, Mitchell L. Bioinformatics Programming Using Python. Sebastopol: O’Reilly Media, Inc., 2011. 1584 p. -TOSI, Sandro. Matplotlib for Python Developers. Birmingham: Packt Publishing Ltd., 2009. 293 p.

Última atualização: 10 de julho de 2015.

Referências

www.python.org