• Nenhum resultado encontrado

O primeiro projeto de elucidação estrutural automatizada foi o DENDRAL, baseado no nome DENDRitc ALgorithm (LINDSAY et al., 1980). Esse projeto, iniciado a partir de 1965 na Universidade de Standford, EUA, partiu do desenvolvimento de algoritmos para tratamento de dados de espectrômetros de massas. O programa funcionava com a estratégia clássica denominada “planejar-montar-testar” e, durante o projeto, foram sendo adicionados diversos algoritmos e outros dados espectroscópicos, como RMN-13C, com o objetivo de aumentar

a capacidade de elucidação. Em todos os casos o sistema confrontava os dados do espectro-problema com o banco de dados que contêm uma significativa lista de fragmentos compatíveis com o espectro e a fórmula molecular obtidos da espectrometria de massas. A partir dessa etapa, era necessária a intervenção do usuário que deveria informar quais grupos funcionais e/ou subestruturas estavam presentes ou ausentes.

A partir dessa experiência, foram gerados outros sistemas como o CONGEN (CONectivity GENerator) e o GENOA (GENeration with Overlapping Atoms) (MASINTER et al., 1974; CARHART et al., 1981). Outro software, mais recente e avançado que o DENDRAL, mas ainda pioneiro, é o DARC/EPIOS (Direct Acess Radar Channel/Elucidation by Progressive Intersection of Ordered Substructures) (DUBOIS & SOBEL, 1985). Como era um sistema especialista clássico de determinação estrutural, assim como o DENDRAL, também possuía um banco de dados de fragmentos estruturais. Porém, esses fragmentos eram baseados em um átomo de carbono central ligado aos seus respectivos vizinhos contendo a descrição de deslocamentos químicos, sendo que estas subestruturas, conhecidas como ELCOs (Environment Limited and Concentric Ordered) (DUBOIS et al., 1984), eram capazes de descrever diversos ambientes químicos. O DARC/EPIOS necessitava de uma menor intervenção do usuário para a determinação da estrutura-problema por possuir um algoritmo mais eficiente que o do DENDRAL.

O sistema especialista PAIRS (Program for the Analysis of IR Spectra), desenvolvido por Woodruff & Smith (1980), era capaz de analisar espectros no infravermelho (IV) de modo semelhante a um espectroscopista. Em 1994, Chalmers e colaboradores usaram uma abordagem automatizada de interpretação da transformada de Fourier para espectros de Raman de polímeros complexos (CLAYBOURHN et al., 1994). O sistema EXPIRS é outro sistema desenvolvido para análise de espectros no IV (ANDREEV et al., 1993), que organiza, hierarquicamente, grupos característicos que são reconhecidos pelos picos detectados. Plamen et al. (2000) desenvolveram um sistema computacional que realiza buscas em bancos de dados espectrais, classificando espectros no IV com a ajuda de análise linear discriminante, redes neurais artificiais e o método dos k-vizinhos mais próximos (k-Nearest Neighbors – kNN).

Um programa que era baseado em um banco de dados de RMN-13C de estruturas completas foi

desenvolvido por Munk et al. (1996). Nesse programa, o usuário informa os dados experimentais de RMN-13C

e o número mínimo de sinais e de soluções que devem apresentar. Com as informações fornecidas pelo usuário, o sistema especialista faz uma busca dos dados no banco, filtrando aqueles compatíveis, os quais, com o número mínimo de sinais requeridos, são novamente filtrados, excluindo as estruturas duplicadas.

Outros programas foram desenvolvidos, tais como o ASSEMBLE, SESAMI e HOUDINI (SHELLEY & MUNK, 1982; MADISON et al., 1998; KORYTKO et al., 2003). O ASSEMBLE se diferenciou dos demais por não possuir um banco de dados e por não trabalhar com dados espectrométricos, sendo então pouco útil, pois, inicialmente, apenas gerava todos os isômeros possíveis a partir da fórmula molecular, tendo um aumento exponencial de estruturas possíveis e alto custo computacional com o aumento do número de átomos. Portanto, a ele foram adicionadas opções de fragmentos que o usuário indicava como sendo possíveis de haver na estrutura ou que deveriam estar ausentes (SHELLEY & MUNK, 1982). O SESAMI, (Systematic Elucidation of Structure Applying

76

Machine Intelligence) (Madison et al., 1998; Korytko et al., 2003), também do mesmo grupo de pesquisa, possui um gerador que trabalha primeiro procurando todos os centros quirais possíveis na molécula, em conjunto com as restrições impostas pelo usuário. Seu algoritmo é baseado em tabelas que correlacionam estruturas com características de um espectro. Atualmente, esse sistema é denominado de HOUDINI, o qual também utiliza dados de RMN bidimensionais (2D) (KORYTKO et al., 2003).

Todos os programas CASE descritos até aqui são capazes de gerar estruturas químicas através da montagem de átomos e/ou fragmentos de moléculas. Porém, outra estratégia é baseada na geração de estruturas através da remoção de ligações de uma hiperestrutura que, inicialmente, contém todas as possíveis ligações entre todos os átomos e fragmentos moleculares necessários. Softwares baseados nesse conceito são o COCOA (Constrained COmbination of ACFs, onde ACFs são Atom-Centered Fragments) (BANGOV, 1990) e o GEN (BOHANEC & ZUPAN, 1991).

Como foi descrito anteriormente, mais recentemente foi desenvolvido o sistema HOUDINI a partir do SESAMI, os quais utilizam dados de RMN mono e bidimensionais juntamente com a fórmula molecular da estrutura desconhecida (MADISON & MUNK, 2003). Assim como o COCOA e o GEN, o HOUDINI envolve primeiro a criação de uma hiperestrutura com todas as ligações possíveis entre seus átomos e, a partir deste ponto, as ligações excedentes são removidas de acordo com as valências atômicas e correlações bidimensionais, restando poucas estruturas compatíveis com os dados experimentais.

O sistema CSEARCH (Carbon NMR, Spectral Database, Environment, Sophisticated Algorithms, Reliable Results, Clever Implementation, Highly Interactive), desenvolvido por Kalchhauser & Robien (1985), é baseado no sistema de procura desenvolvido pelo grupo de Munk (SHELLEY & MUNK, 1982), porém com a adição de algumas melhorias, como por exemplo o código HOSE (Hierarchical Ordered Spherical Description of Environment, BREMSER, 1978), o qual será descrito com maiores detalhes na seção Metodologias, Técnicas Computacionais e Algoritmos. O programa realiza a predição de deslocamentos químicos de RMN-13C e buscas por grupos funcionais e similaridade de espectros, sendo

também capaz de quebrar as estruturas encontradas em fragmentos de até três átomos, combinando-os depois a outras estruturas. O CSEARCH será abordado em detalhes na seção denominada Banco de Dados.

O sistema CHEMICS (Combined Handling of Elucidation Methods for Interpretable Chemical Structures) (KUDO & SASAKI, 1976; SASAKI & KUDO, 1985), desenvolvido por um grupo de pesquisadores japoneses, também utiliza algoritmos semelhantes aos usados pelo DENDRAL e DARC/EPIOS e é capaz de tratar dados de RMN bidimensionais para descartar fragmentos inválidos durante a geração estrutural. O ACCESS é outro sistema desenvolvido que combina um gerador estrutural com a busca de biblioteca de espectros (BREMSER & FACHINGER, 1985).

É possível observar com esses exemplos que o desenvolvimento de programas para auxílio na elucidação estrutural de substâncias não é uma atividade recente e atualmente existem várias modalidades, desde os simples simuladores aos sistemas CASE completos envolvendo geradores estruturais, o que será abordado nas seções seguintes.

77