• Nenhum resultado encontrado

1.3 A Abordagem Representacional da Mente – Uma Teoria Geral do

1.3.5 A Abordagem Conexionista

Sobre a Neurociência Cognitiva, influenciada pelo dualismo cartesiano e pelo materialismo, Kellog (2003) afirma que a hipótese de investigação que é adoptada tem como pressuposto central a redução dos estados mentais a estados cerebrais ou a propriedades emergentes do cérebro.

O interesse manifestado pelos investigadores acerca do funcionamento da mente teve um grande impulso, nos finais do século XX, ao ser descoberta a

fisiologia do cérebro humano. Composto por muitos biliões de células discretas, os neurónios contactam-se através de sinapses, formando entre si redes neuronais. É, então, que considerações feitas acerca da relação entre as capacidades mentais e o funcionamento cerebral perdem o pendor especulativo, tornando-se algumas das reflexões a este propósito mais objectivas e cientificamente credíveis, ainda que idealizadas. Questões sobre a actuação das redes neuronais concentram a atenção de investigadores, durante a década de oitenta do século XX, acompanhando a génese e a evolução dos modelos computacionais, que simulam o funcionamento cognitivo humano relacionado com as actividades de percepção, da memória, do pensamento e da linguagem, segundo pressupostos localistas e seriais da computação (McLeod, Plunkett & Rolls, 1998).

Pese embora o reconhecimento da revolução em termos de investigação que a metáfora mente-computador representa, através da simulação de sistemas e operações de processamento da informação que modelam a actividade da mente humana, a nova compreensão sobre o funcionamento no cérebro, e que inspira o conexionismo, não se torna menos relevante (Rumelhart, 1989). Os Modelos Conexionistas são perspectivados como modelos de processamento da informação que simulam a representação do conhecimento na memória e as acções/os procedimentos envolvidos, tendo por base a metáfora mente-cérebro. Os elementos que processam a informação têm uma estrutura semelhante à dos neurónios, acumulam activação e enviam influências excitatórias e inibitórias a outras unidades, estando conectados entre si em forma de rede complexa (Anderson, 2004; Poersch, 2004).

Importa, então, entender o funcionamento do cérebro para que se perceba o funcionamento da mente segundo uma abordagem conexionista, uma vez que é do mimetismo biológico que emergem as computações em paralelo e o uso das representações distribuídas do conhecimento.

Milhares de neurónios, de todas as formas e tamanhos estão ligados entre si e montados num padrão de conexões. São formados por um corpo celular, responsável pelo tom escuro da massa cinzenta, e uma fibra de saída (output), que é o axónio. Os neurónios recebem dos dendritos, fibras parecidas com pequenas árvores e que têm origem no corpo celular, os sinais (input). À comunicação entre os neurónios faz-se por meio da transmissão de pequenas

cargas eléctricas, sempre que haja estimulação, seja através de um estímulo exterior como, por exemplo, o simples olhar para um objecto, seja através de outro neurónio em actividade. Em regiões microscópicas, há espaços onde se processam reacções químicas, fruto dos contactos dos axónios com os dendritos, as sinapses. A ligação sináptica estabelece-se pela libertação de moléculas neurotransmissoras do lado do axónio, que são a consequência do impulso eléctrico e que actuam sobre receptores do neurónio seguinte, provocando a sua activação (Damásio, 2003; Poersch, 2004).

Neste modelo de funcionamento das unidades, uma rede corresponde a um determinado padrão de conexões de muitos neurónios (unidades), organizados em camadas, correspondentes a unidades de entrada, unidades de saída e uma terceira camada interna às outras duas, designada por camada oculta (unidades ocultas). Na perspectiva conexionista, e partindo desta arquitectura biológica do cérebro, que contém um número ilimitado de processadores (os neurónios), que estão coerentemente interligados em redes complexas, o processamento da informação é feito em simultâneo e de forma cooperativa, comunicando valores numéricos e não simbólicos e fazendo corresponder os valores numéricos de entrada com os valores numéricos de saída, consubstanciando um tipo de processamento distribuído. Assim, ao adoptarem esta configuração genérica do funcionamento cerebral, os modelos conexionistas simulam o Processamento de Distribuição em Paralelo (PDP – Parallel Distributed Processing), tal qual a essência genética ou inata do cérebro, e que os distinguem dos modelos simbólicos computacionais. É em função desta especificidade que os modelos conexionistas também são designados por modelos PDP.

Mas a imitação das computações cerebrais é artificial, idealizada e simplificada. As redes, que são representações distribuídas do conhecimento com um processamento de computações paralelas, operam com um número limitado de módulos, contrariamente ao que acontece no cérebro, modelando apenas uma função cerebral de cada vez, para que o modelo não se torne muito complexo. À semelhança das sinapses, as conexões entre os módulos têm características próprias: (1) são usualmente, unidireccionais, podendo ser bidireccionais se for fornecido feedback aos módulos, pelo que a informação é reenviada ou se o

módulo estiver conectado a si próprio e com feedback9 constante; (2) são excitatórias embora algumas sejam inibitórias (Kellog, 2003).

Sendo uma arquitectura conexionista concebida em termos de satisfação de restrições paralela, a pesquisa tem demonstrado que pode ser aplicada com sucesso em diversos aspectos da cognição humana. Então, colocam-se questões sobre a natureza das restrições e sobre o seu modus operandi. Tendo a ver com o tipo de conhecimento representado pelas unidades da rede, a satisfação das restrições positivas é representada por conexões excitatórias, as negativas por conexões inibitórias. No caso de uma restrição externa, esta pode ser apreendida através da ligação das unidades que representam os elementos que satisfazem a restrição externa a uma unidade especial, a qual afecta positiva ou negativamente as unidades a que está ligada. As restrições são satisfeitas em paralelo através da activação repetida de todas as unidades e até que todas atinjam um nível de activação estável, seja ele alto ou baixo.

Após o processo de activação, a rede estabiliza, entrando num processo de relaxação e ficando activadas algumas das unidades e outras desactivadas. Não havendo uma uniformidade no comportamento específico de cada unidade neuronal, a qual varia de modelo para modelo, as redes não são montadas em arquitecturas homogéneas. As variações entre modelos admitem determinadas condições. O número de camadas formadas pelas unidades é variável, podendo as unidades ocultas não fazer parte da estrutura modular, o que tem implicações em termos de aprendizagem: os modelos com apenas unidades de input/output só aprendem a responder apropriadamente a conjuntos de padrões que obedecem à restrição de previsibilidade linear, sendo o objectivo do sistema impingir o exacto input de fontes internas numa dada unidade input/output (McClelland & Rumelhart, 1986).

É igualmente variável a quantidade de unidades em cada camada e o tipo de sinapse: consoante os problemas a resolver, uma rede é delineada a partir de algoritmos orientados para um determinado fim, tendo sempre como pressuposto que há uma correspondência entre uma rede e o esquema de processamento

9 Não colocámos a palavra entre aspa, pela elevada frequência com que este termo técnico é

usado em Português. Note-se que a palavra feedback já consta como entrada lexical, no Dicionário da Língua Portuguesa Contemporânea da Academia das Ciências de Lisboa.

através do qual o conhecimento baseado na experiência é representado, armazenado e disponibilizado para ser aplicado em função de uma finalidade.

Os pressupostos básicos aplicados a modelos PDP, de distribuição de processamento distribuído ou de representação distribuída, testados empiricamente, podem ser assim resumidos: (1) o sistema de comunicação consiste numa rede de unidades, altamente interconectadas; (2) são atribuídos valores às conexões correspondentes, podendo ser aplicados valores a cada neurónio e que são multiplicados, no neurónio, pelo valor do peso da sua sinapse; (3) depois de somados estes valores, se o valor da soma ultrapassar o valor limite estabelecido, um sinal de output é propagado, o que significa que há diferentes tipos de activação na estimulação de um neurónio, dependentes dos valores dos inputs e dos pesos sinápticos; (4) as unidades são organizadas em módulos (camadas), e cada módulo recebe sinais de entrada (inputs) de outros módulos e envia sinais de saída (outputs) para outros módulos; (5) o estado de cada módulo representa uma síntese do estado de todos os módulos que recebem sinais de entrada; (6) as unidades desempenham papéis específicos dentro dos padrões de activação (um padrão acede ao conhecimento certo advindo das unidades apropriadas).

A investigação sugere que os modelos implicam mecanismos perceptivos sofisticados entre a memória e o mundo exterior, fazendo com que os padrões de input emergentes de diferentes localizações no mundo exterior possam ser, internamente, transferidos para as mesmas unidades. Quanto à natureza dos inputs, esta varia dependendo dos módulos que os enviam, sendo uns mais sensoriais, outros mais abstractos, pelo que em cada módulo se combinam diferentes fontes de informação.

Uma das peculiaridades das redes conexionistas prende-se com a forma como se processa a sua interpretação. Lencastre (1994) afirma que os modelos desenvolvidos por J. L. McLelland e D. E. Rumelhart são exemplos de representação localista, representando cada unidade uma entidade individual, por exemplo, uma letra, palavras, objectivos ou acções de um sistema de produção, sendo, no entanto, a rede interpretada como um todo, através da interpretação das ligações e das respectivas forças. Numa representação distribuída e paralela, de que é exemplo o Modelo de Distribuição da Aprendizagem e da Memória Humanas, são os padrões de activação que representam as unidades e estas

caracterizam aspectos diferentes de um conjunto de entidades, fazendo todas as unidades a sua computação em simultâneo ou paralelo (McClelland & Rumelhart, 1986).

Outra das particularidades do processamento conexionista reside no facto de o conhecimento estar nas conexões ou nas regras subjacentes à sua formação, o que significa que não é imediatamente acessível à interpretação de qualquer processador, mas é construído/adquirido no próprio processador e determinado durante o processamento (Rumelhart, 1989).

Com o evoluir da pesquisa, consolida-se a noção sobre a insuficiência do behaviorismo; a comunidade científica apercebe-se igualmente que, devido à dicotomia cartesiana mente/cérebro, o simbolismo não resolve todas as questões relacionadas com a representação do conhecimento. Persistem questões concentradas na forma como se faz a passagem do conhecimento codificado no cérebro (componente física) para a mente (componente metafísica) (Poersch, 2004) ou como se interligam os elementos neurológicos para a obtenção da cognição de nível superior (Anderson, 2004). Genericamente, a resposta para as questões que a pesquisa coloca sobre a relação mente e cérebro podem ser solucionadas através do pressuposto de que todos os processos cognitivos ocorrem no cérebro, passando a mente a ser perspectivada como o conjunto desses processos (McClelland & Rumelhart, 1986). É neste sentido que Rumelhart (1989) aponta como estratégia básica da Abordagem Conexionista “to take as its fundamental processing unit something close to an abstract neuron” (p.134), projectando-se a partir daqui o funcionamento cerebral numa dimensão mais abstracta, que é a mente.

Um modelo de representação e de processamento da informação em redes de distribuição paralela traz benefícios em termos de agilidade, comparativamente com o processamento dos sistemas computacionais não-biológicos, próprios dos programas de computadores. Uma arquitectura como a do cérebro impõe algoritmos que envolvem paralelismo, o que compensa a lentidão das unidades, lentidão esta também ultrapassada pelo seu número Rumelhart (1989). Inerente a esta característica, a quantidade elevada ainda que as computações sejam simples, o sistema conexionista torna-se imune a estragos ou a inputs com ruído porque a importância do papel de cada neurónio no processamento é distribuída, sendo o resultado decorrente das múltiplas subcomputações distribuídas. Assim

sendo, McLeod, Plunkett e Rolls (1998) sugerem que “even if the individual components of the calculation are not accurate, the ensemble averaging can nevertheless give an answer which is accurate enough”(pp.33-34).

Em estudos experimentais realizados, onde se aplicam princípios e pressupostos específicos dos modelos computacionais a arquitecturas conexionistas, é possível avaliar o poder computacional das redes conexionistas. Na revisão da literatura feita por Thagard (1996), são explicitadas as adequações feitas tendo em conta os processos implicados na resolução de problemas, e especificamente na planificação, onde são implementados sistemas de regras simples em redes conexionistas, correspondendo à natureza sequencial inerente à construção de um plano. Também na tomada de decisões, ao estarem implicados acções e objectivos, os resultados parecem demonstrar que as restrições são positivas quando uma acção facilita um objectivo, pelo que ambas se combinam; são negativas quando há incompatibilidade de relações entre acções e objectivos, não sendo satisfeitos em conjunto.

Em estudos que envolvem conceitos, os resultados evidenciam que, através de sistemas de redes distribuídas, são activados os protótipos, correspondendo à melhor explicação sobre uma determinada entidade (Rumelhart & McClelland, 1986). Aliás, as redes conexionistas permitem ultrapassar o debate em torno da representação da informação geral ou específica porque, ao simular a categorização humana por protótipos com sucesso, é validado o princípio de que as representações mentais reflectem estruturas cognitivas exemplares reais como sugeria Rosch (1977b).

As redes podem ser testadas, implicando ou não treino, numa série de situações de aprendizagem, nomeadamente na aquisição de itens linguísticos. A este propósito, Kellog (2003), Poersch (2004) e Thagard (1996) dão como exemplo os estudos sobre a aquisição do pretérito perfeito em inglês, a aquisição das construções passivas e a leitura, respectivamente.

Tendo as redes conexionistas uma arquitectura muito simples, a aprendizagem ocorre sempre que os pesos sinápticos das conexões (os valores) entre as unidades são alterados. Como é que se configura uma simulação desta alteração? Dependendo de a aprendizagem ser ou não supervisionada, há dois tipos de aprendizagem: na de natureza biológica e designada por aprendizagem hebbiana, a alteração consiste na activação em simultâneo de duas unidades, o

que faz com que a ligação entre as duas se fortifique, não requerendo supervisão. No caso de aprendizagem supervisionada, e requerendo treino, a técnica usada é de propagação regressiva, designação que reflecte o feedback, proporcionado pelos outputs, com valores conhecidos e ajustáveis com o treino. Isto significa que, independentemente da tarefa, o algoritmo de aprendizagem ajusta a força das ligações até conseguir ter um comportamento semelhante ao comportamento humano. É neste âmbito que Poersch (2004) explica o sucesso dos modelos conexionistas, na reprodução do desenvolvimento cognitivo e/ou linguístico humano, pela sensibilidade que exibe relativamente às regularidades linguísticas que, habitualmente, ocorrem.

Mas a aplicabilidade deste sistema de redes conexionistas excede o domínio da linguagem, porque uma arquitectura concebida em termos de satisfação de restrições paralela e da propagação regressiva tem grande utilidade na Arquitectura e na Engenharia, para além de ser muito usada na Inteligência Artificial.

Em suma, a explicação e a descrição do comportamento inteligente através da Abordagem Conexionista emergem de uma concepção sobre a representação do conhecimento modelada numa arquitectura neurológica, assente em pressupostos gerais e nucleares que se resumem a: (1) todos os processos cognitivos ocorrem no cérebro, sendo a mente o conjunto de todos esses processos; (2) as unidades de processamento têm uma estrutura simples, estando interligadas em rede por conexões excitatórias e inibitórias, sendo os processos de activação e de modificação das unidades actualizados através das conexões, pela via da propagação da activação e da aprendizagem.