• Nenhum resultado encontrado

A morfologia computacional apresenta-se como um instrumento extremamente relevante para a verificação da vitalidade das regras de formação de palavras. Essa área de estudos trabalha com o processamento das palavras de diversas formas, na derivação, na flexão ou na composição. Um dos modelos mais conhecidos na literatura da área é a Morfologia de Dois Níveis, que foi adotado em nossa pesquisa, principalmente porque trabalha em duas dimensões de análise: a grafêmica e a fonêmica. Essa área da morfologia computacional realiza a lematização e a etiquetagem morfossintática das palavras complexas, i.e, desenvolve a segmentação e a classificação de todos os morfemas que constituem essas palavras. Esse modelo de análise da estrutura das palavras está na base dos analisadores morfológicos que são construídos como transdutores de estados finitos.

A morfologia de dois níveis possui duas dimensões de análise: a superficial e a lexical. De acordo com Trost (2004), o nível superficial é aquele em que se analisam as palavras da maneira como elas são pronunciadas ou escritas na língua comum, gerando uma estrutura superficial. Já no nível lexical de análise, teremos a descrição da estrutura profunda das palavras, no qual se determina tanto a categorização gramatical delas como as informações fonêmicas ou grafêmicas e o uso de símbolos diacríticos para representar alterações morfofonológica e ortográfica..

Há também nesse modelo a representação das palavras através de dois princípios fundamentais: o morfotático e o morfofonólogico. O primeiro realiza todas as combinações possíveis de morfemas de acordo com as regras da língua. Por sua vez, o segundo componente descreve as regras ortográficas e morfofonológicas que são necessárias para a satisfatória

51 concatenação de morfemas para a formação de palavras. Da união desses dois conceitos surge um programa com a capacidade de analisar e gerar palavras lexicalizadas e também os neologismos A morfologia computacional tem diversas aplicações práticas. De acordo com Karttunen (2004), são muitas as aplicações computacionais que processam áreas da morfologia, como os: toquenizadores, os corretores ortográficos, a criação de tradutores automáticos e os lematizadores de palavras. Para estudarmos a sufixação em português através dos sufixos -eir e -ud, optamos pelo modelo computacional chamado Morfologia de Estados Finitos, um tipo de descrição que é capaz de reconhecer e gerar novas palavras, assim como é capaz também de gerar o aspecto flexional das palavras da Língua Portuguesa. Dentro da Morfologia de Estados Finitos, temos os Autômatos de Estados Finitos (FSAs), que são dispositivos capazes de reconhecer e analisar uma dada língua formal, i.e, determinar se uma seqüência dada é elemento daquela língua. A Morfologia de Estados Finitos funciona de modo a produzir uma sintaxe das palavras, ou seja, determina com elementos menores devem ser combinados para formar elementos maiores (morfotática). Por meio das expressões regulares, os autômatos processam uma estrutura de dados chamada de

rede de estados finitos. Veja diagrama de Beasley e Karttunen (2002, p.44): Língua {“a”}

Expressão regular a→ é compilada numa---> Rede de estados finitos:

so--- a --- -›fs1

Nessas redes de estados finitos temos um estado inicial S0 e um estado final fs1, entre esses dois estados temos vários arcos rotulados (a). Chamamos de estados finitos porque comportam um número limitado de transições de um arco para outro. Sobre este modelo gerativo-explicativo, Borba nos esclarece da seguinte forma (1976, p.62):

Chomsky compara este modelo a uma máquina com um número finito de estados, sendo um inicial e outro, final. Para cada transição de um estado a outro a máquina transmite um símbolo (ex: um fonema ou morfema) e cada uma dessas operações corresponde a uma instrução da máquina (ou uma regra da gramática). Cada seqüência assim produzirá uma palavra ou frase. Utilizamos em nosso trabalho as redes de estados finitos para representar a concatenação de morfemas que formam as palavras em Língua Portuguesa. De acordo com

52

Alencar (2008) há nessas redes um estado inicial so (representado na cor verde) e os estados finais representados em vermelho. Os estados intermediários são representados pela cor azul. Alguns arcos podem ter mais de um rótulo, como no arco que representa os estados 3 e 1, segundo Alencar, isto equivale a dizer que possuem múltiplas posições entre dois estados e são etiquetados como um conjunto de símbolos (que marca o gênero em Língua Portuguesa), como mostra o exemplo abaixo na figura15:

Para gerar essas redes de estados finitos (autômatos), utilizamos a linguagem de programação geral denominada Prolog ou programação lógica.

Os corpora investigados pertencem ao projeto Linguateca, que possui o recurso de busca AC/DC (Acesso a corpora/Disponibilização de corpora), que contém grande quantidade de textos disponíveis para a pesquisa e a testagem de vários fenômenos da Língua Portuguesa nas variantes portuguesa e brasileira. Porém, concentramos nossa análise nos exemplos do português do Brasil. A pesquisa que fizemos buscou a ocorrência de palavras cuja estrutura fosse terminada em -eir e -ud e tivesse como base uma das categorias lexicais envolvidas nos processos de formação de palavras: os nomes, adjetivos e verbos. Em nossa coleta, encontramos uma imensa quantidade de palavras, todas elas em seus respectivos contextos, que atendiam aos critérios por nós estabelecidos acima.

Os dados preliminares nos revelam a coerência de nosso pensamento, pois encontramos várias ocorrências de palavras formadas pela sufixação em -eir e -ud que obedecem plenamente aos critérios gramaticais da língua, reforçando a intuição que temos sobre o tema da formação de palavras. Os exemplos (4, 40), que estão organizados em nossos anexos, foram obtidos em nossa consulta:

(4): Ele disse acreditar que a greve acabará nesta sexta-feira, quando o dissídio dos petroleiros irá a julgamento no Tribunal Superior do Trabalho.

_______________

53 (40): Mas totalmente enchanté com a atual movimentação da arte brasileira, o editor da conceitudarevista Art Forum, Anthony Korner, resolveu transformar a reportagem em um número especial.

Ainda falando sobre os autômatos de estados finitos, quando uma língua é produzida por um programa deste tipo é denominada de língua de estados finitos. Um autômato descreve todos os elementos que pertencem a essa lingua regular, uma vez que suas regras são independentes de contexto, do tipo x→y (x gera y). Diante disso, os sufixos -eir e - ud foram submetidos a uma análise computacional com a tecnologia dos estados finitos. Vieira (2002, p.14) salienta as diversas aplicações que a morfologia computacional oferece para modelação de fenômenos morfológicos: “A implementação de analisadores léxico-morfológicos pode ser feita através de sistemas de índices, através de percurso em árvore, através de autômatos finitos, ou através de outras técnicas tais como a etiquetagem automática, bastante utilizada atualmente”.

Resumo: Este capítulo foi eleborado com o objetivo de mostrar um panorama geral da teoria que fundamentou nossa pesquisa. Nele, apresentamos os princípios fundamentais da teoria Gerativa na investigação de fenômenos morfológicos. Porém, não podemos descartar algumas boas idéias encontradas em obras de gramaticos tradicionais e autores estruturalistas. Ressaltamos principalmente as concepções sobre a formação de palavras lançadas por Anderson (1992) e Rocha (1998). Foi Embasado nesses autores que tentamos implementar computacionalmente o fenomeno da derivação com os sufixos -eir e -ud, pois aliamos conceitos gerativistas sobre a formaçao de palavras a uma aplicação baseada no modelo morfológico de estados finitos.

54

4 Questões e Metodologia

Neste capítulo, mostramos as principais questões e hipóteses que surgiram no desenvolvimento de nossa pesquisa, bem como a metodologia que utilizamos e os procedimentos de análise que adotamos. Apresentaremos aqui o modo como foram feitas as coletas e as análises que se encontram nos capítulos 5 e 6 desta dissertação.

Na seção 4.1, expomos os problemas que surgiram no decorrer de nossa pesquisa. Também nessa seção apresentamos as hipóteses sugeridas para resolução desses questionamentos, embasados nos postulados do gerativismo e da lingüística computacional. Concluímos esse capítulo com a seção 4.2, em que descrevemos a maneira como procedemos na análise dos resultados obtidos.

Documentos relacionados