• Nenhum resultado encontrado

CONSIDERAÇÕES SOBRE UM MODELO COMPUTACIONAL IMPLEMENTANDO CENTERING

No documento TATIANA DE OLIVEIRA PETRY (páginas 62-66)

Centering

6.2.1 Aspectos Gerais

Apresentam-se a seguir considerações voltadas à especificação de um modelo que permita a utilização de Centering na resolução de pronomes pessoais de terceira pessoa na língua portuguesa. Aponta-se, preliminarmente, elementos que deveriam compor o modelo.

A partir do estudo teórico de Centering e avaliação preliminar do corpus, algumas estruturas identificadas que deveriam ser representadas no modelo computacional seriam: segmentos, enunciados, entidades, Cp, Cb, Cf e histórico das co- referências já identificadas.

Conforme discutiu-se na seção 6.1, algumas dificuldades podem surgir para a aplicação de Centering quando a pesquisa é orientada a corpus. Estas dificuldades estão relacionadas com a riqueza estrutural da língua. O modelo original de

Centering (revisado no capítulo 5, seção 5.1.2), introduziu os conceitos de Cb, Cp e Cf

para enunciados e especificou transições (onde a prioridade entre transições descreve o modelo preferido para a interpretação de pronomes em enunciados). Entretanto, nem sempre a identificação do Cb e do Cp, ordenação de Cf e identificação de transições são tarefas triviais (vide comentários na seção 6.1).

54

6.2.2 Componentes do Modelo

Na Figura 3, apresentam-se componentes considerados necessários a um modelo que utilize Centering na resolução de pronomes, comentando-se, a seguir, a função de cada componente no modelo. O modelo foi esboçado a partir das leituras sobre Centering e da análise do corpus de trabalho.

Figura 3: Componentes do Modelo

No modelo original, Centering pode ser aplicado dentro de um segmento de discurso. Um segmento de texto, então, corresponde à unidade a ser avaliada. Esta unidade contém os pronomes a serem resolvidos e as entidades candidatas a antecedente.

Conforme é possível constatar com o que foi apresentado até este ponto, o segmento de texto deve ser processado e suas unidades de ‘enunciado’ devem ser reconhecidas. Este é o objetivo do módulo que identifica unidades de atualização de centro (Segmentador de enunciados para Centering).

O identificador de entidades, por sua vez, deve selecionar o conjunto de sintagmas nominais presentes em um enunciado (substantivos, pronomes e sujeitos

Segmentador de enunciados para Centering Identificador de entidades nos enunciados Classificador de entidades na lista Cf Classificador de transições Tabela de co- referências já identificadas Segmento de Texto

recuperáveis pela desinência verbal) enquanto o classificador de entidades deve reconhecer a função gramatical desempenhada pela entidade, devendo especialmente identificar “sujeitos”. Note-se, aqui, que o classificador de entidades, poderia utilizar outros critérios (vide seção 5.2.3).

Após as entidades terem sido classificadas, o classificador de transições busca identificar as transições possíveis para um enunciado no segmento. Note-se que isto pode não ser uma tarefa trivial quando as sentenças são complexas, pois pode ser difícil reconhecer a transição que ocorreu. Note-se, também, que a interpretação do pronome não é necessariamente intersentencial, sendo pertinentes as colocações de Kameyama (seção 5.2.2).

A tabela de co-referências é importante para a manutenção das relações

antecedente - termo anafórico já identificadas.

Mais especificamente, no modelo computacional:

1) Segmentos: correspondem a trechos de texto. Para o caso específico de resolução de pronomes pessoais de terceira pessoa, são trechos de texto que contêm pronomes pessoais e todo o contexto anterior necessário para interpretá-los;

2) Enunciados: podem corresponder a uma sentença simples ou uma sentença complexa mas, em se tratando de uma sentença complexa, pode haver mais de uma unidade de atualização de centro;

3) Entidades: todos os sintagmas nominais explícitos no segmento e também aqueles recuperáveis pela desinência verbal.

4) Cf de um enunciado: composto de todos os sintagmas nominais que aparecem em um enunciado.

5) Histórico das co-referências já identificadas: é mantido em memória, pois é relevante, quando ocorre por sentenças consecutivas a retomada de uma mesma entidade por formas pronominais.

56

6.3

Considerações

Neste capítulo apresentaram-se, com base em exemplos retirados de um corpus de trabalho, algumas questões que precisam ser endereçadas com respeito ao uso de Centering para resolução de pronomes em textos reais. Estas questões, resumidamente, dizem respeito a:

−pertinência ou não de pronomes de primeira e segunda pessoa ao conjunto Cf;

−como identificar segmentos e unidades de atualização de centro;

−como proceder a classificação de entidades em enunciados mais complexos.

Após, esboçou-se um modelo, descrevendo-se componentes necessários na implementação de Centering visando seu uso na resolução de pronomes, e teceram- se considerações sobre pesquisas adicionais necessárias para o aperfeiçoamento do modelo e uso de Centering em maior escala para análise de textos reais.

No capítulo a seguir, descrevem-se o experimento realizado e resultados obtidos, aplicando-se pressupostos da teoria de Centering na resolução de pronomes. O experimento não se limita, contudo, à exploração da teoria de Centering, tendo em vista que, para a resolução de pronomes, alguns conhecimentos como restrição de gênero e número são facilmente aplicáveis na restrição ou escolha dos candidatos a antecedente. Além disso, como já foi mencionado no decorrer do capítulo, para aplicar Centering integralmente, em textos reais, um refinamento adicional da teoria, parece ser necessário.

Também, a necessidade de uso de múltiplas fontes de conhecimento para resolução de anáforas, conforme delineado desde os capítulos introdutórios desta dissertação, tem sido consenso por parte de pesquisadores, seja na área de lingüística, ciências cognitivas ou PLN.

7

EXPERIMENTO

Neste capítulo descreve-se o experimento realizado, com respeito a resolução de pronomes pessoais de terceira pessoa na língua portuguesa. Embora ênfase seja dada a teoria de Centering, para o experimento obter melhores resultados na seleção do antecedente, utilizaram-se também informações relativas a gênero, número e recentidade das entidades.

No documento TATIANA DE OLIVEIRA PETRY (páginas 62-66)