• Nenhum resultado encontrado

APLICAÇÃO DE CENTERING BASEADA EM CORPORA

No documento TATIANA DE OLIVEIRA PETRY (páginas 57-62)

A aplicação da teoria de Centering na resolução de anáforas tem sido sugerida como uma forma de limitar a inferência necessária para identificação do antecedente correto de um termo anafórico. Um algoritmo baseado nesta teoria daria como resultado o antecedente preferencial, do ponto de vista pragmático, para um pronome ou algum outro tipo de anáfora usada no contexto local (isto é, referenciando uma entidade dentro de um segmento de discurso).

Um exemplo como o segmento 2 da seção precedente (extraído de um corpus real) auxilia na fundamentação da teoria e coloca alguma luz sobre as questões que devem ser tratadas para a língua portuguesa. Uma conclusão óbvia no momento é a necessidade de um mecanismo para reconhecer quando existem sujeitos recuperáveis pela desinência verbal e, dessa forma, colaborar na correta identificação dos centros. Já o segmento 1, um exemplo construído, tem grande importância para a explicação da teoria e seus fundamentos. Entretanto, exemplos com sentenças relativamente simples como estes não são o padrão em textos reais (o primeiro é um exemplo “construído” com a finalidade de fundamentar a teoria e o segundo foi “selecionado” de um corpus por exibir comportamentos que se desejava comentar) e algumas dificuldades ao aplicar

14

No enunciado E3 “Se ∅ vierem à aldeia”, o símbolo ∅ está indicando a existência de um sujeito lexicalmente não explícito para o verbo “vierem”

a teoria para estes ficam subjacentes. Em ambos os exemplos, a estrutura das sentenças apresentadas, é bastante simples (sujeito + verbo + objeto) e a segmentação em termos de enunciados não é um problema, bem diferente do que ocorre para textos reais.

Para a aplicação da teoria em textos reais, conforme pôde-se constatar, dois conceitos desempenham papel preponderante e determinam boa parte do sucesso do experimento. Tratam-se dos conceitos de segmento de discurso e de enunciado.

Para conceituar “segmento” James Allen, em [Allen 94], oferece as seguintes contribuições:

- um segmento é um trecho de um discurso no qual as sentenças estão falando do mesmo tópico; e

- um segmento é uma seqüência de sentenças, possivelmente interrompidas por subsegmentos, cujo aspecto mais importante é exibir uma estrutura hierárquica.

Estas conceituações, na prática, são complementares. Segmentos podem ter subsegmentos embutidos, o que mostra que, não necessariamente, as sentenças que compõem um segmento são linearmente adjacentes. Mas a segmentação continua sendo uma tarefa de decisão complexa, ao mesmo tempo que é fator determinante no êxito do uso de Centering.

Referente a enunciado, a conceituação mais precisa parece ser a dada por Strube, em [Strube 96]: um enunciado E é uma sentença simples, uma sentença

complexa ou cada cláusula de uma sentença composta.

Walker et al., em [Walker 98], já mencionam que várias questões relacionadas à aplicação da teoria surgem, quando a pesquisa é orientada a corpus. Uma delas é justamente a segmentação do discurso em enunciados. Os resultados de nossa investigação conferem com esta afirmação: necessidade de definir o modo como delimitar os enunciados em um segmento de texto para aplicação de Centering ou, dito de outra forma, descobrir qual o melhor critério para segmentação de enunciados. Isto

50

inclui decisões de como tratar orações coordenadas (como um único enunciado ou como dois enunciados separados) ou de como entidades em orações subordinadas afetam a ordem do Cf.

O conceito preciso de enunciado é importante pois, deste conceito, depende a composição do conjunto de entidades que estão presentes no Cf, e que são as candidatas potenciais a pronominalização no enunciado seguinte.

De forma diferente, mas enfocando o mesmo problema, qual seja, quais as entidades que compõem o Cf, algumas questões levantadas na literatura dizem respeito ao tratamento de sentenças complexas: Di Eugenio, por exemplo, em [Di Eugenio 96], coloca o problema de definir como subordinadas afetam a ordenação do Cf, e discute se deveria haver um único conjunto Cf para a cláusula principal e para a cláusula subordinada, ou dois conjuntos de entidades distintos.

Outra questão interessante, levantada por Di Eugenio ainda em [Di Eugenio 96], é a questão dos dêiticos (por exemplo, os pronomes eu e você): deveriam estes ser incluídos no conjunto Cf?

Estas questões são de extrema relevância quando vamos tratar segmentos de textos reais (não construídos para demonstrar uma determinada propriedade). Por isso, na definição de um algoritmo baseado em Centering, é necessário levar as questões acima discutidas em consideração.

A título ilustrativo, considere o exemplo a seguir extraído do nosso corpus de estudo: Segmento de discurso 3: E1: 'HFLGLUiSLGR E2: YRXSDUDDÉIULFDEXVFDUXPDPDFDFDVySDUDPLPGDTXHODVTXHLPLWDPWXGR E3: 9RXHQVLQiODDVHUXPDPDFDFDEUX[D OD DPDFDFD E4: HHODYDLPHDMXGDUDID]HUPiJLFDVHIHLWLoRV HOD DPDFDFD

Uma análise possível:

E1: Cb = [?]; Cf = []; Transição = inexistente

E2: Cb= [?]; Cf=[a África, uma macaca, daquelas macacas]; Transição = ?

E3: Cb = [a macaca]; Cf =[a macaca, uma macaca-bruxa]; Transição = CONTINUE

E4: Cb = [a macaca]; Cf =[a macaca, mágicas, feitiços]; Transição = CONTINUE

Várias questões podem ser levantadas com respeito a esse segmento:

1) O pronome “eu”, não explícito (mas recuperável pela desinência dos verbos ‘decidi’ e ‘vou’), nos enunciados do segmento 3, deveria fazer parte do conjunto Cf de entidades?

2) O fato de o sujeito ser o pronome “eu” altera a ordenação das entidades que compõem o conjunto Cf ?

3) “Vou ensiná-la a ser uma macaca-bruxa e ela vai me ajudar a fazer mágicas e feitiços.” deveria ser considerado como um único enunciado ou como composto por dois enunciados?

4) Qual a transição existente entre E1 e E2 dado que não existe Cb e Cp

em nenhum dos dois enunciados?

5) Como classificar as entidades que compõem o Cf no enunciado E2?

Pode-se tecer algumas considerações relativas a estas questões (respectivamente):

1) Quanto ao pronome “eu”, considera-se que o mesmo não faça parte do conjunto Cf, tendo em vista que o corpus de trabalho é constituído de histórias narradas em primeira pessoa, onde o “eu” é sempre o narrador. Além disso, como se está trabalhando com a resolução de pronomes de terceira pessoa, o “eu” não é um candidato válido a

52

antecedente. Entretanto, pronomes de primeira e segunda pessoa (por exemplo, eu e você) fazerem parte da lista Cf é ainda uma questão em aberto. Byron e Stent, em [Byron 98], sugerem que o tratamento de pronomes de primeira e segunda pessoa ainda é uma questão complexa para Centering, exigindo uma investigação maior quanto a sua pertinência ou não ao contexto local trabalhado.

2) Já que estamos considerando que o pronome “eu” não faz parte da lista Cf, quando o sujeito se trata da entidade “eu”, o candidato mais altamente classificado passa a ser aquele que ocupa a posição de objeto.

3) A segmentação em enunciados, como já discutiu-se anteriormente, é uma questão complexa, e não fechada em estudos de Centering. Kameyama, em [Kameyama 98], sugere, que a atualização de centros pode ser seqüencial ou hierárquica, e que a dependência entre unidades de atualização de centro pode depender, por exemplo, do tipo de conetivos que vinculam as orações. Neste exemplo específico pode-se observar que o pronome “la” retoma “a macaca”, definindo esta entidade como um centro e “ela” retoma a mesma entidade. Tratando-se de uma sentença complexa, ligada por coordenação, a melhor alternativa parece ser considerar a existência de duas unidades de atualização de centro.

4) Talvez, se considerarmos que os dois enunciados estão na primeira pessoa, possamos julgar que a transição observada seja um CONTINUE. Entretanto, esta alternativa ainda precisa ser melhor ponderada.

5) O enunciado E2 se refere a uma sentença complexa, e requer o

estabelecimento de critérios para classificação das entidades que compõem o Cf. É um caso mais complexo, dado que, tanto ‘África’,

quanto ‘macaca’ são complementos verbais. Outros fatores, teriam de ser levados em conta.

No documento TATIANA DE OLIVEIRA PETRY (páginas 57-62)