A proposta de Grosz e Sidner - ESTRUTURAÇÃO DO DISCURSO: PROPOSTAS E PERSPECTIVAS

4.3 ESTRUTURAÇÃO DO DISCURSO: PROPOSTAS E PERSPECTIVAS

4.3.1 A proposta de Grosz e Sidner

Grosz e Sidner em [Grosz 86] propuseram uma teoria computacional que apresenta um conjunto de premissas para o processamento dos enunciados em um discurso. Nessa teoria, três estruturas distintas presentes em um discurso são descritas: a estrutura lingüística, o estado atencional e a estrutura intencional. Embora distintas, estas estruturas são inter-relacionadas e servem para coordenar o processamento do discurso.

As autoras argumentam que um bom modelo da estrutura do discurso deve dar conta de descrever diferentes fenômenos que ocorrem em discursos reais, como interrupções, explicação do uso de certos tipos de expressões de referência e de expressões que afetam a segmentação do discurso e estrutura.

De forma geral, os elementos básicos de cada uma dessas estruturas são:

• Estrutura lingüística: compõe-se de enunciados. Enunciados se agregam naturalmente e formam segmentos.

• Estrutura intencional: inclui os propósitos relevantes do discurso expressos em cada um de seus segmentos lingüísticos, bem como a relação entre esses propósitos.

• Estado atencional: contempla os objetos, propriedades e relações que são salientes em cada ponto do discurso. Registra, de forma abstrata, o foco de atenção dos participantes do discurso.

Particularmente importante para nós é a especificação do estado atencional, modelado nessa teoria como uma pilha, que determina a “saliência” das entidades num determinado ponto do discurso, afetando a interpretação de pronomes e outros termos referenciais.

4.3.1.1 Pespectivas computacionais

Nesta proposta, o estado atencional fornece os elementos necessários para usar as informações disponíveis nas outras estruturas na geração e interpretação de enunciados, armazenando informação de enunciados prévios, essencial para o processamento de enunciados subseqüentes.

A estrutura lingüística pode oferecer: (1) informações sobre a estrutura do discurso pelo emprego de expressões lingüísticas, (2) indicações (talvez parciais) dos limites dos segmentos, pelo uso explícito de certas palavras ou expressões ou, implicitamente, por meio de pistas mais sutis como entonação (em discursos falados) ou mudança de tempo e modo, e (3) por meio de marcadores lingüísticos, indícios de alterações no estado atencional ou na estrutura intencional.

Intenções estabelecem entre si certas relações estruturais que dão origem a uma representação interna da estrutura do discurso. Duas relações particularmente importantes, são: dominância e precedência de satisfação. Essas relações são assim conceituadas:

•Relação de dominância: quando um propósito PSD1 de um segmento

SD1 contribui para PSD2 de um segmento SD2 há uma relação de dominância entre intenções: PSD2 DOM PSD1 (PSD2 domina PSD1).

•Relação de precedência de satisfação: quando precisamos ter PSD1

satisfeito antes de PSD2 temos uma relação de precedência de satisfação: PSD1 PreSat PSD2. Esta segunda relação é particularmente importante para alguns tipos de discurso, como diálogos orientados a tarefa, onde a ordem em que um PSD é satisfeito pode ser relevante).

Na pilha que modela o estado atencional, espaços de foco são associados a cada segmento de discurso (SD). A figura 2, extraída de [Grosz 86], representa, de forma abstrata, a relação entre essas diferentes estruturas.

Figura 2: Estrutura de Focalização [Grosz 86]

O exemplo ilustra a pilha de espaços de foco quando o segmento de discurso SD3 está sendo processado. SD3 gera o espaço de foco EF3 que, além dos objetos, propriedades e relações que são salientes naquele segmento, contém também o

SD1 SD2 SD3 Propriedades Objetos Relações PSD3 EF3 Propriedades Objetos Relações PSD1 EF1

Segmentos de discurso Pilha dos espaços de foco Hierarquia de dominância

PSD1 DOM PSD3

PSD3. Devido à hierarquia de dominância entre propósitos de segmentos de discurso, o espaço de foco EF1 permanece na pilha, pois PSD1 domina PSD3. O espaço de foco gerado por SD2 foi retirado da pilha, dado que seu propósito PSD2 não domina PSD3.

Espaços de foco são colocados ou retirados da pilha atencional conforme informações disponíveis na estrutura lingüística ou na estrutura intencional.

O empilhamento dos espaços de foco reflete a saliência relativa das entidades dado um particular estado atencional.

Em vista da estrutura segmental proposta para discursos, Centering foi formulado como um modelo para ser aplicado em nível local, ou seja, dentro de segmentos. Sintagmas nominais completos e pronomes, segundo esta teoria, têm princípios de localidade diferentes.

Uma das funções da estrutura de focalização é restringir a busca a possíveis referentes de sintagmas nominais completos e pronomes.

4.3.2 A proposta de Walker

Walker, em [Walker 98], propõe a substituição da estrutura de pilha do estado atencional por um modelo de “cache”10. Este modelo descreveria, por diferenças na coerência, e na carga de inferência exigida de um leitor ou ouvinte em determinadas situações (quando um enunciado é hierarquicamente recente a outro, mas não linearmente recente), que não são capturadas pelo modelo de pilha do estado atencional.

Além disso, Walker propõe que a restrição de aplicar Centering somente dentro de segmentos deveria ser abandonada porque: (1) centros freqüentemente continuam além do limite de segmentos, (2) ouvintes percebem limites de segmentos em diferentes níveis de granularidade e (3) há fortes contrastes entre enunciados cujo

Uma cache é uma memória temporária usada para armazenar informação que está sendo usada correntemente por um processo computacional (apud [Walker 98])

enunciado prévio é linearmente recente e aqueles cujo enunciado prévio é hierarquicamente recente.

Walker afirma que, “da forma como a recentidade hierárquica é operacionalizada pelo modelo de pilha, não prediz quanto centros prévios são acessíveis” e argumenta que integrando Centering com um modelo de estrutura global do discurso, simultaneamente soluciona estes problemas pela substituição do modelo de pilha pelo modelo de cache.

Walker aponta que, no modelo integrado resultante:

• Centros são elementos da cache e o modelo de cache media a acessibilidade aos centros;

• Centros estão disponíveis além do limite de segmentos por default; • Dificuldades no processamento são previstas para a interpretação dos

centros cujos co-especificadores não são linearmente recentes;

• A granularidade da segmentação do discurso não tem efeito sobre o modelo.

No modelo proposto há dois tipos de memória: a memória principal, que representa a memória de longo prazo, e a cache que representa a memória de trabalho. “A memória principal é maior que a cache, mas é de acesso mais lento. A cache tem uma capacidade limitada, quase instantaneamente acessível”.

Walker assume as seguintes hipóteses para o modelo:

• tamanho da cache é limitado a duas ou três sentenças, ou aproximadamente sete proposições (segundo Walker, esta hipótese é baseada em descoberta de trabalhos prévios). A aplicação desta hipótese tem como resultado que “um enunciado Ei é linearmente

recente para um enunciado Ej quando ele ocorreu dentro dos últimos

• Itens da cache podem ser retidos ou fornecidos para a memória principal. Itens na memória principal também podem retornar para a cache.

• Quando a cache recebe itens da memória principal ou novos itens, outros são deslocados para a memória principal, dado que a cache tem capacidade limitada.

• A determinação de quais itens deslocar é dada por uma política de

substituição na cache.

Walker observa que “da forma como a recentidade hierárquica é operacionalizada pelo modelo de pilha, não prediz quanto centros prévios são acessíveis”.

Mostra este fato pelo contraste entre os exemplos detalhados a seguir:

([HPSOR (1) C:2N+DUU\(XWHQKRXPSUREOHPDTXHXKPLQKD²FRPDHFRQRPLDGHKRMHPLQKD ILOKDHVWiWUDEDOKDQGR (2) H: (XQmRFRQVHJXLRXYLUVHXQRPH (3) C: +DQN (4) H: 3URVVLJD+DQN (5) (a) C: EHPFRPRVHXXKPDULGR (b) (OHVWHPXPDFULDQoD (c) HHOHVWUD]HPDFULDQoDSDUDQyVWRGRGLDSDUDTXHFXLGHPRVGHOD ([HPSOR (1) C: 2N+DUU\(XWHQKRXPSUREOHPDTXHXKPLQKD²FRPDHFRQRPLDGHKRMHPLQKD ILOKDHVWiWUDEDOKDQGR (2) H: (XQmRFRQVHJXLRXYLUVHXQRPH

34 (3) C: +DQN H: 0HGHVFXOSHHXQmRSXGHRXYLUYRFr C: +DQN H: e+$1." C: 6LP. (4) H: 3URVVLJD+DQN (5) (a) C: EHPFRPRVHXXKPDULGR (b) (OHVWHPXPDFULDQoD (c) HHOHVWUD]HPDFULDQoDSDUDQyVWRGRGLDSDUDTXHFXLGHPRVGHOD

No exemplo 1, a expressão anafórica “seu marido”, é mais difícil de interpretar que em 2.

4.4 Considerações

Neste capítulo revisaram-se duas propostas de modelagem de discurso: uma de Grosz e Sidner, e outra de Walker. Em comum, as duas propostas têm o fato de contemplarem a questão da atualização de centros em discursos. No modelo de Grosz e Sidner, deve-se reconhecer interrupções e subsegmentos e gerenciar a acessibilidade das entidades mediante emprego de um mecanismo de pilha para o estado atencional. Mas, Walker argumenta que essa abordagem deveria ser abandonada, pois, quando ocorrem interrupções ou subsegmentos embutidos, a interpretação de expressões referenciais torna-se mais difícil, mesmo para seres humanos e, um modelo mais apropriado, em termos de coerência, seria o modelo de “cache”.

Controvérsias a parte, o que qualquer um dos modelos busca e que é relevante para o tratamento de pronomes, é saber quais entidades são salientes em diferentes pontos em um discurso. O modelo de Grosz e Sidner parece mais sofisticado, exigindo reconhecimento de intenções, relações e segmentos e estas são, ainda, questões

que não têm um tratamento completo (ou talvez, adequado) do ponto de vista computacional.

Passonneau e Litman ressaltam muito bem o quão incipientes são os dados e conclusões sobre como segmentar discursos e quais elementos avaliar para proceder essa segmentação.

No capítulo a seguir, é apresentada a teoria de Centering, cuja preocupação é, justamente, a dinâmica da saliência das entidades, quais recursos dos quais se servir para identificar essa saliência, e qual a maneira mais coerente de interpretar expressões anafóricas.

5 CENTERING: ESPECIFICAÇÃO DO MODELO E DIREÇÕES

DE PESQUISA

A revisão apresentada aqui tem por base a publicação da revista

Computational Linguistics de 1995 [Grosz 95], entretanto existem duas versões

anteriores não publicadas que circularam entre pesquisadores (uma de 1983 e uma de 1986) e que suscitaram o desenvolvimento de pesquisas relacionadas. O capítulo inicia evidenciando as questões básicas vinculadas a Centering para, mais adiante, apresentar estudos relacionados à teoria relatados em textos científicos.

No documento TATIANA DE OLIVEIRA PETRY (páginas 37-45)