TATIANA DE OLIVEIRA PETRY

(1)

USO DA TEORIA DE CENTERING NO TRATAMENTO COMPUTACIONAL

DE REFERÊNCIAS ANAFÓRICAS PRONOMINAIS NO PORTUGUÊS ESCRITO: UMA EXPERIMENTAÇÃO COM PRONOMES PESSOAIS

Dissertação apresentada como requisito parcial à obtenção do grau de mestre.

Programa de Pós-Graduação em Ciência da Computação,

Faculdade de Informática,

Pontifícia Universidade Católica do Rio Grande do Sul. Orientadora: Profa. Dra. Vera Lúcia Strube de Lima.

PORTO ALEGRE 2000

(2)

À minha família, especialmente aos meus pais, pelo amor, carinho, apoio e compreensão.

À Profa. Vera Lúcia Strube de Lima pela orientação, amizade e dedicação durante o desenvolvimento deste trabalho.

Ao Prof. Flávio Moreira de Oliveira pelo apoio e orientação nos trabalhos individuais.

Ao Stewart pelo auxílio no desenvolvimento do protótipo.

(3)

i

SUMÁRIO

SUMÁRIO... I LISTA DE FIGURAS... IV LISTA DE TABELAS ... IV LISTA DE ABREVIATURAS...V RESUMO ... VI ABSTRACT ...VII 1 INTRODUÇÃO ...1 1.1 MOTIVAÇÃO...1 1.2 ORGANIZAÇÃO DO TEXTO...4 2 EXPOSIÇÃO DO PROBLEMA ...5 2.1 REFERÊNCIA...5 2.1.1 Tipos de referência ...6 2.1.2 Co-referência ...7

2.1.3 Funções referenciais de pronomes ...7

2.1.4 Relações anafóricas...8

2.2 UMA ESTRUTURA PARA RESOLUÇÃO DE REFERÊNCIAS...10

2.3 CONSIDERAÇÕES...12

3 ABORDAGENS COMPUTACIONAIS PARA RESOLUÇÃO DE ANÁFORAS PRONOMINAIS...13

3.1 A ABORDAGEM DE TETSUYA NASUKAWA PARA RESOLUÇÃO DE PRONOMES...13

3.1.1 Critérios propostos ...14

3.1.2 Descrição do experimento ...15

3.1.3 Resultados do experimento ...15

3.2 A ABORDAGEM DE MITKOV PARA RESOLUÇÃO DE PRONOMES...16

3.2.1 Características dos experimentos ...16

3.2.2 Critérios estabelecidos ...17

3.2.3 Exemplo de aplicação dos critérios ...18

3.3 A ABORDAGEM DE BRECK BALDWIN...19

3.3.1 Regras estabelecidas para identificação de antecedentes de pronomes...20

3.4 O ALGORITMO DE LAPPIN E LEASS...21

3.4.1 Características do algoritmo ...21

3.4.2 Características do experimento ...21

3.4.3 Módulos componentes ...22

3.4.4 Resultados do experimento ...22

4 RESOLUÇÃO DE ANÁFORAS E ESTRUTURA DO DISCURSO...24

4.1 CONCEITOS BÁSICOS...25

4.1.1 Discurso...25

4.1.2 Enunciado ...25

4.1.3 Segmento...25

4.2 SOBRE A NECESSIDADE DE UMA DESCRIÇÃO DA ESTRUTURA DO DISCURSO...26

4.2.1 Considerações de Passonneau e Litman sobre segmentação de discurso ...26

4.3 ESTRUTURAÇÃO DO DISCURSO: PROPOSTAS E PERSPECTIVAS...28

(4)

5 CENTERING: ESPECIFICAÇÃO DO MODELO E DIREÇÕES DE PESQUISA ...36

5.1 A TEORIA DE CENTERING...36

5.1.1 Objetivo ...36

5.1.2 Modelo proposto pela teoria...36

5.2 EXTENSÕES PROPOSTAS E PESQUISAS RELACIONADAS À CENTERING...39

5.2.1 O algoritmo de Brennan, Friedman e Pollard...39

5.2.2 Uma revisão da proposta de Kameyama para Centering intra-sentencial...40

5.2.3 Observações de Sharon Cote ...41

5.2.4 Considerações de Craig Roberts sobre o lugar de Centering em uma teoria geral de resolução de anáforas ...43

6 APROPRIAÇÃO DOS FUNDAMENTOS TEÓRICOS PARA USO DE CENTERING NA RESOLUÇÃO DE PRONOMES ...45

6.1 APLICAÇÃO DE CENTERING BASEADA EM CORPORA...48

6.2 CONSIDERAÇÕES SOBRE UM MODELO COMPUTACIONAL IMPLEMENTANDO CENTERING...53

6.2.1 Aspectos Gerais ...53

6.2.2 Componentes do Modelo ...54

7 EXPERIMENTO ...57

7.1 ESCOLHAS REALIZADAS...57

7.1.1 Escolha do conjunto de pronomes a tratar...57

7.1.2 Escolha do corpus para estudo...57

7.2 REVISÕES...58

7.2.1 Pronomes pessoais na língua portuguesa...58

7.2.2 Conhecimentos úteis na resolução de pronomes pessoais...59

7.3 DECISÕES DE PROJETO...60

7.3.1 Marcação para sujeitos recuperáveis pela desinência verbal...61

7.3.2 Importância da noção de estrutura de discurso coerente...62

7.3.3 Constituição do conjunto de candidatos a antecedente...64

7.3.4 Filtro de candidatos inapropriados ...64

7.3.5 Pronomes avaliados...65

7.3.6 Pré-processamento ...65

7.3.7 Marcação de um sintagma nominal como sujeito ...65

7.3.8 Processamento das sentenças ...66

7.4 O PROTÓTIPO DESENVOLVIDO...66 7.5 RESULTADOS OBTIDOS...70 7.5.1 Análise 1 ...71 7.5.2 Análise 2 ...71 7.6 CONSIDERAÇÕES...72 8 CONCLUSÃO...73

8.1 O TRABALHO NO CONTEXTO DO GRUPO DE PLN DA PUCRS ...73

8.2 CONSIDERAÇÕES SOBRE ESTE TRABALHO...74

8.3 SOBRE OS RESULTADOS DO TRABALHO...76

8.4 TRABALHOS FUTUROS...78

9 REFERÊNCIAS BIBLIOGRÁFICAS...79

10 FONTE DO CORPUS ...84

(5)

iii

ANEXO B ...86

(6)

LISTA DE FIGURAS

FIGURA 1: ESTRUTURA GERAL DE UM SISTEMA DE RESOLUÇÃO DE REFERÊNCIA [POPESCU-BELIS 97] ...11

FIGURA 2: ESTRUTURA DE FOCALIZAÇÃO [GROSZ 86]...30

FIGURA 3: COMPONENTES DO MODELO...54

FIGURA 4 - MENU DO APLICATIVO...67

FIGURA 5: INTERFACE DO PROTÓTIPO IMPLEMENTADO...68

FIGURA 6: INTERFACE DO DICIONÁRIO...70

LISTA DE TABELAS

TABELA 1: CLASSIFICAÇÃO DE REFERÊNCIAS (EXEMPLOS TRANSCRITOS DE [KOCH 89]) ...6

TABELA 2: CORRELAÇÃO ENTRE SELEÇÃO CORRETA E SELEÇÃO DE ACORDO COM CADA TIPO DE PREFERÊNCIA [NASUKAWA 94] ...15

TABELA 3: PONTUAÇÃO PARA “THE DRAWER” [MITKOV 98] ...19

TABELA 4: PONTUAÇÃO PARA “THE LIT PAPER PORT LED” [MITKOV 98]...19

TABELA 5: ILUSTRAÇÃO DOS MOVIMENTOS POSSÍVEIS PARA O "CENTRO" DOS ENUNCIADOS...38

TABELA 6: EXTENSÃO DE BRENNAN, FRIEDMAN E POLLARD...40

TABELA 7: TRANSIÇÕES DE CENTERING [WALKER 98]...46

TABELA 8: DISTRIBUIÇÃO PRONOMINAL NOS TEXTOS DESCRITIVOS...58

TABELA 9: DISTRIBUIÇÃO PRONOMINAL NOS TEXTOS NARRATIVOS...58

TABELA 10: PRONOMES PESSOAIS DA LÍNGUA PORTUGUESA...59

TABELA 11: EXEMPLOS DE DI EUGENIO COMPARANDO USO DE PRONOMES CLAROS E NULOS NA POSIÇÃO DE SUJEITO...63

(7)

v

LISTA DE ABREVIATURAS

PLN Processamento de Linguagem Natural SN Sintagma Nominal

SV Sintagma Verbal

Cb Backward-Looking Center Cf Forward-Looking Centers Cp Próximo centro preferencial

(8)

RESUMO

Esta dissertação pretende ser uma contribuição em direção à compreensão de linguagem natural por sistemas computacionais, tendo como foco a resolução de referências pronominais pessoais anafóricas de terceira pessoa na língua portuguesa brasileira.

Inicialmente, caracteriza-se o fenômeno lingüístico da anáfora em discursos. A seguir apresentam-se estratégias encontradas na literatura para resolução deste tipo de referência, o escopo trabalhado nestas estratégias e seus resultados. Após, procede-se um estudo mais detalhado sobre a teoria de Centering, que é uma teoria atual endereçando a questão da resolução de anáforas.

Considerando a relevância que esta teoria tem adquirido na atualidade (veja-se o número de trabalhos publicados envolvendo a teoria em conferências e revistas especializadas), busca-se evidenciar sua aplicação à língua portuguesa, incluindo, em modelo implementado, idéias oriundas da teoria e tecendo considerações sobre sua utilidade na resolução de pronomes.

Por fim, descreve-se um experimento realizado com um corpus composto por textos narrativos de histórias infantis, com o objetivo de explicitar conhecimentos úteis no processo de resolução de referências anafóricas pronominais pessoais e validar a participação destes conhecimentos em uma modelagem computacional.

(9)

vii

ABSTRACT

This dissertation aims to be a contribution towards natural language understanding by computational systems, focusing on the resolution of anaphoric personal pronominal references of the third persons in Brazilian Portuguese language.

Initially, we will characterize the linguistic phenomenon of anaphora in discourse. Next, we will present strategies found in literature for the resolution of this kind of reference, the scope investigated on these strategies and their results. Afterwards, a more detailed study about the Centering theory will be discussed, that is a current theory addressing anaphora resolution.

Considering the importance that this theory has achieved at the present time (judging from the number of publications involving the theory at specialized conferences and journals), we try to make its application to Portuguese language clear including in an implemented model, ideas derived from the theory and commenting on its utility on pronoun-problem resolution.

Finally, we will describe an experiment made with a corpus composed by narrative texts of children stories, with purpose to recognize useful knowledge in the process of resolution of anaphoric personal pronominal references in Brazilian Portuguese language, and to validate the role of this knowledge in a computational modeling of reference resolution.

(10)

A linguagem humana é tema de investigação de diferentes áreas, tais como lingüística, ciências cognitivas e computação, na linha de pesquisas em Processamento da Linguagem Natural (PLN).

Como cientistas da computação, nosso interesse fundamental centra-se em algoritmos, estruturas de dados e modelos formais de representação e raciocínio que permitam, ao menos em parte, simular a capacidade humana de uso da linguagem.

Como capacidade humana de uso da linguagem podem-se distinguir pelo menos dois processos: geração e compreensão de linguagem. O processo de geração engloba a produção de discurso (escrito ou falado, texto ou enunciados em um diálogo) por seus participantes nos papéis de escritor ou falante. O processo de compreensão da linguagem envolve a interpretação do discurso – identificação das entidades mencionadas no discurso, estabelecimento de relações, reconhecimento de intenções e inferências necessárias, uso de conhecimento contextual e de mundo – pelos leitores ou ouvintes.

Do ponto de vista da computação, estudos contemplando tanto compreensão quanto geração de linguagem por sistemas computacionais têm sido desenvolvidos, e sua utilidade pode ser evidenciada para diferentes aplicações. Com objetivos e métodos distintos, aplicações que se podem beneficiar do uso de alguma técnica de processamento da linguagem incluem interfaces que permitam a interação do usuário com o computador utilizando linguagem natural, information retrieval, sumarização de textos e tradução automática.

Independente da diversidade de aplicações, contudo, o princípio geral permanece o mesmo: construir uma representação interna do texto (ou do diálogo),

(11)

2

apoiando-se ao mesmo tempo em regras lingüísticas e em conhecimentos extra-lingüísticos inseridos no sistema [Fuchs 93].

Greene, em [Greene 95], coloca que, para a psicologia cognitiva, várias questões associadas ao uso da linguagem podem ser traduzidas em “como o conhecimento é representado na memória”. Para reduzir o problema, então, a proporções gerenciáveis, usualmente tem-se desdobrado o conhecimento lingüístico necessário ao uso da linguagem em vários tópicos, que têm sido estudados em isolado em relação aos outros.

Esta atitude também é assumida por cientistas da computação, que procuram isolar classes de problemas distintos e endereçá-los separadamente. Allen, em [Allen 94], por exemplo, organizou seu livro sobre sistemas de compreensão da linguagem em torno de três níveis de representação, a saber: a estrutura sintática, a forma lógica e a representação final do significado. Isto tem a virtude, segundo ele, de “permitir que se estude cada problema em profundidade sem preocupação com outras complicações”.

Neste trabalho, assume-se a visão de que a resolução de anáforas seja, também, somente uma parte do problema da compreensão de discursos por sistemas computacionais, sendo, entretanto, uma etapa importante e necessária.

Resolver uma anáfora é, em essência, determinar o antecedente de um termo ou expressão anafórica. Computacionalmente, contudo, é uma tarefa complexa exigindo conhecimento de natureza diversa pois, em geral, há uma multiplicidade de antecedentes possíveis, tornando necessário aplicar um algoritmo para filtrar candidatos inválidos, e classificar os candidatos válidos segundo critérios de saliência.

Buscando, ao mesmo tempo, estabelecer um ranking de saliência para as entidades mencionadas no discurso, e fornecer uma descrição da coerência exibida por um segmento de discurso, a teoria de Centering [Grosz 95, Brennan 87, Di Eugenio 90,

(12)

Di Eugenio 96, Di Eugenio 98, Kameyama 98, Strube 99] tem sido alvo de consideráveis investigações.

Segundo Kameyama, em [Kameyama 98], “a especificação da dinâmica da saliência é um passo crucial em direção a uma teoria formal da pragmática do discurso, e Centering focaliza as inter-relações entre a dinâmica do centro e a forma do enunciado”.

Este trabalho tem como foco a resolução de referências anafóricas pronominais pessoais de terceira pessoa na língua portuguesa e o uso de Centering no processo de resolução. A opção por tratar esta classe de expressões de referência foi motivada pela constatação de que os artigos relacionados à teoria de Centering (publicações entre os anos de 1995 e 1999) contemplavam mais freqüentemente esta categoria, sendo por isto, a que permitiria comparação com a língua portuguesa.1

Tendo se definido o objetivo de tratar pronomes pessoais de terceira pessoa na língua portuguesa, procedeu-se uma avaliação de textos para adotar um corpus de trabalho. Avaliaram-se textos narrativos de histórias infantis e textos descritivos provenientes da revista Ciência Hoje. Optou-se por trabalhar com o conjunto de textos narrativos, por este tipo de texto apresentar maior proporção de pronomes pessoais em relação aos descritivos, vocabulário mais homogêneo e estrutura de sentença um pouco menos complexa.

Cabe comentar que a fundamentação teórica de Centering teve suporte, inicialmente, em exemplos construídos, cujo objetivo era ressaltar determinadas propriedades relativas à estruturação de enunciados. Tendo em vista que textos reais oferecem uma variedade maior de situações, seria interessante testar se Centering oferece uma análise adequada para a resolução de referências para a língua portuguesa em particular, em textos reais.

1

(encontrou-se publicações relativas à aplicação da teoria para as línguas inglesa, italiana, alemã e japonesa).

(13)

4

Outros conhecimentos passíveis de uso na resolução de referências anafóricas pronominais pessoais também foram investigados e são comentados no decorrer do texto da dissertação. Particularmente, citam-se trabalhos que mostram resultados obtidos com a aplicação de um conjunto específico de regras ou conhecimentos sobre corpora.

1.2 Organização do texto

No capítulo 2, realiza-se uma revisão bibliográfica sobre o fenômeno lingüístico da referência. No capítulo 3, apresentam-se algumas propostas encontradas na literatura para resolução de anáforas pronominais. No capítulo 4, inclui-se uma revisão sobre estrutura do discurso e tecem-se considerações sobre a importância de um modelo computacional adequado a esta estrutura, para resolução de anáforas. No capítulo 5 procede-se uma revisão da teoria de Centering, sua motivação original, extensões propostas e observações feitas por diferentes pesquisadores. No capítulo 6, apresentam-se considerações gerais sobre o uso de Centering baseado em corpora. No capítulo 7, apresenta-se o experimento realizado e seus resultados. No capítulo 8 tecem-se conclusões ao pretecem-sente trabalho. Finalmente, apretecem-sentam-tecem-se as referências bibliográficas (capítulo 9) e anexos.

(14)

No presente capítulo, conceituam-se os fenômenos da referência, co-referência e relações anafóricas do ponto de vista lingüístico. Apresenta-se a motivação para tratamento computacional dos mesmos e delimita-se o escopo trabalhado nesta dissertação, qual seja, referências anafóricas pronominais pessoais.

Procede-se também uma revisão de tipos de conhecimentos que podem estar associados à resolução destas referências, do ponto de vista lingüístico e cognitivo e, para finalizar, discute-se uma arquitetura genérica proposta por Popescu-Belis e Robba, em [Popescu-Belis 97], para tratamento computacional unificado de referências em geral e pronomes.

2.1 Referência

Uma das funções da linguagem é estabelecer referência. Yule, em [Yule 96], define referência como “um ato pelo qual um falante (ou escritor) usa a linguagem para capacitar um ouvinte (ou leitor) a identificar alguma coisa”. Complementarmente, Larson [Larson 95], do ponto de vista semântico, define referência como “uma relação entre expressões e objetos extra-lingüísticos, tais como pessoas e países”. Em outras palavras, isto significa que por meio da linguagem (por exemplo, emprego de sintagmas nominais que descrevem entidades do mundo real), um falante ou escritor introduz pessoas, fatos, eventos ou ações no universo de discurso tencionando que seus ouvintes ou leitores sejam capazes de identificá-los.

A partir da introdução de uma entidade (pessoa, fato, evento, ação) no universo do discurso, sua retomada pode ocorrer com o emprego de elementos de

referência2, tais como pronomes. Estes são, ao mesmo tempo um recurso estilístico,

2

Koch, em [Koch 89], define estes elementos como “os itens da língua que não podem ser interpretados semanticamente por si mesmos, mas remetem a outros itens do discurso necessários a sua interpretação”.

(15)

6

evitando a repetição de uma expressão já mencionada e um recurso de coesão textual, cuja função é estabelecer relações textuais.

2.1.1 Tipos de referência

A referência pode ser classificada, segundo Halliday & Hasan (apud [Koch 89]), como:

• situacional ou exofórica: quando a remissão é feita a algum elemento

da situação comunicativa; e

• textual ou endofórica: quando o referente3 se acha expresso no próprio texto.

Em se tratando de uma referência endofórica ou textual, ela ainda pode ser classificada como:

• anáfora: quando o referente aparece no texto antes do elemento de

referência; ou

• catáfora: quando o referente vem após o elemento de referência.

A tabela 1 ilustra a classificação citada.

TIPO DE REFERÊNCIA EXEMPLO

REFERÊNCIA SITUACIONAL OU EXOFÓRICA 9RFrQmRVHDUUHSHQGHUiGHWHUOLGRHVWHDQ~QFLR

REFERÊNCIA TEXTUAL ANAFÓRICA 3DXOR H -RVp VmR H[FHOHQWHV DGYRJDGRV (OHV VH

IRUPDUDPQD$FDGHPLDGR/DUJRGH6mR)UDQFLVFR

REFERÊNCIA TEXTUAL CATAFÓRICA 5HDOL]DUD WRGRV RV VHXV VRQKRV PHQRV HVWH R GH

HQWUDUSDUDD$FDGHPLD

Tabela 1:Classificação de Referências (exemplos transcritos de [Koch 89])

3_{como referente entenda-se a entidade (pessoa, objeto, coisa) a que se remete por meio de um} elemento de referência

(16)

2.1.2 Co-referência

Greimas, em [Greimas 89], define co-referência como “ a relação que dois signos lingüísticos (idênticos ou diferentes) mantêm entre si, quando situados em dois lugares (contíguos ou distanciados) da cadeia falada, remetem a um mesmo objeto extra-lingüístico”.

Para ilustração considere as seguintes sentenças (ambas são citadas em [Perini 95]):

(1) 5LFDUGRGLVVHTXH3HGURREHOLVFRX

(2) 5LFDUGRGLVVHTXH3HGURVHSHQWHLDFRPPDQWHLJD

Em (1), o pronome “o” pode ser entendido como referindo-se a Ricardo. Do mesmo modo em (2), “se” pode ser entendido como referindo-se a Pedro. Portanto, existe co-referência entre Ricardo e o em (1), e Pedro e se, em (2).

Segundo Perini em [Perini 95], “as condições que governam a co-referência de pronomes com os demais sintagmas nominais da oração são surpreendentemente complexas, e a tentativa de explicitá-las tem sido um dos grandes temas de pesquisa em sintaxe e semântica nos últimos anos”.

2.1.3 Funções referenciais de pronomes

Quanto as funções referenciais de pronomes faz-se aqui uma distinção importante. Pronomes referenciais podem exercer uma função dêitica ou uma função

anafórica. Corrêa, em [Corrêa 99], conceitua estas funções como segue:

• função dêitica: quando o referente não foi previamente introduzido

no discurso ou quando não é possível identificá-lo sem recorrer a informação contextual, não lingüística; e

(17)

8

• função anafórica: é desdobrada nas funções de manter e de alterar

referência previamente introduzida no discurso.

Para ilustrar esta diferença, considere os seguintes exemplos:

(3) 0iULRIRLjSDGDULD(OHYROWDGHQWURGHTXLQ]HPLQXWRV

(4) (XIXLDRSDUTXHRQWHP

No exemplo (3) o pronome “ele” tem função anafórica, rementendo a entidade “Mário” previamente introduzida. No exemplo (4), a identificação do referente do pronome “eu” depende da identificação do contexto da enunciação, com identificação do falante ou escritor.

2.1.4 Relações anafóricas

Conforme já mencionado uma anáfora é uma relação discursiva que ocorre quando um referente é introduzido e, subseqüentemente, é retomado por meio de algum elemento de referência, tal como um pronome. Hirst, em [Hirst 81], apresenta uma extensa classificação para relações e termos anafóricos. Note-se, entretanto, que alguns autores, como Renkema, em [Renkema 93], limitam a retomada anafórica ao emprego de pronomes. Contudo, na área de PLN, o termo é geralmente empregado em sentido mais amplo, englobando outras espécies de relações anafóricas (por exemplo, a retomada por expressão sinônima, como em “A filha de Maria está doente, por isso a

garota não veio à escola hoje”) sendo usual o emprego da expressão anáfora pronominal para distinguir a esta de outras espécies de anáforas.

2.1.4.1 Anáfora: ponto de vista técnico

Do ponto de vista técnico uma anáfora é composta por um antecedente e um termo anafórico. Termo anafórico e antecedente são co-referentes. Em (5) temos o pronome ele desempenhando o papel de termo anafórico e João como seu antecedente.

(18)

(5) -RmRQmRIRLjHVFROD(OHHVWDYDGRHQWH

O processo de determinação do antecedente de um termo anafórico é denominado resolução.

2.1.4.2 Resolução de anáforas

Do ponto de vista computacional, a problemática associada com a resolução de anáforas faz-se perceber quando o conjunto de candidatos a antecedente é grande, e um processo de decisão precisa ser aplicado para escolher um, dentre os candidatos possíveis, como o antecedente. Os conhecimentos relevantes para determinação de antecedentes tem sido tema de investigação sob diferentes enfoques e com diferentes objetivos, em áreas como lingüística, ciências cognitivas e PLN.

Para uma introdução geral, considere o seguinte exemplo, extraído de [Coulson 95], p. 94. D $QDYLDMRXQDVIpULDVFRP0DUFRH6LPRQ E (ODIRLSDUDDSUDLDSDUDGHVFDQVDUSRUGXDVVHPDQDV F 0DUFRWLQKDHQFDUUHJDGRVHGHWRGRVRVSUHSDUDWLYRVHOHWLQKDUHVHUYDGRSDUDHOHV XPY{RTXHSDUWLDjVTXDWURGDWDUGH G 4XDQGRHOHVFKHJDUDPDRDHURSRUWRXPDDHURPRoDGLVVHDHOHVTXHRQHYRHLURHVWDYD DWUDVDQGRDSDUWLGDGHVHXDYLmR H 'HSRLVGHXPDORQJDHVSHUDHOHVILQDOPHQWHHPEDUFDUDPQRDYLmR I $QDGHXRVSULPHLURVSDVVRVRQGHRSLORWRHVWDYDHVSHUDQGRSDUDHQFRQWUiORV J ¶2Oi·HODGLVVH¶(XHVSHURTXHQyVSRVVDPRVSDUWLUQHVVHQHYRHLUR· K ¶(XJDUDQWRTXHQmRKDYHUiSUREOHPDV·YHLRDUHVSRVWD

Analisando o exemplo, sem intenção exaustiva, para resolver o pronome ‘ela’, em (b), pode-se fazer uso de diferentes informações. Considerando-se todos os SNs em (a), a saber ‘Ana’, ‘férias’, ‘Marco’ e ‘Simon’, conhecimento de gênero nos seria útil, permitindo a eliminação de ‘Marco’ e ‘Simon’ da lista de possíveis

(19)

10

antecedentes e, da mesma forma, conhecimento de número permitiria a eliminação de ‘férias’. Adicionalmente, pode-se utilizar informação de saliência de entidades: ‘Ana’ ocupa a posição de sujeito da sentença, o que a torna mais saliente que os demais SNs. Para interpretar adequadamente, o pronome ‘eles’ em (c), por outro lado, é necessário identificar o conjunto ‘Ana’ + ‘Marco’ + ‘Simon’.

Coulson, em [Greene 95], distingue as fontes de informação para resolução de anáforas como lingüísticas e não-lingüísticas. Como informações lingüísticas cita gênero, número, sintaxe e informação lexical. Entre as não lingüísticas foco, scripts e conhecimento de mundo.

2.2 Uma estrutura para resolução de referências

Nesta seção, apresenta-se uma arquitetura proposta por Popescu-Belis e Robba, em [Popescu-Belis 97], que ilustra vários elementos que podem fazer parte de um sistema computacional cuja finalidade é processar referências. O objetivo é comentar e deixar claras para o leitor várias etapas de análise que podem estar envolvidas no processamento computacional de referências.

A arquitetura formulada por estes autores é apresentada na figura 1. Serve tanto para resolução de pronomes como referências em geral. Na concepção de anáfora, uma relação textual, existe um antecedente e um termo anafórico, que depende da descrição textual do antecedente para ser resolvido. O antecedente, por sua vez, pode fazer referência a um objeto extra-textual.

Tendo por base trabalhos recentes que buscam unificar estas duas situações (oferecendo uma taxonomia de classes de expressões de referência), os autores desenvolveram uma arquitetura genérica contemplando ambas as situações. A arquitetura será descrita e comentada, a seguir.

(20)

Figura 1: Estrutura geral de um sistema de resolução de referência [Popescu-Belis 97]

Pode-se observar, na figura 1, que Popescu-Belis e Robba procuraram deixar claros vários aspectos importantes a serem considerados no tratamento de expressões de referência por sistemas computacionais. A primeira consideração a ser feita é que eles buscaram definir uma arquitetura aberta, onde as entidades candidatas a referência podem provir de diferentes entradas no sistema, como uma entrada textual, onde o texto conteria as entidades e expressões de referência a serem resolvidas, ou algum outro tipo de entrada, como um click de mouse sobre um objeto num cenário.

Na estrutura de Popescu-Belis e Robba:

• ERi: indica uma expressão de referência localizada no texto.

• pERi: é uma pseudo-expressão de referência (no caso de a entrada de

dados ser multi-modal; a referência poderia ocorrer, por exemplo, a partir de um click de mouse sobre um objeto na tela).

Controlador (M2) TEXTO ---ER1 ---ER2---ER3 - ---ER4 ---ER 5-- ---OUTRA MODALIDADE ---pER1 ---pER2 ---pER3 ---pER4 ---Mundo Real Outros Módulos (Mx) Conhecimento Representação do mundo real COMPUTADOR Módulo de Resolução (M1) CONJUNTO DE ENTIDADES Ativação

(21)

12

• M1: módulo que seleciona expressões de referência do texto, associando cada expressão à estrutura da entidade própria no conjunto de entidades. Pode associar uma ER a uma entidade existente ou criar uma nova entidade.

• M2: módulo que controla o conjunto das entidades, atualizando sua ativação ou saliência.

Note-se que os módulos M1 e M2 são os responsáveis pela resolução de referências. O módulo M1 faz a associação de uma ER com a estrutura da entidade com a qual se encontra relacionada. O módulo M2 é responsável pela manutenção da saliência das entidades, podendo avaliar esta saliência utilizando diferentes abordagens (nos capítulos 3, 4 e 5 são apresentados meios pelos quais a saliência pode ser medida).

2.3 Considerações

Neste capítulo, conceituou-se referência e co-referência, descreveram-se funções referenciais que podem ser assumidas por pronomes, detalharam-se relações anafóricas, e procedeu-se uma análise preliminar de diferentes conhecimentos que podem ser empregados para a resolução de referências pronominais anafóricas pessoais, introduzindo-se o leitor na questão da resolução de referências.

No capítulo a seguir, serão descritas estratégias computacionais para resolução de anáforas encontradas na literatura de Processamento de Linguagem Natural. Essas abordagens foram testadas com textos na língua inglesa e, para as mesmas, são mencionados os resultados relatados.

(22)

O objetivo deste capítulo é apresentar e explorar diferentes enfoques e idéias identificadas na literatura, com respeito a resolução de pronomes.

3.1 A abordagem de Tetsuya Nasukawa para Resolução de Pronomes

Nasukawa, em [Nasukawa 94], apresenta uma abordagem que procura explorar conhecimentos que possam ser obtidos a partir do texto que será analisado. Afirma que é possível extrair informações de textos coerentes que auxiliem na resolução de referências pronominais.

Tendo em vista que a aquisição de conhecimento é uma característica que limita um sistema, Nasukawa sugere que, ao invés de utilizar conhecimento externo, aplique-se um algoritmo que extraia informações do próprio texto, as quais possam colaborar na tarefa de identificação de antecedentes de pronomes e, desta forma, contribuam para melhorar o desempenho do sistema nesta tarefa.

Nasukawa identificou três fatores para medir a saliência4 relativa de sintagmas nominais introduzidos no discurso, e conduziu um experimento descrevendo os resultados obtidos com a aplicação dos mesmos. A seguir apresentam-se os critérios propostos pelo autor para medir a saliência de diferentes sintagmas nominais introduzidos no discurso e os resultados daquele experimento.

4_{a saliência de um sintagma nominal representa o quanto ele é o centro de atenção para um} ouvinte ou leitor, conferindo maior ou menor probabilidade de referenciação posterior mediante emprego de pronomes

(23)

14

3.1.1 Critérios propostos

a) Collocation Patterns (padrões de colocação)

Segundo Nasukawa, uma palavra tem, geralmente, um sentido unificado dentro de um texto. Partindo desta idéia, ele defende que padrões de colocação dentro de um texto fonte podem fornecer dados valiosos na identificação de referentes de pronomes.

Para ilustrar a aplicabilidade de tal fator, ele supõe que, em um texto, seja encontrada a sentença “He moved his residence”. Esta ocorrência permitirá inferir que a palavra “residence” pode ser objeto do verbo “move”. Assim, no momento de avaliar referências no texto, se uma outra sentença como “The castle in Camelot remained the residence of the king until 536 when he moved it to London” fosse encontrada, este critério permitiria atribuir uma preferência ao candidato “residence”.

b) Freqüência de repetição em sentenças precedentes

Nasukawa utilizou, como fundamento para este critério, a idéia apresentada na abordagem de Centering para resolução de pronomes de Brennan et al., em [Brennan 87]5, segundo a qual um objeto em foco é um candidato mais provável a pronominalização. Estendeu esta idéia, supondo que um sintagma nominal em foco possa ser referido por uma descrição definida antes de ser pronominalizado. Para uso de tal critério, o autor faz uma busca por palavras com o mesmo lema, nas sentenças precedentes à ocorrência da pronominalização.

c) Posição sintática

Segundo Hobbs (apud [Nasukawa 94]), uma regra heurística favorecendo sujeitos sobre objetos é bastante útil para o inglês. Visando atribuir uma preferência por posição sintática sem necessidade de recorrer a um processamento sintático mais complexo, Nasukawa atribui preferência a um candidato na sentença mais próxima, ou ao candidato mais próximo do início da mesma sentença.

5

(24)

3.1.2 Descrição do experimento

Nasukawa realizou um experimento com as seguintes características:

1. Corpus de teste: manuais técnicos de computadores (normalmente antecedentes explícitos);

2. Pronomes considerados: pronomes de terceira pessoa; 3. Número de pronomes no corpus: 112;

4. Algoritmo básico:

1º passo: selecionar os sintagmas nominais candidatos a antecedente

de um termo anafórico;

2º passo: verificar concordância de gênero e número filtrando

candidatos impróprios;

3º passo: aplicar os critérios propostos no estabelecimento de

preferências na determinação do antecedente.

3.1.3 Resultados do experimento

O experimento apresentou bons resultados: uma taxa de acerto do antecedente de 93,8% (105 das 112) ocorrências. Os critérios selecionais propostos pelo autor foram aplicados em 84 casos e a tabela 2 resume a participação de cada critério na seleção do antecedente para um pronome. Note-se que, quando aplicável, a existência de colocação similar sempre atribuiu preferência selecional ao antecedente correto.

Número de casos em que o antecedente correto foi

selecionado

Número de casos em que o antecedente errado foi

selecionado

Número de casos sem qualquer informação válida Posição Sintática 69 (82,1%) 15 (17, 9%) 0 Freqüência de Repetição 51 (60,7%) 22 (26,2%) 11 (13,1%) Existência de colocação similar 22 (26,2%) 0 (0%) 62 (73,8%)

Tabela 2: Correlação entre seleção correta e seleção de acordo com cada tipo de preferência [Nasukawa 94]

(25)

16

3.2 A Abordagem de Mitkov para Resolução de Pronomes

Mitkov, em [Mitkov 97; Mitkov 98], apresenta um conjunto de heurísticas para identificar antecedentes de pronomes, estabelecidas com base em investigações em corpus. A seguir serão apresentadas as características dos experimentos por ele realizados e os resultados obtidos.

3.2.1 Características dos experimentos

Os experimentos apresentados em [Mitkov 97] e [Mitkov 98] usam a mesma estratégia para resolução de pronomes, diferindo apenas o conjunto de heurísticas utilizadas para avaliação dos candidatos a antecedente.

Os experimentos descritos nesses artigos têm as seguintes características:

• O pré-processamento do texto é limitado ao uso de um rotulador de categorias gramaticais6 de palavras e à aplicação de regras simples para a identificação de sintagmas nominais7.

• Para seleção dos candidatos a antecedente é considerado o limite de duas sentenças anteriores ao termo anafórico, com filtragem daqueles que discordam em gênero ou número deste último.

• Cada candidato remanescente é avaliado segundo diversos critérios (heurísticas) estabelecidos, com atribuição de pontuação, de acordo com a satisfação do critério pelo candidato.

• O candidato proposto como antecedente é aquele que atinge maior pontuação total na soma das pontuações dos critérios.

• Os critérios que selecionam o antecedente foram identificados empiricamente a partir da análise de corpus efetuada pelo autor.

6

Substantivo, adjetivo, verbo, pronome,...

(26)

3.2.2 Critérios estabelecidos

a) Preferência por sintagmas nominais definidos sobre sintagmas nominais indefinidos Mitkov considera como sintagmas nominais definidos aqueles precedidos por artigo definido, por pronomes possessivos ou por demonstrativos.

b) Preferência por sintagmas nominais representando o tema

Sintagmas nominais em sentenças prévias que representam o tema, são melhores candidatos a antecedentes.

c) Preferência por termos específicos da área do corpus

Sintagmas nominais representando termos na área do corpus são mais prováveis de serem antecedentes do que sintagmas nominais que não são específicos da área.

d) Verbos de indicação

Se o verbo é membro do conjunto {discuss, present, illustrate, identify,

summarise, examine, describe, define, show, check, develop, review, report, outline, consider, investigate, explore, assess, analyse, synthesise, study, survey, deal, cover},

então considerar o primeiro sintagma nominal que o segue como o antecedente preferido.

e) Sintagmas nominais de indicação

Se o substantivo principal do sintagma nominal precedendo o verbo é

chapter, section ou table, então considerar o sintagma nominal seguindo o verbo como

o antecedente preferido.

f) Reiteração lexical

“Itens lexicalmente reiterados” são candidatos prováveis a antecedente. Estes itens incluem sintagmas nominais sinônimos que podem ser precedidos por artigos definidos ou demonstrativos e também uma seqüência de sintagmas nominais

(27)

18

com o mesmo substantivo principal (por exemplo, toner bottle, bottle of toner, the

bottle).

g) Preferência por padrões de colocação

É dada preferência a candidatos que têm padrão de colocação idêntico a um pronome. Mitkov utiliza esta preferência restrita aos modelos “substantivo/pronome, verbo” ou “verbo, substantivo/pronome”.

h) Distância referencial

Em sentenças complexas, sintagmas nominais na cláusula prévia (atualmente, o autor usa heurísticas simples para identificar cláusulas em uma sentença complexa, mas não as especifica nos artigos) são melhores candidatos a antecedente de uma anáfora na cláusula subseqüente. Depois aparecem os sintagmas nominais situados 2 sentenças atrás, e por último, sintagmas nominais situados 3 sentenças atrás.

i) Preferência por sintagmas nominais não preposicionais

A um sintagma nominal não preposicional é dada uma preferência mais alta que a um sintagma nominal que é parte de uma locução preposicional.

j) Referência imediata

Em manuais técnicos, o vestígio de “referência imediata” pode ser útil na identificação do antecedente. A heurística usada é a seguinte: em construções da forma “ .... (You) V1 NP ... con (you) V2 it (con (you) V3 it)”, onde con ∈ {and/ or/ before/

after}, o sintagma nominal antes de V1 é o mais provável candidato a antecedente do

pronome “it” imediatamente seguindo V2 e lhe é, por isso, dada preferência.

3.2.3 Exemplo de aplicação dos critérios

Supondo a sentença “Identify the draweri by the lit paper port LED and

add paper to it i”, extraída de [Mitkov 98], a “pontuação” para “the drawer” fica como

(28)

Critério Pontuação Preferência por sintagmas nominais definidos

Preferência a sintagmas nominais representado o tema Preferência por Termos específicos da área do corpus Verbos de indicação

Reiteração lexical Colocação

Distância referencial

Sintagma nominal não preposicional Referência imediata 1 0 1 1 0 0 2 0 2 TOTAL 7

Tabela 3: Pontuação para “the drawer” [Mitkov 98]

Enquanto isso, a pontuação de “the lit paper port LED” fica como mostrado na tabela 4:

Critério Pontuação

Preferência por sintagmas nominais definidos

Preferência a sintagmas nominais representado o tema Preferência por termos específicos da área do corpus Verbos de indicação

Reiteração lexical Colocação

Distância referencial

Sintagma nominal não preposicional Referência imediata 1 0 1 0 0 0 2 0 0 TOTAL 4

Tabela 4: Pontuação para “the lit paper port LED” [Mitkov 98]

3.3 A abordagem de Breck Baldwin

O sistema CogNIAC, descrito em [Baldwin 95], utiliza oito regras para identificar antecedentes de pronomes. Estas regras são aplicadas em ordem, até que um antecedente para o pronome tenha sido selecionado.

(29)

20

3.3.1 Regras estabelecidas para identificação de antecedentes de pronomes

a) Existência de um único antecedente possível na porção de discurso lida

A regra é aplicada se há um único antecedente possível X (que satisfaça restrições de gênero e número) na porção lida do discurso. Neste caso, selecioná-lo como o antecedente.

b) Reflexivo

Se o termo anafórico é um pronome reflexivo, escolher o antecedente mais próximo na porção lida da sentença atual.

c) Existência de um único antecedente possível considerando a sentença anterior e a sentença atual

Se há um único antecedente possível X na sentença anterior e na parte analisada da sentença corrente, então escolher X como o antecedente correto.

d) Pronomes possessivos

Se o termo anafórico é um pronome possessivo e há uma única cadeia de caracteres igual antecedendo-o na sentença anterior, escolhê-la como antecedente.

e) Existência de um único candidato possível na sentença atual

Se há um único antecedente possível na porção lida da sentença corrente, escolhê-lo como antecedente.

f) Sujeito único/ Pronome sujeito

Se o sujeito da sentença anterior contém um único antecedente possível X, e o termo anafórico é o sujeito desta sentença, então escolher X como o antecedente.

g) Escolher o Cb

Se há um Cb X na cláusula finita corrente que é também um candidato a antecedente, então escolher X como o antecedente.

(30)

h) Escolher o antecedente mais recente

Escolher o antecedente potencial mais recente no texto (isto é, aquele mais próximo do termo anafórico, satisfazendo restrições de gênero e número).

3.4 O algoritmo de Lappin e Leass

Lappin e Leass, em [Lappin 94], apresentam um algoritmo para resolução de anáforas pronominais que considera a estrutura sintática da sentença e propõe medidas de saliência para entidades baseada na função desempenhada pela mesmas.

3.4.1 Características do algoritmo

1. Baseia-se em medidas de saliência derivadas da estrutura sintática associada a um modelo dinâmico simples do estado atencional.8 2. O algoritmo identifica tanto antecedentes intra-sentenciais, quanto

intersentenciais.

3. Não emprega condições semânticas, além daquelas implícitas na concordância de gênero e número, nem emprega conhecimento de mundo, na avaliação dos candidatos a antecedente. Não modela a estrutura intencional ou estrutura global do discurso.

3.4.2 Características do experimento

1. Corpus de teste: manuais de computador;

2. Pronomes considerados: pronomes de terceira pessoa; 3. Número de pronomes no corpus: 360;

8_{Na seção 4.3 (capítulo a seguir), são apresentadas as conceituações de estado atencional,}

(31)

22

3.4.3 Módulos componentes

1. Um filtro baseado em sintaxe para eliminar possíveis ligações anafóricas entre pronomes e SNs.

2. Um filtro para eliminar antecedentes pela verificação da concordância de gênero, número ou pessoa entre pronome e SN. 3. Um módulo para identificar pronomes pleonásticos.

4. Um algoritmo para vincular antecedentes a pronomes recíprocos ou reflexivos dentro da mesma sentença.

5. Um módulo que atribui valores a vários parâmetros de saliência relacionados a um SN (quais sejam: função gramatical, paralelismo de funções gramaticais, freqüência de menção, proximidade e recentidade da sentença). A hierarquia de função gramatical atribui valores de saliência conforme as seguintes regras de avaliação:

- sujeitos têm peso maior que não sujeitos; - objetos diretos têm peso maior que outros

complementos;

- argumentos de um verbo têm peso maior que adjuntos;

- substantivos núcleo têm peso maior que complementos de substantivos núcleo.

6. Um procedimento de decisão para selecionar o elemento preferido de uma lista de candidatos a antecedente para um pronome.

3.4.4 Resultados do experimento

1. O algoritmo atingiu uma taxa de acerto do antecedente de 86%. 2. Com melhorias no algoritmo, correspondentes à modelagem estatística de informações semânticas e relações do mundo real, o aumento da taxa de acerto do antecedente foi de somente 2%.

(32)

3.5 Considerações

Neste capítulo foram descritas diferentes propostas encontradas na literatura para resolução de pronomes, com objetivo de identificar conhecimentos úteis e modelos de processamento.

Como características similares, estas estratégias apresentam:

- filtro por gênero/número de candidatos a antecedente; - consideração de recentidade;

- emprego de alguma medida de saliência para classificar as entidades candidatas a antecedente de um termo anafórico;

- pouco ou nenhum emprego de conhecimento semântico mais elaborado.

No capítulo seguinte, procede-se uma introdução à questão da estrutura do discurso, com revisão de trabalhos que abordam a relevância da identificação das sentenças prévias significativas para processamento de discurso subseqüente. Como o processamento computacional de anáforas inclui a adoção de uma representação do contexto anterior, no qual encontram-se as entidades candidatas a antecedente de um termo anafórico, e a identificação da saliência destas entidades, são revisadas propostas que contemplam estas questões.

(33)

4 RESOLUÇÃO DE ANÁFORAS E ESTRUTURA DO DISCURSO

Diversos autores têm apontado que uma descrição apropriada da estrutura do discurso é importante para determinar as sentenças relevantes no processamento de um determinado ponto do discurso ([Allen 94], [Grosz 86], [Walker 98]). Como processar um discurso inclui também resolver referências anafóricas que surjam, por conseqüência, é importante, no processo de resolução de referências, o conhecimento da estrutura do discurso.

Russel, em [Russel 95], afirma que, para se chegar a uma compreensão do discurso, ao menos seis tipos de conhecimento são relevantes, a saber:

- conhecimento geral sobre o mundo;

- conhecimento geral sobre estrutura de discurso coerente; - conhecimento geral sobre sintaxe e semântica;

- conhecimento específico sobre a situação sendo discutida; - conhecimento específico sobre crenças dos personagens; - conhecimento específico sobre as crenças dos falantes.

Neste capítulo explorar-se-á a questão da estrutura de discurso. Com intuito de realizar uma introdução a diferentes questões relativas ao processamento de discurso presentes na literatura, neste capítulo comentam-se a proposta de estrutura de discurso de Grosz e Sidner [Grosz 86] e uma reestruturação desta proposta, conduzida por Walker [Walker 98]. Em detalhe maior, apresentam-se aspectos relacionados a importância de uma descrição adequada da estrutura do discurso para a interpretação de referências anafóricas.

(34)

4.1 Conceitos básicos

4.1.1 Discurso

Em linhas gerais, discursos podem ser compreendidos como o resultado da produção lingüística de enunciados por escritores ou falantes, com a respectiva formação de textos escritos ou discursos falados. Entretanto, esta caracterização simples não fornece o detalhe suficiente sobre como discursos são estruturados. Na verdade, o que realmente parece necessário, é uma descrição de como um texto ou diálogo se estrutura e como determinados fenômenos discursivos poderiam ser analisados ou modelados.

Grosz, em [Grosz 86], conceitua um discurso como “um agrupamento de segmentos coerentes, onde cada segmento colabora para atingir o propósito global do discurso.”

4.1.2 Enunciado

Lyons, em [Lyons 81], página 157, afirma que “aqueles que distinguem sentenças e enunciados concordam de um modo geral que as primeiras, diferentemente dos últimos, são entidades abstratas independentes de contexto, no sentido de não estarem vinculadas a nenhum espaço ou tempo particular: elas são unidades do sistema lingüístico a que pertencem.” 9

4.1.3 Segmento

Um segmento é um agrupamento de enunciados.

Em [Allen 94] encontrou-se as seguintes definições para segmento : - é um trecho de um discurso no qual as sentenças estão falando

do mesmo tópico;

9_{Uma discussão mais detalhada sobre significado de sentença e significado de enunciado pode} ser encontrada em [Lyons 81]

(35)

26

- é uma seqüência de sentenças, possivelmente interrompidas por subsegmentos, cujo aspecto mais importante é exibir uma estrutura hierárquica.

4.2 Sobre a necessidade de uma descrição da estrutura do discurso

Segundo Allen, em [Allen 94], o estudo e descrição da estrutura do discurso pode oferecer diversas informações úteis no processamento de linguagem natural. O conhecimento desta estrutura e a identificação de mecanismos computacionais que possam ser usados para o seu reconhecimento e manipulação, pode ser importante na tarefa de segmentação do discurso, na identificação das intenções expressas em cada segmento do discurso e das relações intencionais entre estes segmentos, na interpretação de pronomes e elipses e no reconhecimento de aspectos temporais do discurso.

Segundo Passonneau e Litman, em [Passonneau 97], “A necessidade de modelar a relação entre estrutura do discurso e as características lingüísticas dos enunciados é quase universalmente reconhecida na literatura sobre discurso. Contudo, há fraco consenso sobre o que as unidades da estrutura do discurso são, ou critérios para reconhecê-las e gerá-las”.

4.2.1 Considerações de Passonneau e Litman sobre segmentação de discurso

Uma observação de diferentes pesquisadores é que discursos são compostos por segmentos. Em teorias sobre estruturação de discurso, como a de Grosz e Sidner e a de Walker, revisadas a seguir na seção 4.3, a questão da segmentação é tida como relevante, e uma segmentação adequada, pode auxiliar na correta interpretação de expressões anafóricas. Na teoria de Grosz e Sidner, por exemplo, as autoras argumentam que diferentes tipos de expressões anafóricas têm princípios de localidade

(36)

diferentes e, usualmente, o termo antecedente de pronomes ocorre dentro do mesmo segmento.

Tendo Passonneau e Litman, em [Passonneau 97], procedido uma revisão da literatura de lingüística computacional relativa à questão da segmentação de discursos, verificaram que muitas propostas ainda são baseadas em estudos bastante informais, sendo recentes as tentativas de avaliação quantitativa de como características de enunciados correlacionam-se com segmentação de discurso.

Partindo da hipótese que tecnologias de linguagem natural podem interpretar discurso mais sensivelmente, e podem gerar um discurso mais compreensível se obtiverem vantagem dessa ação combinada entre segmentação e dispositivos lingüísticos, as autoras conduziram um experimento sobre segmentação de discurso, com a finalidade de gerar uma proposta mais formal de como diferentes fenômenos, tais como Cue phrases, prosódia e referência nominal, restringem ou são restritos pela estrutura do discurso.

Primeiramente, realizaram um experimento com sujeitos humanos, no qual solicitaram que estes identificassem limites de segmentos. Avaliando os resultados verificaram um modelo extremamente significativo de concordância sobre limites de segmentos e concluíram ser possível executar segmentação do discurso confiável, usando a intenção do falante como critério.

Partindo de hipóteses pré-existentes na literatura, avaliaram diferentes dispositivos lingüísticos e verificaram que, com o uso de múltiplas fontes de conhecimento (sintagmas nominais referenciais, cue words e pausas), era possível chegar a uma performance semelhante à humana.

Para realização do experimento desenvolveram algoritmos usando cada tipo de dispositivo lingüístico em isolado, propondo e avaliando métodos para combiná-los.

(37)

28

O que define segmentos de discurso e que espécies de relações assinalar entre segmentos não são, contudo, questões fechadas. A natureza de qualquer interação entre a estrutura do discurso e dispositivos lingüísticos depende, segundo as autoras, do modelo de discurso que é adotado e dos tipos de dispositivos lingüísticos que são investigados.

No experimento realizado, as autoras não solicitaram a identificação de relações hierárquicas, tendo em vista ainda ser questionável a hipótese de que o discurso possui uma estrutura de árvore.

4.3 Estruturação do discurso: propostas e perspectivas

4.3.1 A proposta de Grosz e Sidner

Grosz e Sidner em [Grosz 86] propuseram uma teoria computacional que apresenta um conjunto de premissas para o processamento dos enunciados em um discurso. Nessa teoria, três estruturas distintas presentes em um discurso são descritas: a estrutura lingüística, o estado atencional e a estrutura intencional. Embora distintas, estas estruturas são inter-relacionadas e servem para coordenar o processamento do discurso.

As autoras argumentam que um bom modelo da estrutura do discurso deve dar conta de descrever diferentes fenômenos que ocorrem em discursos reais, como interrupções, explicação do uso de certos tipos de expressões de referência e de expressões que afetam a segmentação do discurso e estrutura.

De forma geral, os elementos básicos de cada uma dessas estruturas são:

• Estrutura lingüística: compõe-se de enunciados. Enunciados se agregam naturalmente e formam segmentos.

(38)

• Estrutura intencional: inclui os propósitos relevantes do discurso expressos em cada um de seus segmentos lingüísticos, bem como a relação entre esses propósitos.

• Estado atencional: contempla os objetos, propriedades e relações que são salientes em cada ponto do discurso. Registra, de forma abstrata, o foco de atenção dos participantes do discurso.

Particularmente importante para nós é a especificação do estado atencional, modelado nessa teoria como uma pilha, que determina a “saliência” das entidades num determinado ponto do discurso, afetando a interpretação de pronomes e outros termos referenciais.

4.3.1.1 Pespectivas computacionais

Nesta proposta, o estado atencional fornece os elementos necessários para usar as informações disponíveis nas outras estruturas na geração e interpretação de enunciados, armazenando informação de enunciados prévios, essencial para o processamento de enunciados subseqüentes.

A estrutura lingüística pode oferecer: (1) informações sobre a estrutura do discurso pelo emprego de expressões lingüísticas, (2) indicações (talvez parciais) dos limites dos segmentos, pelo uso explícito de certas palavras ou expressões ou, implicitamente, por meio de pistas mais sutis como entonação (em discursos falados) ou mudança de tempo e modo, e (3) por meio de marcadores lingüísticos, indícios de alterações no estado atencional ou na estrutura intencional.

Intenções estabelecem entre si certas relações estruturais que dão origem a uma representação interna da estrutura do discurso. Duas relações particularmente importantes, são: dominância e precedência de satisfação. Essas relações são assim conceituadas:

(39)

30

•Relação de dominância: quando um propósito PSD1 de um segmento

SD1 contribui para PSD2 de um segmento SD2 há uma relação de dominância entre intenções: PSD2 DOM PSD1 (PSD2 domina PSD1).

•Relação de precedência de satisfação: quando precisamos ter PSD1

satisfeito antes de PSD2 temos uma relação de precedência de satisfação: PSD1 PreSat PSD2. Esta segunda relação é particularmente importante para alguns tipos de discurso, como diálogos orientados a tarefa, onde a ordem em que um PSD é satisfeito pode ser relevante).

Na pilha que modela o estado atencional, espaços de foco são associados a cada segmento de discurso (SD). A figura 2, extraída de [Grosz 86], representa, de forma abstrata, a relação entre essas diferentes estruturas.

Figura 2: Estrutura de Focalização [Grosz 86]

O exemplo ilustra a pilha de espaços de foco quando o segmento de discurso SD3 está sendo processado. SD3 gera o espaço de foco EF3 que, além dos objetos, propriedades e relações que são salientes naquele segmento, contém também o

SD1 SD2 SD3 Propriedades Objetos Relações PSD3 EF3 Propriedades Objetos Relações PSD1 EF1

Segmentos de discurso Pilha dos espaços de foco Hierarquia de dominância

PSD1 DOM PSD3

(40)

PSD3. Devido à hierarquia de dominância entre propósitos de segmentos de discurso, o espaço de foco EF1 permanece na pilha, pois PSD1 domina PSD3. O espaço de foco gerado por SD2 foi retirado da pilha, dado que seu propósito PSD2 não domina PSD3.

Espaços de foco são colocados ou retirados da pilha atencional conforme informações disponíveis na estrutura lingüística ou na estrutura intencional.

O empilhamento dos espaços de foco reflete a saliência relativa das entidades dado um particular estado atencional.

Em vista da estrutura segmental proposta para discursos, Centering foi formulado como um modelo para ser aplicado em nível local, ou seja, dentro de segmentos. Sintagmas nominais completos e pronomes, segundo esta teoria, têm princípios de localidade diferentes.

Uma das funções da estrutura de focalização é restringir a busca a possíveis referentes de sintagmas nominais completos e pronomes.

4.3.2 A proposta de Walker

Walker, em [Walker 98], propõe a substituição da estrutura de pilha do estado atencional por um modelo de “cache”10. Este modelo descreveria, por diferenças na coerência, e na carga de inferência exigida de um leitor ou ouvinte em determinadas situações (quando um enunciado é hierarquicamente recente a outro, mas não linearmente recente), que não são capturadas pelo modelo de pilha do estado atencional.

Além disso, Walker propõe que a restrição de aplicar Centering somente dentro de segmentos deveria ser abandonada porque: (1) centros freqüentemente continuam além do limite de segmentos, (2) ouvintes percebem limites de segmentos em diferentes níveis de granularidade e (3) há fortes contrastes entre enunciados cujo

10

Uma cache é uma memória temporária usada para armazenar informação que está sendo usada correntemente por um processo computacional (apud [Walker 98])

(41)

32

enunciado prévio é linearmente recente e aqueles cujo enunciado prévio é hierarquicamente recente.

Walker afirma que, “da forma como a recentidade hierárquica é operacionalizada pelo modelo de pilha, não prediz quanto centros prévios são acessíveis” e argumenta que integrando Centering com um modelo de estrutura global do discurso, simultaneamente soluciona estes problemas pela substituição do modelo de pilha pelo modelo de cache.

Walker aponta que, no modelo integrado resultante:

• Centros são elementos da cache e o modelo de cache media a acessibilidade aos centros;

• Centros estão disponíveis além do limite de segmentos por default; • Dificuldades no processamento são previstas para a interpretação dos

centros cujos co-especificadores não são linearmente recentes;

• A granularidade da segmentação do discurso não tem efeito sobre o modelo.

No modelo proposto há dois tipos de memória: a memória principal, que representa a memória de longo prazo, e a cache que representa a memória de trabalho. “A memória principal é maior que a cache, mas é de acesso mais lento. A cache tem uma capacidade limitada, quase instantaneamente acessível”.

Walker assume as seguintes hipóteses para o modelo:

• tamanho da cache é limitado a duas ou três sentenças, ou aproximadamente sete proposições (segundo Walker, esta hipótese é baseada em descoberta de trabalhos prévios). A aplicação desta hipótese tem como resultado que “um enunciado Ei é linearmente

recente para um enunciado Ej quando ele ocorreu dentro dos últimos

(42)

• Itens da cache podem ser retidos ou fornecidos para a memória principal. Itens na memória principal também podem retornar para a cache.

• Quando a cache recebe itens da memória principal ou novos itens, outros são deslocados para a memória principal, dado que a cache tem capacidade limitada.

• A determinação de quais itens deslocar é dada por uma política de

substituição na cache.

Walker observa que “da forma como a recentidade hierárquica é operacionalizada pelo modelo de pilha, não prediz quanto centros prévios são acessíveis”.

Mostra este fato pelo contraste entre os exemplos detalhados a seguir:

([HPSOR (1) C:2N+DUU\(XWHQKRXPSUREOHPDTXHXKPLQKD²FRPDHFRQRPLDGHKRMHPLQKD ILOKDHVWiWUDEDOKDQGR (2) H: (XQmRFRQVHJXLRXYLUVHXQRPH (3) C: +DQN (4) H: 3URVVLJD+DQN (5) (a) C: EHPFRPRVHXXKPDULGR (b) (OHVWHPXPDFULDQoD (c) HHOHVWUD]HPDFULDQoDSDUDQyVWRGRGLDSDUDTXHFXLGHPRVGHOD ([HPSOR (1) C: 2N+DUU\(XWHQKRXPSUREOHPDTXHXKPLQKD²FRPDHFRQRPLDGHKRMHPLQKD ILOKDHVWiWUDEDOKDQGR (2) H: (XQmRFRQVHJXLRXYLUVHXQRPH

(43)

34 (3) C: +DQN H: 0HGHVFXOSHHXQmRSXGHRXYLUYRFr C: +DQN H: e+$1." C: 6LP. (4) H: 3URVVLJD+DQN (5) (a) C: EHPFRPRVHXXKPDULGR (b) (OHVWHPXPDFULDQoD (c) HHOHVWUD]HPDFULDQoDSDUDQyVWRGRGLDSDUDTXHFXLGHPRVGHOD

No exemplo 1, a expressão anafórica “seu marido”, é mais difícil de interpretar que em 2.

4.4 Considerações

Neste capítulo revisaram-se duas propostas de modelagem de discurso: uma de Grosz e Sidner, e outra de Walker. Em comum, as duas propostas têm o fato de contemplarem a questão da atualização de centros em discursos. No modelo de Grosz e Sidner, deve-se reconhecer interrupções e subsegmentos e gerenciar a acessibilidade das entidades mediante emprego de um mecanismo de pilha para o estado atencional. Mas, Walker argumenta que essa abordagem deveria ser abandonada, pois, quando ocorrem interrupções ou subsegmentos embutidos, a interpretação de expressões referenciais torna-se mais difícil, mesmo para seres humanos e, um modelo mais apropriado, em termos de coerência, seria o modelo de “cache”.

Controvérsias a parte, o que qualquer um dos modelos busca e que é relevante para o tratamento de pronomes, é saber quais entidades são salientes em diferentes pontos em um discurso. O modelo de Grosz e Sidner parece mais sofisticado, exigindo reconhecimento de intenções, relações e segmentos e estas são, ainda, questões

(44)

que não têm um tratamento completo (ou talvez, adequado) do ponto de vista computacional.

Passonneau e Litman ressaltam muito bem o quão incipientes são os dados e conclusões sobre como segmentar discursos e quais elementos avaliar para proceder essa segmentação.

No capítulo a seguir, é apresentada a teoria de Centering, cuja preocupação é, justamente, a dinâmica da saliência das entidades, quais recursos dos quais se servir para identificar essa saliência, e qual a maneira mais coerente de interpretar expressões anafóricas.

(45)

5 CENTERING: ESPECIFICAÇÃO DO MODELO E DIREÇÕES

DE PESQUISA

A revisão apresentada aqui tem por base a publicação da revista

Computational Linguistics de 1995 [Grosz 95], entretanto existem duas versões

anteriores não publicadas que circularam entre pesquisadores (uma de 1983 e uma de 1986) e que suscitaram o desenvolvimento de pesquisas relacionadas. O capítulo inicia evidenciando as questões básicas vinculadas a Centering para, mais adiante, apresentar estudos relacionados à teoria relatados em textos científicos.

5.1 A Teoria de Centering

5.1.1 Objetivo

Centering foi proposta como uma teoria para modelar a coerência local

de um discurso. Seus mentores argumentam que “diferenças na coerência, correspondem em parte a demandas de inferência feitas por diferentes tipos de expressões de referência, dado um particular estado atencional”. Em outras palavras, há uma relação entre (1) centro de atenção no discurso, (2) tipos de expressões de referência empregadas para retomar entidades mais centrais/menos centrais e (3) coerência percebida no discurso.

5.1.2 Modelo proposto pela teoria

Do ponto de vista estrutural, um segmento de discurso é composto por enunciados. Enunciados possuem “centros”, que são entidades que ligam um enunciado a outros enunciados no segmento que o contém. Os “centros” de um enunciado podem ser classificados em: (1) Backward-Looking Center e (2) Forward-Looking Centers (Cf).

O Backward-Looking Center (Cb) é uma entidade que estabelece uma ligação coerente com o enunciado prévio, sendo única para todo o enunciado que não

(46)

seja o primeiro de um segmento. Ao primeiro enunciado de um segmento, supõe-se não existir esta espécie de centro, dado que tal enunciado não estabelece um vínculo com um possível enunciado anterior, já que pertence a um segmento diferente.

Os Forward-Looking Centers (Cf) se apresentam na forma de um conjunto. Constituem um conjunto de entidades, ordenadas segundo algum critério de saliência, que fornecem possíveis ligações para o próximo enunciado. A entidade mais altamente classificada entre os Forward-Looking Centers, é o próximo centro

preferencial (Cp). Um critério usual para ordenação deste conjunto de entidades é a

função gramatical: sujeito>objeto>outras.

Considerando os centros assim conceituados, três diferentes tipos de relações são definidas para valer entre enunciados. Essas relações são expressas pelas transições center continuation, center retaining e center shifting, caracterizadas como:

• Center Continuation: o Cb de um enunciado En+1 é o mesmo que o Cb de En, e essa entidade é o elemento mais altamente classificado no

Cf do enunciado En+1;

• Center Retaining: o Cb do enunciado En+1 é o mesmo que o Cb de En,

mas essa entidade não é o elemento mais altamente classificado no Cf de En+1; e

• Center Shifting: o Cb de En+1 é diferente do Cb de En.

Além dos movimentos possíveis para centros, a teoria propõe também duas regras:

−Regra 1: Se qualquer elemento de Cf(En) é realizado por um pronome

em En+1, então o Cb(En+1) precisa ser realizado por um pronome

também.

−Regra 2: Seqüências de CONTINUE são preferidas sobre seqüências de RETAIN, que são preferidas sobre seqüências de SHIFT.