TATIANA DE OLIVEIRA PETRY
USO DA TEORIA DE CENTERING NO TRATAMENTO COMPUTACIONAL
DE REFERÊNCIAS ANAFÓRICAS PRONOMINAIS NO PORTUGUÊS ESCRITO: UMA EXPERIMENTAÇÃO COM PRONOMES PESSOAIS
Dissertação apresentada como requisito parcial à obtenção do grau de mestre.
Programa de Pós-Graduação em Ciência da Computação,
Faculdade de Informática,
Pontifícia Universidade Católica do Rio Grande do Sul. Orientadora: Profa. Dra. Vera Lúcia Strube de Lima.
PORTO ALEGRE 2000
À minha família, especialmente aos meus pais, pelo amor, carinho, apoio e compreensão.
À Profa. Vera Lúcia Strube de Lima pela orientação, amizade e dedicação durante o desenvolvimento deste trabalho.
Ao Prof. Flávio Moreira de Oliveira pelo apoio e orientação nos trabalhos individuais.
Ao Stewart pelo auxílio no desenvolvimento do protótipo.
i
SUMÁRIO
SUMÁRIO... I LISTA DE FIGURAS... IV LISTA DE TABELAS ... IV LISTA DE ABREVIATURAS...V RESUMO ... VI ABSTRACT ...VII 1 INTRODUÇÃO ...1 1.1 MOTIVAÇÃO...1 1.2 ORGANIZAÇÃO DO TEXTO...4 2 EXPOSIÇÃO DO PROBLEMA ...5 2.1 REFERÊNCIA...5 2.1.1 Tipos de referência ...6 2.1.2 Co-referência ...72.1.3 Funções referenciais de pronomes ...7
2.1.4 Relações anafóricas...8
2.2 UMA ESTRUTURA PARA RESOLUÇÃO DE REFERÊNCIAS...10
2.3 CONSIDERAÇÕES...12
3 ABORDAGENS COMPUTACIONAIS PARA RESOLUÇÃO DE ANÁFORAS PRONOMINAIS...13
3.1 A ABORDAGEM DE TETSUYA NASUKAWA PARA RESOLUÇÃO DE PRONOMES...13
3.1.1 Critérios propostos ...14
3.1.2 Descrição do experimento ...15
3.1.3 Resultados do experimento ...15
3.2 A ABORDAGEM DE MITKOV PARA RESOLUÇÃO DE PRONOMES...16
3.2.1 Características dos experimentos ...16
3.2.2 Critérios estabelecidos ...17
3.2.3 Exemplo de aplicação dos critérios ...18
3.3 A ABORDAGEM DE BRECK BALDWIN...19
3.3.1 Regras estabelecidas para identificação de antecedentes de pronomes...20
3.4 O ALGORITMO DE LAPPIN E LEASS...21
3.4.1 Características do algoritmo ...21
3.4.2 Características do experimento ...21
3.4.3 Módulos componentes ...22
3.4.4 Resultados do experimento ...22
3.5 CONSIDERAÇÕES...23
4 RESOLUÇÃO DE ANÁFORAS E ESTRUTURA DO DISCURSO...24
4.1 CONCEITOS BÁSICOS...25
4.1.1 Discurso...25
4.1.2 Enunciado ...25
4.1.3 Segmento...25
4.2 SOBRE A NECESSIDADE DE UMA DESCRIÇÃO DA ESTRUTURA DO DISCURSO...26
4.2.1 Considerações de Passonneau e Litman sobre segmentação de discurso ...26
4.3 ESTRUTURAÇÃO DO DISCURSO: PROPOSTAS E PERSPECTIVAS...28
4.4 CONSIDERAÇÕES...34
5 CENTERING: ESPECIFICAÇÃO DO MODELO E DIREÇÕES DE PESQUISA ...36
5.1 A TEORIA DE CENTERING...36
5.1.1 Objetivo ...36
5.1.2 Modelo proposto pela teoria...36
5.2 EXTENSÕES PROPOSTAS E PESQUISAS RELACIONADAS À CENTERING...39
5.2.1 O algoritmo de Brennan, Friedman e Pollard...39
5.2.2 Uma revisão da proposta de Kameyama para Centering intra-sentencial...40
5.2.3 Observações de Sharon Cote ...41
5.2.4 Considerações de Craig Roberts sobre o lugar de Centering em uma teoria geral de resolução de anáforas ...43
5.3 CONSIDERAÇÕES...44
6 APROPRIAÇÃO DOS FUNDAMENTOS TEÓRICOS PARA USO DE CENTERING NA RESOLUÇÃO DE PRONOMES ...45
6.1 APLICAÇÃO DE CENTERING BASEADA EM CORPORA...48
6.2 CONSIDERAÇÕES SOBRE UM MODELO COMPUTACIONAL IMPLEMENTANDO CENTERING...53
6.2.1 Aspectos Gerais ...53
6.2.2 Componentes do Modelo ...54
6.3 CONSIDERAÇÕES...56
7 EXPERIMENTO ...57
7.1 ESCOLHAS REALIZADAS...57
7.1.1 Escolha do conjunto de pronomes a tratar...57
7.1.2 Escolha do corpus para estudo...57
7.2 REVISÕES...58
7.2.1 Pronomes pessoais na língua portuguesa...58
7.2.2 Conhecimentos úteis na resolução de pronomes pessoais...59
7.3 DECISÕES DE PROJETO...60
7.3.1 Marcação para sujeitos recuperáveis pela desinência verbal...61
7.3.2 Importância da noção de estrutura de discurso coerente...62
7.3.3 Constituição do conjunto de candidatos a antecedente...64
7.3.4 Filtro de candidatos inapropriados ...64
7.3.5 Pronomes avaliados...65
7.3.6 Pré-processamento ...65
7.3.7 Marcação de um sintagma nominal como sujeito ...65
7.3.8 Processamento das sentenças ...66
7.4 O PROTÓTIPO DESENVOLVIDO...66 7.5 RESULTADOS OBTIDOS...70 7.5.1 Análise 1 ...71 7.5.2 Análise 2 ...71 7.6 CONSIDERAÇÕES...72 8 CONCLUSÃO...73
8.1 O TRABALHO NO CONTEXTO DO GRUPO DE PLN DA PUCRS ...73
8.2 CONSIDERAÇÕES SOBRE ESTE TRABALHO...74
8.3 SOBRE OS RESULTADOS DO TRABALHO...76
8.4 TRABALHOS FUTUROS...78
9 REFERÊNCIAS BIBLIOGRÁFICAS...79
10 FONTE DO CORPUS ...84
iii
ANEXO B ...86
LISTA DE FIGURAS
FIGURA 1: ESTRUTURA GERAL DE UM SISTEMA DE RESOLUÇÃO DE REFERÊNCIA [POPESCU-BELIS 97] ...11
FIGURA 2: ESTRUTURA DE FOCALIZAÇÃO [GROSZ 86]...30
FIGURA 3: COMPONENTES DO MODELO...54
FIGURA 4 - MENU DO APLICATIVO...67
FIGURA 5: INTERFACE DO PROTÓTIPO IMPLEMENTADO...68
FIGURA 6: INTERFACE DO DICIONÁRIO...70
LISTA DE TABELAS
TABELA 1: CLASSIFICAÇÃO DE REFERÊNCIAS (EXEMPLOS TRANSCRITOS DE [KOCH 89]) ...6TABELA 2: CORRELAÇÃO ENTRE SELEÇÃO CORRETA E SELEÇÃO DE ACORDO COM CADA TIPO DE PREFERÊNCIA [NASUKAWA 94] ...15
TABELA 3: PONTUAÇÃO PARA “THE DRAWER” [MITKOV 98] ...19
TABELA 4: PONTUAÇÃO PARA “THE LIT PAPER PORT LED” [MITKOV 98]...19
TABELA 5: ILUSTRAÇÃO DOS MOVIMENTOS POSSÍVEIS PARA O "CENTRO" DOS ENUNCIADOS...38
TABELA 6: EXTENSÃO DE BRENNAN, FRIEDMAN E POLLARD...40
TABELA 7: TRANSIÇÕES DE CENTERING [WALKER 98]...46
TABELA 8: DISTRIBUIÇÃO PRONOMINAL NOS TEXTOS DESCRITIVOS...58
TABELA 9: DISTRIBUIÇÃO PRONOMINAL NOS TEXTOS NARRATIVOS...58
TABELA 10: PRONOMES PESSOAIS DA LÍNGUA PORTUGUESA...59
TABELA 11: EXEMPLOS DE DI EUGENIO COMPARANDO USO DE PRONOMES CLAROS E NULOS NA POSIÇÃO DE SUJEITO...63
v
LISTA DE ABREVIATURAS
PLN Processamento de Linguagem Natural SN Sintagma Nominal
SV Sintagma Verbal
Cb Backward-Looking Center Cf Forward-Looking Centers Cp Próximo centro preferencial
RESUMO
Esta dissertação pretende ser uma contribuição em direção à compreensão de linguagem natural por sistemas computacionais, tendo como foco a resolução de referências pronominais pessoais anafóricas de terceira pessoa na língua portuguesa brasileira.
Inicialmente, caracteriza-se o fenômeno lingüístico da anáfora em discursos. A seguir apresentam-se estratégias encontradas na literatura para resolução deste tipo de referência, o escopo trabalhado nestas estratégias e seus resultados. Após, procede-se um estudo mais detalhado sobre a teoria de Centering, que é uma teoria atual endereçando a questão da resolução de anáforas.
Considerando a relevância que esta teoria tem adquirido na atualidade (veja-se o número de trabalhos publicados envolvendo a teoria em conferências e revistas especializadas), busca-se evidenciar sua aplicação à língua portuguesa, incluindo, em modelo implementado, idéias oriundas da teoria e tecendo considerações sobre sua utilidade na resolução de pronomes.
Por fim, descreve-se um experimento realizado com um corpus composto por textos narrativos de histórias infantis, com o objetivo de explicitar conhecimentos úteis no processo de resolução de referências anafóricas pronominais pessoais e validar a participação destes conhecimentos em uma modelagem computacional.
vii
ABSTRACT
This dissertation aims to be a contribution towards natural language understanding by computational systems, focusing on the resolution of anaphoric personal pronominal references of the third persons in Brazilian Portuguese language.
Initially, we will characterize the linguistic phenomenon of anaphora in discourse. Next, we will present strategies found in literature for the resolution of this kind of reference, the scope investigated on these strategies and their results. Afterwards, a more detailed study about the Centering theory will be discussed, that is a current theory addressing anaphora resolution.
Considering the importance that this theory has achieved at the present time (judging from the number of publications involving the theory at specialized conferences and journals), we try to make its application to Portuguese language clear including in an implemented model, ideas derived from the theory and commenting on its utility on pronoun-problem resolution.
Finally, we will describe an experiment made with a corpus composed by narrative texts of children stories, with purpose to recognize useful knowledge in the process of resolution of anaphoric personal pronominal references in Brazilian Portuguese language, and to validate the role of this knowledge in a computational modeling of reference resolution.
A linguagem humana é tema de investigação de diferentes áreas, tais como lingüística, ciências cognitivas e computação, na linha de pesquisas em Processamento da Linguagem Natural (PLN).
Como cientistas da computação, nosso interesse fundamental centra-se em algoritmos, estruturas de dados e modelos formais de representação e raciocínio que permitam, ao menos em parte, simular a capacidade humana de uso da linguagem.
Como capacidade humana de uso da linguagem podem-se distinguir pelo menos dois processos: geração e compreensão de linguagem. O processo de geração engloba a produção de discurso (escrito ou falado, texto ou enunciados em um diálogo) por seus participantes nos papéis de escritor ou falante. O processo de compreensão da linguagem envolve a interpretação do discurso – identificação das entidades mencionadas no discurso, estabelecimento de relações, reconhecimento de intenções e inferências necessárias, uso de conhecimento contextual e de mundo – pelos leitores ou ouvintes.
Do ponto de vista da computação, estudos contemplando tanto compreensão quanto geração de linguagem por sistemas computacionais têm sido desenvolvidos, e sua utilidade pode ser evidenciada para diferentes aplicações. Com objetivos e métodos distintos, aplicações que se podem beneficiar do uso de alguma técnica de processamento da linguagem incluem interfaces que permitam a interação do usuário com o computador utilizando linguagem natural, information retrieval, sumarização de textos e tradução automática.
Independente da diversidade de aplicações, contudo, o princípio geral permanece o mesmo: construir uma representação interna do texto (ou do diálogo),
2
apoiando-se ao mesmo tempo em regras lingüísticas e em conhecimentos extra-lingüísticos inseridos no sistema [Fuchs 93].
Greene, em [Greene 95], coloca que, para a psicologia cognitiva, várias questões associadas ao uso da linguagem podem ser traduzidas em “como o conhecimento é representado na memória”. Para reduzir o problema, então, a proporções gerenciáveis, usualmente tem-se desdobrado o conhecimento lingüístico necessário ao uso da linguagem em vários tópicos, que têm sido estudados em isolado em relação aos outros.
Esta atitude também é assumida por cientistas da computação, que procuram isolar classes de problemas distintos e endereçá-los separadamente. Allen, em [Allen 94], por exemplo, organizou seu livro sobre sistemas de compreensão da linguagem em torno de três níveis de representação, a saber: a estrutura sintática, a forma lógica e a representação final do significado. Isto tem a virtude, segundo ele, de “permitir que se estude cada problema em profundidade sem preocupação com outras complicações”.
Neste trabalho, assume-se a visão de que a resolução de anáforas seja, também, somente uma parte do problema da compreensão de discursos por sistemas computacionais, sendo, entretanto, uma etapa importante e necessária.
Resolver uma anáfora é, em essência, determinar o antecedente de um termo ou expressão anafórica. Computacionalmente, contudo, é uma tarefa complexa exigindo conhecimento de natureza diversa pois, em geral, há uma multiplicidade de antecedentes possíveis, tornando necessário aplicar um algoritmo para filtrar candidatos inválidos, e classificar os candidatos válidos segundo critérios de saliência.
Buscando, ao mesmo tempo, estabelecer um ranking de saliência para as entidades mencionadas no discurso, e fornecer uma descrição da coerência exibida por um segmento de discurso, a teoria de Centering [Grosz 95, Brennan 87, Di Eugenio 90,
Di Eugenio 96, Di Eugenio 98, Kameyama 98, Strube 99] tem sido alvo de consideráveis investigações.
Segundo Kameyama, em [Kameyama 98], “a especificação da dinâmica da saliência é um passo crucial em direção a uma teoria formal da pragmática do discurso, e Centering focaliza as inter-relações entre a dinâmica do centro e a forma do enunciado”.
Este trabalho tem como foco a resolução de referências anafóricas pronominais pessoais de terceira pessoa na língua portuguesa e o uso de Centering no processo de resolução. A opção por tratar esta classe de expressões de referência foi motivada pela constatação de que os artigos relacionados à teoria de Centering (publicações entre os anos de 1995 e 1999) contemplavam mais freqüentemente esta categoria, sendo por isto, a que permitiria comparação com a língua portuguesa.1
Tendo se definido o objetivo de tratar pronomes pessoais de terceira pessoa na língua portuguesa, procedeu-se uma avaliação de textos para adotar um corpus de trabalho. Avaliaram-se textos narrativos de histórias infantis e textos descritivos provenientes da revista Ciência Hoje. Optou-se por trabalhar com o conjunto de textos narrativos, por este tipo de texto apresentar maior proporção de pronomes pessoais em relação aos descritivos, vocabulário mais homogêneo e estrutura de sentença um pouco menos complexa.
Cabe comentar que a fundamentação teórica de Centering teve suporte, inicialmente, em exemplos construídos, cujo objetivo era ressaltar determinadas propriedades relativas à estruturação de enunciados. Tendo em vista que textos reais oferecem uma variedade maior de situações, seria interessante testar se Centering oferece uma análise adequada para a resolução de referências para a língua portuguesa em particular, em textos reais.
1
(encontrou-se publicações relativas à aplicação da teoria para as línguas inglesa, italiana, alemã e japonesa).
4
Outros conhecimentos passíveis de uso na resolução de referências anafóricas pronominais pessoais também foram investigados e são comentados no decorrer do texto da dissertação. Particularmente, citam-se trabalhos que mostram resultados obtidos com a aplicação de um conjunto específico de regras ou conhecimentos sobre corpora.
1.2
Organização do texto
No capítulo 2, realiza-se uma revisão bibliográfica sobre o fenômeno lingüístico da referência. No capítulo 3, apresentam-se algumas propostas encontradas na literatura para resolução de anáforas pronominais. No capítulo 4, inclui-se uma revisão sobre estrutura do discurso e tecem-se considerações sobre a importância de um modelo computacional adequado a esta estrutura, para resolução de anáforas. No capítulo 5 procede-se uma revisão da teoria de Centering, sua motivação original, extensões propostas e observações feitas por diferentes pesquisadores. No capítulo 6, apresentam-se considerações gerais sobre o uso de Centering baseado em corpora. No capítulo 7, apresenta-se o experimento realizado e seus resultados. No capítulo 8 tecem-se conclusões ao pretecem-sente trabalho. Finalmente, apretecem-sentam-tecem-se as referências bibliográficas (capítulo 9) e anexos.
No presente capítulo, conceituam-se os fenômenos da referência, co-referência e relações anafóricas do ponto de vista lingüístico. Apresenta-se a motivação para tratamento computacional dos mesmos e delimita-se o escopo trabalhado nesta dissertação, qual seja, referências anafóricas pronominais pessoais.
Procede-se também uma revisão de tipos de conhecimentos que podem estar associados à resolução destas referências, do ponto de vista lingüístico e cognitivo e, para finalizar, discute-se uma arquitetura genérica proposta por Popescu-Belis e Robba, em [Popescu-Belis 97], para tratamento computacional unificado de referências em geral e pronomes.
2.1
Referência
Uma das funções da linguagem é estabelecer referência. Yule, em [Yule 96], define referência como “um ato pelo qual um falante (ou escritor) usa a linguagem para capacitar um ouvinte (ou leitor) a identificar alguma coisa”. Complementarmente, Larson [Larson 95], do ponto de vista semântico, define referência como “uma relação entre expressões e objetos extra-lingüísticos, tais como pessoas e países”. Em outras palavras, isto significa que por meio da linguagem (por exemplo, emprego de sintagmas nominais que descrevem entidades do mundo real), um falante ou escritor introduz pessoas, fatos, eventos ou ações no universo de discurso tencionando que seus ouvintes ou leitores sejam capazes de identificá-los.
A partir da introdução de uma entidade (pessoa, fato, evento, ação) no universo do discurso, sua retomada pode ocorrer com o emprego de elementos de
referência2, tais como pronomes. Estes são, ao mesmo tempo um recurso estilístico,
2
Koch, em [Koch 89], define estes elementos como “os itens da língua que não podem ser interpretados semanticamente por si mesmos, mas remetem a outros itens do discurso necessários a sua interpretação”.
6
evitando a repetição de uma expressão já mencionada e um recurso de coesão textual, cuja função é estabelecer relações textuais.
2.1.1 Tipos de referência
A referência pode ser classificada, segundo Halliday & Hasan (apud [Koch 89]), como:
• situacional ou exofórica: quando a remissão é feita a algum elemento
da situação comunicativa; e
• textual ou endofórica: quando o referente3 se acha expresso no próprio texto.
Em se tratando de uma referência endofórica ou textual, ela ainda pode ser classificada como:
• anáfora: quando o referente aparece no texto antes do elemento de
referência; ou
• catáfora: quando o referente vem após o elemento de referência.
A tabela 1 ilustra a classificação citada.
TIPO DE REFERÊNCIA EXEMPLO
REFERÊNCIA SITUACIONAL OU EXOFÓRICA 9RFrQmRVHDUUHSHQGHUiGHWHUOLGRHVWHDQ~QFLR
REFERÊNCIA TEXTUAL ANAFÓRICA 3DXOR H -RVp VmR H[FHOHQWHV DGYRJDGRV (OHV VH
IRUPDUDPQD$FDGHPLDGR/DUJRGH6mR)UDQFLVFR
REFERÊNCIA TEXTUAL CATAFÓRICA 5HDOL]DUD WRGRV RV VHXV VRQKRV PHQRV HVWH R GH
HQWUDUSDUDD$FDGHPLD
Tabela 1:Classificação de Referências (exemplos transcritos de [Koch 89])
3 como referente entenda-se a entidade (pessoa, objeto, coisa) a que se remete por meio de um elemento de referência
2.1.2 Co-referência
Greimas, em [Greimas 89], define co-referência como “ a relação que dois signos lingüísticos (idênticos ou diferentes) mantêm entre si, quando situados em dois lugares (contíguos ou distanciados) da cadeia falada, remetem a um mesmo objeto extra-lingüístico”.
Para ilustração considere as seguintes sentenças (ambas são citadas em [Perini 95]):
(1) 5LFDUGRGLVVHTXH3HGURREHOLVFRX
(2) 5LFDUGRGLVVHTXH3HGURVHSHQWHLDFRPPDQWHLJD
Em (1), o pronome “o” pode ser entendido como referindo-se a Ricardo. Do mesmo modo em (2), “se” pode ser entendido como referindo-se a Pedro. Portanto, existe co-referência entre Ricardo e o em (1), e Pedro e se, em (2).
Segundo Perini em [Perini 95], “as condições que governam a co-referência de pronomes com os demais sintagmas nominais da oração são surpreendentemente complexas, e a tentativa de explicitá-las tem sido um dos grandes temas de pesquisa em sintaxe e semântica nos últimos anos”.
2.1.3 Funções referenciais de pronomes
Quanto as funções referenciais de pronomes faz-se aqui uma distinção importante. Pronomes referenciais podem exercer uma função dêitica ou uma função
anafórica. Corrêa, em [Corrêa 99], conceitua estas funções como segue:
• função dêitica: quando o referente não foi previamente introduzido
no discurso ou quando não é possível identificá-lo sem recorrer a informação contextual, não lingüística; e
8
• função anafórica: é desdobrada nas funções de manter e de alterar
referência previamente introduzida no discurso.
Para ilustrar esta diferença, considere os seguintes exemplos:
(3) 0iULRIRLjSDGDULD(OHYROWDGHQWURGHTXLQ]HPLQXWRV
(4) (XIXLDRSDUTXHRQWHP
No exemplo (3) o pronome “ele” tem função anafórica, rementendo a entidade “Mário” previamente introduzida. No exemplo (4), a identificação do referente do pronome “eu” depende da identificação do contexto da enunciação, com identificação do falante ou escritor.
2.1.4 Relações anafóricas
Conforme já mencionado uma anáfora é uma relação discursiva que ocorre quando um referente é introduzido e, subseqüentemente, é retomado por meio de algum elemento de referência, tal como um pronome. Hirst, em [Hirst 81], apresenta uma extensa classificação para relações e termos anafóricos. Note-se, entretanto, que alguns autores, como Renkema, em [Renkema 93], limitam a retomada anafórica ao emprego de pronomes. Contudo, na área de PLN, o termo é geralmente empregado em sentido mais amplo, englobando outras espécies de relações anafóricas (por exemplo, a retomada por expressão sinônima, como em “A filha de Maria está doente, por isso a
garota não veio à escola hoje”) sendo usual o emprego da expressão anáfora pronominal para distinguir a esta de outras espécies de anáforas.
2.1.4.1 Anáfora: ponto de vista técnico
Do ponto de vista técnico uma anáfora é composta por um antecedente e um termo anafórico. Termo anafórico e antecedente são co-referentes. Em (5) temos o pronome ele desempenhando o papel de termo anafórico e João como seu antecedente.
(5) -RmRQmRIRLjHVFROD(OHHVWDYDGRHQWH
O processo de determinação do antecedente de um termo anafórico é denominado resolução.
2.1.4.2 Resolução de anáforas
Do ponto de vista computacional, a problemática associada com a resolução de anáforas faz-se perceber quando o conjunto de candidatos a antecedente é grande, e um processo de decisão precisa ser aplicado para escolher um, dentre os candidatos possíveis, como o antecedente. Os conhecimentos relevantes para determinação de antecedentes tem sido tema de investigação sob diferentes enfoques e com diferentes objetivos, em áreas como lingüística, ciências cognitivas e PLN.
Para uma introdução geral, considere o seguinte exemplo, extraído de [Coulson 95], p. 94. D $QDYLDMRXQDVIpULDVFRP0DUFRH6LPRQ E (ODIRLSDUDDSUDLDSDUDGHVFDQVDUSRUGXDVVHPDQDV F 0DUFRWLQKDHQFDUUHJDGRVHGHWRGRVRVSUHSDUDWLYRVHOHWLQKDUHVHUYDGRSDUDHOHV XPY{RTXHSDUWLDjVTXDWURGDWDUGH G 4XDQGRHOHVFKHJDUDPDRDHURSRUWRXPDDHURPRoDGLVVHDHOHVTXHRQHYRHLURHVWDYD DWUDVDQGRDSDUWLGDGHVHXDYLmR H 'HSRLVGHXPDORQJDHVSHUDHOHVILQDOPHQWHHPEDUFDUDPQRDYLmR I $QDGHXRVSULPHLURVSDVVRVRQGHRSLORWRHVWDYDHVSHUDQGRSDUDHQFRQWUiORV J ¶2Oi·HODGLVVH¶(XHVSHURTXHQyVSRVVDPRVSDUWLUQHVVHQHYRHLUR· K ¶(XJDUDQWRTXHQmRKDYHUiSUREOHPDV·YHLRDUHVSRVWD
Analisando o exemplo, sem intenção exaustiva, para resolver o pronome ‘ela’, em (b), pode-se fazer uso de diferentes informações. Considerando-se todos os SNs em (a), a saber ‘Ana’, ‘férias’, ‘Marco’ e ‘Simon’, conhecimento de gênero nos seria útil, permitindo a eliminação de ‘Marco’ e ‘Simon’ da lista de possíveis
10
antecedentes e, da mesma forma, conhecimento de número permitiria a eliminação de ‘férias’. Adicionalmente, pode-se utilizar informação de saliência de entidades: ‘Ana’ ocupa a posição de sujeito da sentença, o que a torna mais saliente que os demais SNs. Para interpretar adequadamente, o pronome ‘eles’ em (c), por outro lado, é necessário identificar o conjunto ‘Ana’ + ‘Marco’ + ‘Simon’.
Coulson, em [Greene 95], distingue as fontes de informação para resolução de anáforas como lingüísticas e não-lingüísticas. Como informações lingüísticas cita gênero, número, sintaxe e informação lexical. Entre as não lingüísticas foco, scripts e conhecimento de mundo.
2.2
Uma estrutura para resolução de referências
Nesta seção, apresenta-se uma arquitetura proposta por Popescu-Belis e Robba, em [Popescu-Belis 97], que ilustra vários elementos que podem fazer parte de um sistema computacional cuja finalidade é processar referências. O objetivo é comentar e deixar claras para o leitor várias etapas de análise que podem estar envolvidas no processamento computacional de referências.
A arquitetura formulada por estes autores é apresentada na figura 1. Serve tanto para resolução de pronomes como referências em geral. Na concepção de anáfora, uma relação textual, existe um antecedente e um termo anafórico, que depende da descrição textual do antecedente para ser resolvido. O antecedente, por sua vez, pode fazer referência a um objeto extra-textual.
Tendo por base trabalhos recentes que buscam unificar estas duas situações (oferecendo uma taxonomia de classes de expressões de referência), os autores desenvolveram uma arquitetura genérica contemplando ambas as situações. A arquitetura será descrita e comentada, a seguir.
Figura 1: Estrutura geral de um sistema de resolução de referência [Popescu-Belis 97]
Pode-se observar, na figura 1, que Popescu-Belis e Robba procuraram deixar claros vários aspectos importantes a serem considerados no tratamento de expressões de referência por sistemas computacionais. A primeira consideração a ser feita é que eles buscaram definir uma arquitetura aberta, onde as entidades candidatas a referência podem provir de diferentes entradas no sistema, como uma entrada textual, onde o texto conteria as entidades e expressões de referência a serem resolvidas, ou algum outro tipo de entrada, como um click de mouse sobre um objeto num cenário.
Na estrutura de Popescu-Belis e Robba:
• ERi: indica uma expressão de referência localizada no texto.
• pERi: é uma pseudo-expressão de referência (no caso de a entrada de
dados ser multi-modal; a referência poderia ocorrer, por exemplo, a partir de um click de mouse sobre um objeto na tela).
Controlador (M2) TEXTO ---ER1 ---ER2---ER3 - ---ER4 ---ER 5-- ---OUTRA MODALIDADE ---pER1 ---pER2 ---pER3 ---pER4 ---Mundo Real Outros Módulos (Mx) Conhecimento Representação do mundo real COMPUTADOR Módulo de Resolução (M1) CONJUNTO DE ENTIDADES Ativação
12
• M1: módulo que seleciona expressões de referência do texto, associando cada expressão à estrutura da entidade própria no conjunto de entidades. Pode associar uma ER a uma entidade existente ou criar uma nova entidade.
• M2: módulo que controla o conjunto das entidades, atualizando sua ativação ou saliência.
Note-se que os módulos M1 e M2 são os responsáveis pela resolução de referências. O módulo M1 faz a associação de uma ER com a estrutura da entidade com a qual se encontra relacionada. O módulo M2 é responsável pela manutenção da saliência das entidades, podendo avaliar esta saliência utilizando diferentes abordagens (nos capítulos 3, 4 e 5 são apresentados meios pelos quais a saliência pode ser medida).
2.3
Considerações
Neste capítulo, conceituou-se referência e co-referência, descreveram-se funções referenciais que podem ser assumidas por pronomes, detalharam-se relações anafóricas, e procedeu-se uma análise preliminar de diferentes conhecimentos que podem ser empregados para a resolução de referências pronominais anafóricas pessoais, introduzindo-se o leitor na questão da resolução de referências.
No capítulo a seguir, serão descritas estratégias computacionais para resolução de anáforas encontradas na literatura de Processamento de Linguagem Natural. Essas abordagens foram testadas com textos na língua inglesa e, para as mesmas, são mencionados os resultados relatados.
O objetivo deste capítulo é apresentar e explorar diferentes enfoques e idéias identificadas na literatura, com respeito a resolução de pronomes.
3.1
A abordagem de Tetsuya Nasukawa para Resolução de Pronomes
Nasukawa, em [Nasukawa 94], apresenta uma abordagem que procura explorar conhecimentos que possam ser obtidos a partir do texto que será analisado. Afirma que é possível extrair informações de textos coerentes que auxiliem na resolução de referências pronominais.
Tendo em vista que a aquisição de conhecimento é uma característica que limita um sistema, Nasukawa sugere que, ao invés de utilizar conhecimento externo, aplique-se um algoritmo que extraia informações do próprio texto, as quais possam colaborar na tarefa de identificação de antecedentes de pronomes e, desta forma, contribuam para melhorar o desempenho do sistema nesta tarefa.
Nasukawa identificou três fatores para medir a saliência4 relativa de sintagmas nominais introduzidos no discurso, e conduziu um experimento descrevendo os resultados obtidos com a aplicação dos mesmos. A seguir apresentam-se os critérios propostos pelo autor para medir a saliência de diferentes sintagmas nominais introduzidos no discurso e os resultados daquele experimento.
4 a saliência de um sintagma nominal representa o quanto ele é o centro de atenção para um ouvinte ou leitor, conferindo maior ou menor probabilidade de referenciação posterior mediante emprego de pronomes
14
3.1.1 Critérios propostos
a) Collocation Patterns (padrões de colocação)
Segundo Nasukawa, uma palavra tem, geralmente, um sentido unificado dentro de um texto. Partindo desta idéia, ele defende que padrões de colocação dentro de um texto fonte podem fornecer dados valiosos na identificação de referentes de pronomes.
Para ilustrar a aplicabilidade de tal fator, ele supõe que, em um texto, seja encontrada a sentença “He moved his residence”. Esta ocorrência permitirá inferir que a palavra “residence” pode ser objeto do verbo “move”. Assim, no momento de avaliar referências no texto, se uma outra sentença como “The castle in Camelot remained the residence of the king until 536 when he moved it to London” fosse encontrada, este critério permitiria atribuir uma preferência ao candidato “residence”.
b) Freqüência de repetição em sentenças precedentes
Nasukawa utilizou, como fundamento para este critério, a idéia apresentada na abordagem de Centering para resolução de pronomes de Brennan et al., em [Brennan 87]5, segundo a qual um objeto em foco é um candidato mais provável a pronominalização. Estendeu esta idéia, supondo que um sintagma nominal em foco possa ser referido por uma descrição definida antes de ser pronominalizado. Para uso de tal critério, o autor faz uma busca por palavras com o mesmo lema, nas sentenças precedentes à ocorrência da pronominalização.
c) Posição sintática
Segundo Hobbs (apud [Nasukawa 94]), uma regra heurística favorecendo sujeitos sobre objetos é bastante útil para o inglês. Visando atribuir uma preferência por posição sintática sem necessidade de recorrer a um processamento sintático mais complexo, Nasukawa atribui preferência a um candidato na sentença mais próxima, ou ao candidato mais próximo do início da mesma sentença.
5
3.1.2 Descrição do experimento
Nasukawa realizou um experimento com as seguintes características:
1. Corpus de teste: manuais técnicos de computadores (normalmente antecedentes explícitos);
2. Pronomes considerados: pronomes de terceira pessoa; 3. Número de pronomes no corpus: 112;
4. Algoritmo básico:
1º passo: selecionar os sintagmas nominais candidatos a antecedente
de um termo anafórico;
2º passo: verificar concordância de gênero e número filtrando
candidatos impróprios;
3º passo: aplicar os critérios propostos no estabelecimento de
preferências na determinação do antecedente.
3.1.3 Resultados do experimento
O experimento apresentou bons resultados: uma taxa de acerto do antecedente de 93,8% (105 das 112) ocorrências. Os critérios selecionais propostos pelo autor foram aplicados em 84 casos e a tabela 2 resume a participação de cada critério na seleção do antecedente para um pronome. Note-se que, quando aplicável, a existência de colocação similar sempre atribuiu preferência selecional ao antecedente correto.
Número de casos em que o antecedente correto foi
selecionado
Número de casos em que o antecedente errado foi
selecionado
Número de casos sem qualquer informação válida Posição Sintática 69 (82,1%) 15 (17, 9%) 0 Freqüência de Repetição 51 (60,7%) 22 (26,2%) 11 (13,1%) Existência de colocação similar 22 (26,2%) 0 (0%) 62 (73,8%)
Tabela 2: Correlação entre seleção correta e seleção de acordo com cada tipo de preferência [Nasukawa 94]
16
3.2
A Abordagem de Mitkov para Resolução de Pronomes
Mitkov, em [Mitkov 97; Mitkov 98], apresenta um conjunto de heurísticas para identificar antecedentes de pronomes, estabelecidas com base em investigações em corpus. A seguir serão apresentadas as características dos experimentos por ele realizados e os resultados obtidos.
3.2.1 Características dos experimentos
Os experimentos apresentados em [Mitkov 97] e [Mitkov 98] usam a mesma estratégia para resolução de pronomes, diferindo apenas o conjunto de heurísticas utilizadas para avaliação dos candidatos a antecedente.
Os experimentos descritos nesses artigos têm as seguintes características:
• O pré-processamento do texto é limitado ao uso de um rotulador de categorias gramaticais6 de palavras e à aplicação de regras simples para a identificação de sintagmas nominais7.
• Para seleção dos candidatos a antecedente é considerado o limite de duas sentenças anteriores ao termo anafórico, com filtragem daqueles que discordam em gênero ou número deste último.
• Cada candidato remanescente é avaliado segundo diversos critérios (heurísticas) estabelecidos, com atribuição de pontuação, de acordo com a satisfação do critério pelo candidato.
• O candidato proposto como antecedente é aquele que atinge maior pontuação total na soma das pontuações dos critérios.
• Os critérios que selecionam o antecedente foram identificados empiricamente a partir da análise de corpus efetuada pelo autor.
6
Substantivo, adjetivo, verbo, pronome,...
3.2.2 Critérios estabelecidos
a) Preferência por sintagmas nominais definidos sobre sintagmas nominais indefinidos Mitkov considera como sintagmas nominais definidos aqueles precedidos por artigo definido, por pronomes possessivos ou por demonstrativos.
b) Preferência por sintagmas nominais representando o tema
Sintagmas nominais em sentenças prévias que representam o tema, são melhores candidatos a antecedentes.
c) Preferência por termos específicos da área do corpus
Sintagmas nominais representando termos na área do corpus são mais prováveis de serem antecedentes do que sintagmas nominais que não são específicos da área.
d) Verbos de indicação
Se o verbo é membro do conjunto {discuss, present, illustrate, identify,
summarise, examine, describe, define, show, check, develop, review, report, outline, consider, investigate, explore, assess, analyse, synthesise, study, survey, deal, cover},
então considerar o primeiro sintagma nominal que o segue como o antecedente preferido.
e) Sintagmas nominais de indicação
Se o substantivo principal do sintagma nominal precedendo o verbo é
chapter, section ou table, então considerar o sintagma nominal seguindo o verbo como
o antecedente preferido.
f) Reiteração lexical
“Itens lexicalmente reiterados” são candidatos prováveis a antecedente. Estes itens incluem sintagmas nominais sinônimos que podem ser precedidos por artigos definidos ou demonstrativos e também uma seqüência de sintagmas nominais
18
com o mesmo substantivo principal (por exemplo, toner bottle, bottle of toner, the
bottle).
g) Preferência por padrões de colocação
É dada preferência a candidatos que têm padrão de colocação idêntico a um pronome. Mitkov utiliza esta preferência restrita aos modelos “substantivo/pronome, verbo” ou “verbo, substantivo/pronome”.
h) Distância referencial
Em sentenças complexas, sintagmas nominais na cláusula prévia (atualmente, o autor usa heurísticas simples para identificar cláusulas em uma sentença complexa, mas não as especifica nos artigos) são melhores candidatos a antecedente de uma anáfora na cláusula subseqüente. Depois aparecem os sintagmas nominais situados 2 sentenças atrás, e por último, sintagmas nominais situados 3 sentenças atrás.
i) Preferência por sintagmas nominais não preposicionais
A um sintagma nominal não preposicional é dada uma preferência mais alta que a um sintagma nominal que é parte de uma locução preposicional.
j) Referência imediata
Em manuais técnicos, o vestígio de “referência imediata” pode ser útil na identificação do antecedente. A heurística usada é a seguinte: em construções da forma “ .... (You) V1 NP ... con (you) V2 it (con (you) V3 it)”, onde con ∈ {and/ or/ before/
after}, o sintagma nominal antes de V1 é o mais provável candidato a antecedente do
pronome “it” imediatamente seguindo V2 e lhe é, por isso, dada preferência.
3.2.3 Exemplo de aplicação dos critérios
Supondo a sentença “Identify the draweri by the lit paper port LED and
add paper to it i”, extraída de [Mitkov 98], a “pontuação” para “the drawer” fica como
Critério Pontuação Preferência por sintagmas nominais definidos
Preferência a sintagmas nominais representado o tema Preferência por Termos específicos da área do corpus Verbos de indicação
Reiteração lexical Colocação
Distância referencial
Sintagma nominal não preposicional Referência imediata 1 0 1 1 0 0 2 0 2 TOTAL 7
Tabela 3: Pontuação para “the drawer” [Mitkov 98]
Enquanto isso, a pontuação de “the lit paper port LED” fica como mostrado na tabela 4:
Critério Pontuação
Preferência por sintagmas nominais definidos
Preferência a sintagmas nominais representado o tema Preferência por termos específicos da área do corpus Verbos de indicação
Reiteração lexical Colocação
Distância referencial
Sintagma nominal não preposicional Referência imediata 1 0 1 0 0 0 2 0 0 TOTAL 4
Tabela 4: Pontuação para “the lit paper port LED” [Mitkov 98]
3.3
A abordagem de Breck Baldwin
O sistema CogNIAC, descrito em [Baldwin 95], utiliza oito regras para identificar antecedentes de pronomes. Estas regras são aplicadas em ordem, até que um antecedente para o pronome tenha sido selecionado.
20
3.3.1 Regras estabelecidas para identificação de antecedentes de pronomes
a) Existência de um único antecedente possível na porção de discurso lida
A regra é aplicada se há um único antecedente possível X (que satisfaça restrições de gênero e número) na porção lida do discurso. Neste caso, selecioná-lo como o antecedente.
b) Reflexivo
Se o termo anafórico é um pronome reflexivo, escolher o antecedente mais próximo na porção lida da sentença atual.
c) Existência de um único antecedente possível considerando a sentença anterior e a sentença atual
Se há um único antecedente possível X na sentença anterior e na parte analisada da sentença corrente, então escolher X como o antecedente correto.
d) Pronomes possessivos
Se o termo anafórico é um pronome possessivo e há uma única cadeia de caracteres igual antecedendo-o na sentença anterior, escolhê-la como antecedente.
e) Existência de um único candidato possível na sentença atual
Se há um único antecedente possível na porção lida da sentença corrente, escolhê-lo como antecedente.
f) Sujeito único/ Pronome sujeito
Se o sujeito da sentença anterior contém um único antecedente possível X, e o termo anafórico é o sujeito desta sentença, então escolher X como o antecedente.
g) Escolher o Cb
Se há um Cb X na cláusula finita corrente que é também um candidato a antecedente, então escolher X como o antecedente.
h) Escolher o antecedente mais recente
Escolher o antecedente potencial mais recente no texto (isto é, aquele mais próximo do termo anafórico, satisfazendo restrições de gênero e número).
3.4
O algoritmo de Lappin e Leass
Lappin e Leass, em [Lappin 94], apresentam um algoritmo para resolução de anáforas pronominais que considera a estrutura sintática da sentença e propõe medidas de saliência para entidades baseada na função desempenhada pela mesmas.
3.4.1 Características do algoritmo
1. Baseia-se em medidas de saliência derivadas da estrutura sintática associada a um modelo dinâmico simples do estado atencional.8 2. O algoritmo identifica tanto antecedentes intra-sentenciais, quanto
intersentenciais.
3. Não emprega condições semânticas, além daquelas implícitas na concordância de gênero e número, nem emprega conhecimento de mundo, na avaliação dos candidatos a antecedente. Não modela a estrutura intencional ou estrutura global do discurso.
3.4.2 Características do experimento
1. Corpus de teste: manuais de computador;
2. Pronomes considerados: pronomes de terceira pessoa; 3. Número de pronomes no corpus: 360;
8 Na seção 4.3 (capítulo a seguir), são apresentadas as conceituações de estado atencional,
22
3.4.3 Módulos componentes
1. Um filtro baseado em sintaxe para eliminar possíveis ligações anafóricas entre pronomes e SNs.
2. Um filtro para eliminar antecedentes pela verificação da concordância de gênero, número ou pessoa entre pronome e SN. 3. Um módulo para identificar pronomes pleonásticos.
4. Um algoritmo para vincular antecedentes a pronomes recíprocos ou reflexivos dentro da mesma sentença.
5. Um módulo que atribui valores a vários parâmetros de saliência relacionados a um SN (quais sejam: função gramatical, paralelismo de funções gramaticais, freqüência de menção, proximidade e recentidade da sentença). A hierarquia de função gramatical atribui valores de saliência conforme as seguintes regras de avaliação:
- sujeitos têm peso maior que não sujeitos; - objetos diretos têm peso maior que outros
complementos;
- argumentos de um verbo têm peso maior que adjuntos;
- substantivos núcleo têm peso maior que complementos de substantivos núcleo.
6. Um procedimento de decisão para selecionar o elemento preferido de uma lista de candidatos a antecedente para um pronome.
3.4.4 Resultados do experimento
1. O algoritmo atingiu uma taxa de acerto do antecedente de 86%. 2. Com melhorias no algoritmo, correspondentes à modelagem estatística de informações semânticas e relações do mundo real, o aumento da taxa de acerto do antecedente foi de somente 2%.
3.5
Considerações
Neste capítulo foram descritas diferentes propostas encontradas na literatura para resolução de pronomes, com objetivo de identificar conhecimentos úteis e modelos de processamento.
Como características similares, estas estratégias apresentam:
- filtro por gênero/número de candidatos a antecedente; - consideração de recentidade;
- emprego de alguma medida de saliência para classificar as entidades candidatas a antecedente de um termo anafórico;
- pouco ou nenhum emprego de conhecimento semântico mais elaborado.
No capítulo seguinte, procede-se uma introdução à questão da estrutura do discurso, com revisão de trabalhos que abordam a relevância da identificação das sentenças prévias significativas para processamento de discurso subseqüente. Como o processamento computacional de anáforas inclui a adoção de uma representação do contexto anterior, no qual encontram-se as entidades candidatas a antecedente de um termo anafórico, e a identificação da saliência destas entidades, são revisadas propostas que contemplam estas questões.
4
RESOLUÇÃO DE ANÁFORAS E ESTRUTURA DO DISCURSO
Diversos autores têm apontado que uma descrição apropriada da estrutura do discurso é importante para determinar as sentenças relevantes no processamento de um determinado ponto do discurso ([Allen 94], [Grosz 86], [Walker 98]). Como processar um discurso inclui também resolver referências anafóricas que surjam, por conseqüência, é importante, no processo de resolução de referências, o conhecimento da estrutura do discurso.
Russel, em [Russel 95], afirma que, para se chegar a uma compreensão do discurso, ao menos seis tipos de conhecimento são relevantes, a saber:
- conhecimento geral sobre o mundo;
- conhecimento geral sobre estrutura de discurso coerente; - conhecimento geral sobre sintaxe e semântica;
- conhecimento específico sobre a situação sendo discutida; - conhecimento específico sobre crenças dos personagens; - conhecimento específico sobre as crenças dos falantes.
Neste capítulo explorar-se-á a questão da estrutura de discurso. Com intuito de realizar uma introdução a diferentes questões relativas ao processamento de discurso presentes na literatura, neste capítulo comentam-se a proposta de estrutura de discurso de Grosz e Sidner [Grosz 86] e uma reestruturação desta proposta, conduzida por Walker [Walker 98]. Em detalhe maior, apresentam-se aspectos relacionados a importância de uma descrição adequada da estrutura do discurso para a interpretação de referências anafóricas.
4.1
Conceitos básicos
4.1.1 Discurso
Em linhas gerais, discursos podem ser compreendidos como o resultado da produção lingüística de enunciados por escritores ou falantes, com a respectiva formação de textos escritos ou discursos falados. Entretanto, esta caracterização simples não fornece o detalhe suficiente sobre como discursos são estruturados. Na verdade, o que realmente parece necessário, é uma descrição de como um texto ou diálogo se estrutura e como determinados fenômenos discursivos poderiam ser analisados ou modelados.
Grosz, em [Grosz 86], conceitua um discurso como “um agrupamento de segmentos coerentes, onde cada segmento colabora para atingir o propósito global do discurso.”
4.1.2 Enunciado
Lyons, em [Lyons 81], página 157, afirma que “aqueles que distinguem sentenças e enunciados concordam de um modo geral que as primeiras, diferentemente dos últimos, são entidades abstratas independentes de contexto, no sentido de não estarem vinculadas a nenhum espaço ou tempo particular: elas são unidades do sistema lingüístico a que pertencem.” 9
4.1.3 Segmento
Um segmento é um agrupamento de enunciados.
Em [Allen 94] encontrou-se as seguintes definições para segmento : - é um trecho de um discurso no qual as sentenças estão falando
do mesmo tópico;
9 Uma discussão mais detalhada sobre significado de sentença e significado de enunciado pode ser encontrada em [Lyons 81]
26
- é uma seqüência de sentenças, possivelmente interrompidas por subsegmentos, cujo aspecto mais importante é exibir uma estrutura hierárquica.
4.2
Sobre a necessidade de uma descrição da estrutura do discurso
Segundo Allen, em [Allen 94], o estudo e descrição da estrutura do discurso pode oferecer diversas informações úteis no processamento de linguagem natural. O conhecimento desta estrutura e a identificação de mecanismos computacionais que possam ser usados para o seu reconhecimento e manipulação, pode ser importante na tarefa de segmentação do discurso, na identificação das intenções expressas em cada segmento do discurso e das relações intencionais entre estes segmentos, na interpretação de pronomes e elipses e no reconhecimento de aspectos temporais do discurso.
Segundo Passonneau e Litman, em [Passonneau 97], “A necessidade de modelar a relação entre estrutura do discurso e as características lingüísticas dos enunciados é quase universalmente reconhecida na literatura sobre discurso. Contudo, há fraco consenso sobre o que as unidades da estrutura do discurso são, ou critérios para reconhecê-las e gerá-las”.
4.2.1 Considerações de Passonneau e Litman sobre segmentação de discurso
Uma observação de diferentes pesquisadores é que discursos são compostos por segmentos. Em teorias sobre estruturação de discurso, como a de Grosz e Sidner e a de Walker, revisadas a seguir na seção 4.3, a questão da segmentação é tida como relevante, e uma segmentação adequada, pode auxiliar na correta interpretação de expressões anafóricas. Na teoria de Grosz e Sidner, por exemplo, as autoras argumentam que diferentes tipos de expressões anafóricas têm princípios de localidade
diferentes e, usualmente, o termo antecedente de pronomes ocorre dentro do mesmo segmento.
Tendo Passonneau e Litman, em [Passonneau 97], procedido uma revisão da literatura de lingüística computacional relativa à questão da segmentação de discursos, verificaram que muitas propostas ainda são baseadas em estudos bastante informais, sendo recentes as tentativas de avaliação quantitativa de como características de enunciados correlacionam-se com segmentação de discurso.
Partindo da hipótese que tecnologias de linguagem natural podem interpretar discurso mais sensivelmente, e podem gerar um discurso mais compreensível se obtiverem vantagem dessa ação combinada entre segmentação e dispositivos lingüísticos, as autoras conduziram um experimento sobre segmentação de discurso, com a finalidade de gerar uma proposta mais formal de como diferentes fenômenos, tais como Cue phrases, prosódia e referência nominal, restringem ou são restritos pela estrutura do discurso.
Primeiramente, realizaram um experimento com sujeitos humanos, no qual solicitaram que estes identificassem limites de segmentos. Avaliando os resultados verificaram um modelo extremamente significativo de concordância sobre limites de segmentos e concluíram ser possível executar segmentação do discurso confiável, usando a intenção do falante como critério.
Partindo de hipóteses pré-existentes na literatura, avaliaram diferentes dispositivos lingüísticos e verificaram que, com o uso de múltiplas fontes de conhecimento (sintagmas nominais referenciais, cue words e pausas), era possível chegar a uma performance semelhante à humana.
Para realização do experimento desenvolveram algoritmos usando cada tipo de dispositivo lingüístico em isolado, propondo e avaliando métodos para combiná-los.
28
O que define segmentos de discurso e que espécies de relações assinalar entre segmentos não são, contudo, questões fechadas. A natureza de qualquer interação entre a estrutura do discurso e dispositivos lingüísticos depende, segundo as autoras, do modelo de discurso que é adotado e dos tipos de dispositivos lingüísticos que são investigados.
No experimento realizado, as autoras não solicitaram a identificação de relações hierárquicas, tendo em vista ainda ser questionável a hipótese de que o discurso possui uma estrutura de árvore.
4.3
Estruturação do discurso: propostas e perspectivas
4.3.1 A proposta de Grosz e Sidner
Grosz e Sidner em [Grosz 86] propuseram uma teoria computacional que apresenta um conjunto de premissas para o processamento dos enunciados em um discurso. Nessa teoria, três estruturas distintas presentes em um discurso são descritas: a estrutura lingüística, o estado atencional e a estrutura intencional. Embora distintas, estas estruturas são inter-relacionadas e servem para coordenar o processamento do discurso.
As autoras argumentam que um bom modelo da estrutura do discurso deve dar conta de descrever diferentes fenômenos que ocorrem em discursos reais, como interrupções, explicação do uso de certos tipos de expressões de referência e de expressões que afetam a segmentação do discurso e estrutura.
De forma geral, os elementos básicos de cada uma dessas estruturas são:
• Estrutura lingüística: compõe-se de enunciados. Enunciados se agregam naturalmente e formam segmentos.
• Estrutura intencional: inclui os propósitos relevantes do discurso expressos em cada um de seus segmentos lingüísticos, bem como a relação entre esses propósitos.
• Estado atencional: contempla os objetos, propriedades e relações que são salientes em cada ponto do discurso. Registra, de forma abstrata, o foco de atenção dos participantes do discurso.
Particularmente importante para nós é a especificação do estado atencional, modelado nessa teoria como uma pilha, que determina a “saliência” das entidades num determinado ponto do discurso, afetando a interpretação de pronomes e outros termos referenciais.
4.3.1.1 Pespectivas computacionais
Nesta proposta, o estado atencional fornece os elementos necessários para usar as informações disponíveis nas outras estruturas na geração e interpretação de enunciados, armazenando informação de enunciados prévios, essencial para o processamento de enunciados subseqüentes.
A estrutura lingüística pode oferecer: (1) informações sobre a estrutura do discurso pelo emprego de expressões lingüísticas, (2) indicações (talvez parciais) dos limites dos segmentos, pelo uso explícito de certas palavras ou expressões ou, implicitamente, por meio de pistas mais sutis como entonação (em discursos falados) ou mudança de tempo e modo, e (3) por meio de marcadores lingüísticos, indícios de alterações no estado atencional ou na estrutura intencional.
Intenções estabelecem entre si certas relações estruturais que dão origem a uma representação interna da estrutura do discurso. Duas relações particularmente importantes, são: dominância e precedência de satisfação. Essas relações são assim conceituadas:
30
•Relação de dominância: quando um propósito PSD1 de um segmento
SD1 contribui para PSD2 de um segmento SD2 há uma relação de dominância entre intenções: PSD2 DOM PSD1 (PSD2 domina PSD1).
•Relação de precedência de satisfação: quando precisamos ter PSD1
satisfeito antes de PSD2 temos uma relação de precedência de satisfação: PSD1 PreSat PSD2. Esta segunda relação é particularmente importante para alguns tipos de discurso, como diálogos orientados a tarefa, onde a ordem em que um PSD é satisfeito pode ser relevante).
Na pilha que modela o estado atencional, espaços de foco são associados a cada segmento de discurso (SD). A figura 2, extraída de [Grosz 86], representa, de forma abstrata, a relação entre essas diferentes estruturas.
Figura 2: Estrutura de Focalização [Grosz 86]
O exemplo ilustra a pilha de espaços de foco quando o segmento de discurso SD3 está sendo processado. SD3 gera o espaço de foco EF3 que, além dos objetos, propriedades e relações que são salientes naquele segmento, contém também o
SD1 SD2 SD3 Propriedades Objetos Relações PSD3 EF3 Propriedades Objetos Relações PSD1 EF1
Segmentos de discurso Pilha dos espaços de foco Hierarquia de dominância
PSD1 DOM PSD3
PSD3. Devido à hierarquia de dominância entre propósitos de segmentos de discurso, o espaço de foco EF1 permanece na pilha, pois PSD1 domina PSD3. O espaço de foco gerado por SD2 foi retirado da pilha, dado que seu propósito PSD2 não domina PSD3.
Espaços de foco são colocados ou retirados da pilha atencional conforme informações disponíveis na estrutura lingüística ou na estrutura intencional.
O empilhamento dos espaços de foco reflete a saliência relativa das entidades dado um particular estado atencional.
Em vista da estrutura segmental proposta para discursos, Centering foi formulado como um modelo para ser aplicado em nível local, ou seja, dentro de segmentos. Sintagmas nominais completos e pronomes, segundo esta teoria, têm princípios de localidade diferentes.
Uma das funções da estrutura de focalização é restringir a busca a possíveis referentes de sintagmas nominais completos e pronomes.
4.3.2 A proposta de Walker
Walker, em [Walker 98], propõe a substituição da estrutura de pilha do estado atencional por um modelo de “cache”10. Este modelo descreveria, por diferenças na coerência, e na carga de inferência exigida de um leitor ou ouvinte em determinadas situações (quando um enunciado é hierarquicamente recente a outro, mas não linearmente recente), que não são capturadas pelo modelo de pilha do estado atencional.
Além disso, Walker propõe que a restrição de aplicar Centering somente dentro de segmentos deveria ser abandonada porque: (1) centros freqüentemente continuam além do limite de segmentos, (2) ouvintes percebem limites de segmentos em diferentes níveis de granularidade e (3) há fortes contrastes entre enunciados cujo
10
Uma cache é uma memória temporária usada para armazenar informação que está sendo usada correntemente por um processo computacional (apud [Walker 98])
32
enunciado prévio é linearmente recente e aqueles cujo enunciado prévio é hierarquicamente recente.
Walker afirma que, “da forma como a recentidade hierárquica é operacionalizada pelo modelo de pilha, não prediz quanto centros prévios são acessíveis” e argumenta que integrando Centering com um modelo de estrutura global do discurso, simultaneamente soluciona estes problemas pela substituição do modelo de pilha pelo modelo de cache.
Walker aponta que, no modelo integrado resultante:
• Centros são elementos da cache e o modelo de cache media a acessibilidade aos centros;
• Centros estão disponíveis além do limite de segmentos por default; • Dificuldades no processamento são previstas para a interpretação dos
centros cujos co-especificadores não são linearmente recentes;
• A granularidade da segmentação do discurso não tem efeito sobre o modelo.
No modelo proposto há dois tipos de memória: a memória principal, que representa a memória de longo prazo, e a cache que representa a memória de trabalho. “A memória principal é maior que a cache, mas é de acesso mais lento. A cache tem uma capacidade limitada, quase instantaneamente acessível”.
Walker assume as seguintes hipóteses para o modelo:
• tamanho da cache é limitado a duas ou três sentenças, ou aproximadamente sete proposições (segundo Walker, esta hipótese é baseada em descoberta de trabalhos prévios). A aplicação desta hipótese tem como resultado que “um enunciado Ei é linearmente
recente para um enunciado Ej quando ele ocorreu dentro dos últimos
• Itens da cache podem ser retidos ou fornecidos para a memória principal. Itens na memória principal também podem retornar para a cache.
• Quando a cache recebe itens da memória principal ou novos itens, outros são deslocados para a memória principal, dado que a cache tem capacidade limitada.
• A determinação de quais itens deslocar é dada por uma política de
substituição na cache.
Walker observa que “da forma como a recentidade hierárquica é operacionalizada pelo modelo de pilha, não prediz quanto centros prévios são acessíveis”.
Mostra este fato pelo contraste entre os exemplos detalhados a seguir:
([HPSOR (1) C:2N+DUU\(XWHQKRXPSUREOHPDTXHXKPLQKD²FRPDHFRQRPLDGHKRMHPLQKD ILOKDHVWiWUDEDOKDQGR (2) H: (XQmRFRQVHJXLRXYLUVHXQRPH (3) C: +DQN (4) H: 3URVVLJD+DQN (5) (a) C: EHPFRPRVHXXKPDULGR (b) (OHVWHPXPDFULDQoD (c) HHOHVWUD]HPDFULDQoDSDUDQyVWRGRGLDSDUDTXHFXLGHPRVGHOD ([HPSOR (1) C: 2N+DUU\(XWHQKRXPSUREOHPDTXHXKPLQKD²FRPDHFRQRPLDGHKRMHPLQKD ILOKDHVWiWUDEDOKDQGR (2) H: (XQmRFRQVHJXLRXYLUVHXQRPH
34 (3) C: +DQN H: 0HGHVFXOSHHXQmRSXGHRXYLUYRFr C: +DQN H: e+$1." C: 6LP. (4) H: 3URVVLJD+DQN (5) (a) C: EHPFRPRVHXXKPDULGR (b) (OHVWHPXPDFULDQoD (c) HHOHVWUD]HPDFULDQoDSDUDQyVWRGRGLDSDUDTXHFXLGHPRVGHOD
No exemplo 1, a expressão anafórica “seu marido”, é mais difícil de interpretar que em 2.
4.4
Considerações
Neste capítulo revisaram-se duas propostas de modelagem de discurso: uma de Grosz e Sidner, e outra de Walker. Em comum, as duas propostas têm o fato de contemplarem a questão da atualização de centros em discursos. No modelo de Grosz e Sidner, deve-se reconhecer interrupções e subsegmentos e gerenciar a acessibilidade das entidades mediante emprego de um mecanismo de pilha para o estado atencional. Mas, Walker argumenta que essa abordagem deveria ser abandonada, pois, quando ocorrem interrupções ou subsegmentos embutidos, a interpretação de expressões referenciais torna-se mais difícil, mesmo para seres humanos e, um modelo mais apropriado, em termos de coerência, seria o modelo de “cache”.
Controvérsias a parte, o que qualquer um dos modelos busca e que é relevante para o tratamento de pronomes, é saber quais entidades são salientes em diferentes pontos em um discurso. O modelo de Grosz e Sidner parece mais sofisticado, exigindo reconhecimento de intenções, relações e segmentos e estas são, ainda, questões
que não têm um tratamento completo (ou talvez, adequado) do ponto de vista computacional.
Passonneau e Litman ressaltam muito bem o quão incipientes são os dados e conclusões sobre como segmentar discursos e quais elementos avaliar para proceder essa segmentação.
No capítulo a seguir, é apresentada a teoria de Centering, cuja preocupação é, justamente, a dinâmica da saliência das entidades, quais recursos dos quais se servir para identificar essa saliência, e qual a maneira mais coerente de interpretar expressões anafóricas.
5
CENTERING: ESPECIFICAÇÃO DO MODELO E DIREÇÕES
DE PESQUISA
A revisão apresentada aqui tem por base a publicação da revista
Computational Linguistics de 1995 [Grosz 95], entretanto existem duas versões
anteriores não publicadas que circularam entre pesquisadores (uma de 1983 e uma de 1986) e que suscitaram o desenvolvimento de pesquisas relacionadas. O capítulo inicia evidenciando as questões básicas vinculadas a Centering para, mais adiante, apresentar estudos relacionados à teoria relatados em textos científicos.
5.1
A Teoria de Centering
5.1.1 Objetivo
Centering foi proposta como uma teoria para modelar a coerência local
de um discurso. Seus mentores argumentam que “diferenças na coerência, correspondem em parte a demandas de inferência feitas por diferentes tipos de expressões de referência, dado um particular estado atencional”. Em outras palavras, há uma relação entre (1) centro de atenção no discurso, (2) tipos de expressões de referência empregadas para retomar entidades mais centrais/menos centrais e (3) coerência percebida no discurso.
5.1.2 Modelo proposto pela teoria
Do ponto de vista estrutural, um segmento de discurso é composto por enunciados. Enunciados possuem “centros”, que são entidades que ligam um enunciado a outros enunciados no segmento que o contém. Os “centros” de um enunciado podem ser classificados em: (1) Backward-Looking Center e (2) Forward-Looking Centers (Cf).
O Backward-Looking Center (Cb) é uma entidade que estabelece uma ligação coerente com o enunciado prévio, sendo única para todo o enunciado que não
seja o primeiro de um segmento. Ao primeiro enunciado de um segmento, supõe-se não existir esta espécie de centro, dado que tal enunciado não estabelece um vínculo com um possível enunciado anterior, já que pertence a um segmento diferente.
Os Forward-Looking Centers (Cf) se apresentam na forma de um conjunto. Constituem um conjunto de entidades, ordenadas segundo algum critério de saliência, que fornecem possíveis ligações para o próximo enunciado. A entidade mais altamente classificada entre os Forward-Looking Centers, é o próximo centro
preferencial (Cp). Um critério usual para ordenação deste conjunto de entidades é a
função gramatical: sujeito>objeto>outras.
Considerando os centros assim conceituados, três diferentes tipos de relações são definidas para valer entre enunciados. Essas relações são expressas pelas transições center continuation, center retaining e center shifting, caracterizadas como:
• Center Continuation: o Cb de um enunciado En+1 é o mesmo que o Cb de En, e essa entidade é o elemento mais altamente classificado no
Cf do enunciado En+1;
• Center Retaining: o Cb do enunciado En+1 é o mesmo que o Cb de En,
mas essa entidade não é o elemento mais altamente classificado no Cf de En+1; e
• Center Shifting: o Cb de En+1 é diferente do Cb de En.
Além dos movimentos possíveis para centros, a teoria propõe também duas regras:
−Regra 1: Se qualquer elemento de Cf(En) é realizado por um pronome
em En+1, então o Cb(En+1) precisa ser realizado por um pronome
também.
−Regra 2: Seqüências de CONTINUE são preferidas sobre seqüências de RETAIN, que são preferidas sobre seqüências de SHIFT.