CO~CA~AOCOORDENADA
PROCESSAMENTO SINrATICO E SEMANnCO: UMA TENrATWA PARA SfNrESE DAFALA
Edson Campos MAlA (UNICAMP)
ABSTRACT: This paper aims at investigating certain syntactic restrictions such as pronominal reference and C-command from a logic programming approach. A subset of Portuguese syntactic rules is implemented as a parser which assesses for the gramaticality of sentences towards the retrieval of their derivation path.
KEY WORDS: Parser, L6gic Programming, Anaphora and C-conunand.
Neste trabalho, desenvolve-se urn formalismo grarnatical para 0 tratarnento da referencia pronominal. An~ de apresenta-Io, convem salientar alguns pontos. Do ponto de vista da prograrn~iio 16gica, a lingUistica computacional tern um interesse tanto formal quanto utilitario. Do ponto de vista formal, explora a restrita linguagem 16gicadas clausulas de Horn, como urn metoda de expressar e representar as analises lingUisticas. Do ponto de vista utilitario, a linguagem de programaciio logica Prolog, cujo suporte te6rico e 0 formalismo das clausulas de Horn,
e
utilizada como uma ferramenta dos sistemas de process amen to de linguagem natural.No desenvolvimento deste estudo M a confluencia de duas vertentes te6ricas: a gramatica gerativa de Chomsky, e os formalismos computacionais desenvolvidos em Prolog.
Por urn lado, a gramatica gerativa constitui-se numa tentativa de formaliz~ao (tratamento matematico) dos fatos lingtifsticos, ou seja, urn tratamento precise e explfcito. Embasado nos sistemas formais da 16gica e na teoria matematica da recursiio, Chomsky elaborou um sistemas de regras e princfpios formalizados ou expIfcitos, significando que essas regras e princfpios so podern ser operados sob condicoes especificas, sendo automaticamente aplicados desde que satisfeitas essas condicoes; 0 efeito dessa aplicaciio das regras
e
a caracterizaciio da classe potencialmente infinita dassentencas de uma Hnguanatural, com a conseqi1enteatribuicao, a cada sentenca, de uma descricao estrutural que represente suas propriedades foneticas, sintaticas e semlinticas.
Por outro lado, urn dos alvos da 16gica simb6lica e 0 de capturar a nocao de consequencia 16gica como urn metodo formal (meclinico). Se as condicoes para uma certa classe de problemas pode ser formalizadas como urn conjunto de premissas, e se um problema para ser resolvido pode ser determinado como uma sentenca na l6gica, entao a soluCao pode ser encontrada pela construcao de uma prova formal deste problema atraves das premissas.
No caso lingUistico as premissas deveriam fornecer restricoes
a
classe de declaracoes gramaticais, e os problemas a serem resolvidos teriam a forma geral: "existe algum a, tal que a e urna analise da declaracao gramatical u". Uma prova construtiva desta declaracao nao mostraria somente que existe uma anaIise a, mas tambem encontraria os valores paraa.Um procedimento de prova construtiva que nao gere somente provas, mas tambem valores para as inc6gnitas no problema a ser resolvido, pode ser visto como urn dispositivo computacional para determinar estas incognitas. Nesta perspectiva, as premissas poder ser vistas como urn program a, 0problema como uma chamada no programa tendo certos valores de entrada e tendo como saida inc6gnitas, e urna prova como uma computaCao do programa. Esta
e
a intuicao basica que estcipor detrds da programacao l6gica , cujo desenvolvimento originou-se da exploraCao de urn compromisso razoavel entre as clausulas de Horn e sua implementacao parcial em Prolog, e a programacao 16gica tem investigado formalismos computacionais para expressar anaIises sintciticae semlintica de sentencas de linguagem naturalA implementacao computadonal do formalismo gramatical relativamente
a
referencia pronominal, sera feita na linguagem de programaciio logica Prolog, utilizando para esse fun , as gramaticas de cIausulas definidas CDCa) (PEREIRA (1980» e as gramaticas dejustaposiCao (PEREIRA (1981).A estrategia usada para analisar sentencas como I :
onde 0 pronome reflexivo tem que encontrar 0 seu correferente dentro da propria sentenca encaixada, e a de inserir no formalismo gramatical todas as restricoes que a teoria lingiifstica preve, que neste caso seria a de atribuir uma referenda a todo sintagma nominal (sn) e todo pronome (pr) que aparecer na sentenca a ser analisada, e ainda para 0dominio minimo de correferencia, (que seria a sentenca (s» atribuir uma marca indicativa de dominancia, a partir de urna restricao (emprestada de CARVALHO (1989» do tipo: '
Restri~iio R: uma categoria anaj6rica C (neste caso se), que
e
reflexiva, deve ser interpretada como co"ejerencial com, e somente com, uma categoria c-comandante K (neste caso Pedro), que estd dentro do domfnio m(nimo de correjerencia de C (neste caso a senten~a en.caixada Pedro se matou).Na restriciio acima foi mencionado a nocao de c-comando, para este caso no processo de derivacao da estrutura de arvore que Prolog fornece, sera atribuido a cada constituinte da sentenca uma marca de referencia , que servira para estabelecer a relaciio existente entre as regras do formalismo gramatical.
sera convertida pelo formalismo numa estrutura como arv(B,A,C), onde 0 primeiro
argumento do predicado arv esta relacionado ao sn,0segundo a s e0terceiro a sv. Este
predicado relaciona as regras constituintes do formalismo com a estrutura de derivacao do Prolog no sentido de resgatar a estrutura de more atribuida
a
sentenca, istoe,
uma regra como arv(B,A,C), deve ser entendida como: A se bifurcara nos ramos Ba
sua esquerda e Ca
sua direita.Uma regra como II, grosso modo, pode ser lida como:
Teremos uma senten~a (s), se tivermos um sintagma nominal (sn), seguido de um sintagma verbal ($V).
Um pequeno fragmento do formalismo gramatical para dar conta de I, poderia ser algocomo: S --> Is. S --> sn,sv. sn --> pn. sn --> cmp, s. sv --> pro, v. sv --> v, sn. sv --> v. pn --> (loao]. pn --> (Pedro]. cmp --> (que]. v --> [disse]. v --> [matou]. pro --> [se).
s(sn(pn(Joao», sv(v(disse», sn(cmp(que), s(sn(pn(Pedro», sv{pro(se), v(matou»») s(#O)(sn(O)(pn(O)(J 010(0»), sv(1 )(v(O)(disse(O»), sn(l)(cmp(O)(que(O», s(#1 )(sn(O)(pn(O)(Pedro(O»), sv(l){pro(O)(se(O», v(l )(matou(O»»»
Para 0 sintagma nominal (sn)Pedro e para 0pronome (pr)seseriam atribufdas as seguintes marcas de referencia:
que nada mais e do que 0 caminho percorrido na derivacao de arvore que Prolog fornece ao analisar uma sentenca.
Estas marc as de referencia permitem que no formalismo gramatical seja feito 0
controle de c-comando e restringe 0dominio minima de correferencia.
Convem salientar que 0programa desenvolve estruturas de armazenagem virtual, onde sac colocados os sintagmas nominais com suas referencias, para que os mesmos possam ser acessados (caso urn pronome seja encontrado no decorrer da analise de uma sentenca).
Ao analisar a sentenca I, sac armazenados os sintagmas nominais Joao(#O 000) e
Pedro(#O 1 1 #1 0 0 0), com suas respectivas referencias. No decorrer da analise ao encontrar 0 pronome serIO 1 1 #1 1 00), 0 programa faz uma busca na estrutura de armazenagem por urn sintagma nominal, e testa a restricao Rpara ver se0mesmo serve como correferente do pronome se.
a
teste se da da seguinte forma: suponha que 0sintagma nominal Jotio(#O 000), seja 0 primeiro a ser retirado da estrutura de armazenagem, a ideia e encontrar 0 primeiro nodulo que se bifurca no sintagma nominal, no caso #0, ever se ele domina 0 pronome. Esta restricao e satisfeita se0pronome contem #0 na mesma posiCao em que o sintagma nominal con tern #0, e 0 pronome nao pode ter a mesma estrutura derivacional do sintagma nominal, a partir do nodulo que se bifurca. Como isso ocorre, o proximo teste ever se 0 sintagma nominal esta dentro do dominie minimo de referencia do pronome. Esta restricao e satisfeita ao encontrar a primeira marca de dominancia no pronome, neste caso #1, e testar para ver se0sintagma nominal tern nasua estrutura de deriva~ao a mesma do pronome, ate a sua marca de dominancia, neste casoserIO 1 1 #1); como isso nao ocorre,0 sintagma nominal folio
e
rejeitado comocorreferente do pronomese.
o
programa entao, faz uma nova busca na estrutura de armazenagem, para urn outro sintagma nominal, encontrando desta vez Pedro(#O 1 1 #1 0 0 0) 0 quale
resgatado com sua referencia. Passa enmo, a testar a restricaoR. 0 primeiro n6dulo que se bifurca emPedro
e
#1 - basta ver se ele domina0pronome se. Isto se da, visto que0pronome se contem em sua estrutura derivacional #1 na mesma posicao que0sintagma
nominal contem #1, eo pronome nao tern a mesmo estrutura do sintagma nominal, a partir do n6dulo que se ramifica. 0 proximo passo enmo,
e
verificar se 0 sintagmanominal esta dentro do dominio minima de referencia do pronome; para que isto ocorra basta encontrar a primeira marca de dominancia no pronome, neste caso#1,e verificar se0sintagma nominal tem na sua estrutura derivacional a mesma do pronome ate a sua
marca de dominancia. Como isso ocorreu, dizemos que a anatise obteve sucesso e 0
sintagma nominal Pedro
e
atribufdo ao pronome se como seu correferente.CARVAIlIO, A. M. B. R., (1989) Logic Gramma" and Pronominal Anaphora.PHD Thesis. University of Reading.
PERIDRA, P. C. N., (1981) Extraposition Gramma". American Journal of Computational Iinguiistics, vol. VII, n°.4,pp.243 - 256.
PEREIRA, F. C. N., WARREN, D. H. D., (1980) Defmite C/Quse Grammars for lAnguage Analysis, Artificial Inteligence,vol mI,pp. 231 - 278.