O trabalho de anotação realizado no projeto FrameNet é realizado através da divisao da sentença em segmentos. Como um dos propósitos da anotação é associar os valentes sintáticos de uma Unidade Lexical com seus valentes semânticos, mesmo os marcadores sintáticos e morfológicos dos sintagmas relevantes são incluídos nos segmentos (FILLMORE, 2008). Para cada segmento são registradas diversas informações, organizadas em camadas. As camadas mais usadas no processo de anotação são: Target (que indica a Unidade Lexical sob análise), Elemento de Frame (que indica qual o elemento de Frame associado com o segmento), Função Gramatical (FG) e Tipo Sintagmático (TS). Esta organização permite registrar as diversas possibilidades combinatórias da interface sintaxe-semântica (valências).
Como o foco deste trabalho é a desambiguação das Unidades Lexicais (no caso, as unidades lexicais associadas a <abrir.v>), e como para este processo estão sendo usados os núcleos dos sintagmas (sem os marcadores sintáticos e morfológicos), não julgamos relevante, a princípio, a anotação do Tipo Sintagmático dos segmentos. Desta forma, sao considerado apenas o Target (a própria Unidade Lexical analisada), os Elementos de Frame (de cada Frame) e as Funções Gramaticais associadas a cada Elemento de Frame.
Para a FrameNet, as Funções Gramaticais assinaladas para cada constituinte (segmento) descrevem as maneiras pelas quais estes constituintes satisfazem os requisitos gramaticais abstratos de cada Unidade Lexical Ruppenhofer et al. (2010, p. 63). As etiquetas usadas para as funções gramaticais não descrevem as posições sintáticas de superfície de cada constituinte. Por exemplo, na sentença (9.2) [o doutor] é considerado o argumento externo de <tratar.v>, mesmo não sendo o sujeito da sentença.
(9.2) As circunstâncias forçaram [o doutor] a tratar seus inimigos.
no Projeto FrameNet Brasil (SALOMÃO, 2009), descritas em Torrent e Ellsworth (2013): Argumento Externo (Ext), Objeto Direto (DObj), Objeto Indireto (IObj) e Dependente (Dep).
9.4.1
Argumento Externo
Quando a Unidade Lexical alvo é um verbo, a etiqueta External (Ext) cobre as situações em que sintagmas que estão fora da projeção máxima da palavra alvo estão ligados funcionalmente aquela palavra alvo. Isto inclui tudo que satisfaça os requisitos de um Elemento de Frame nos seguintes contextos sintáticos:
a) como sujeito de um verbo alvo finito; (9.3) [Maria] comprou frutas.
b) como sujeito alçado;
(9.4) [Maria] podia comprar frutas.
c) como expressões controlando sujeitos de verbos no infinitivo; (9.5) Antônio viu [Maria] comprar frutas.
d) como argumento de um substantivo regente um verbo no infinitivo. (9.6) Eu admiro a disposição [de Maria] para ajudar os amigos.
Quando a Unidade Lexical alvo é um adjetivo, a tag Ext é assinalada para o Elemento de Frame expresso como o sujeito de um verbo de ligação (9.7)a, ou como objeto em um predicado verbo-nominal (9.7)b.
(9.7) (a) [Maria] é alta.
(b) Antônio acha [Maria] bonita.
9.4.2
Objeto Direto
A etiqueta de objeto direto (DObj) é atribuída para os mesmos casos definidos pelo Projeto FrameNet:
a) qualquer objeto comum do verbo; (9.8) Maria comprou [frutas].
b) objetos extraídos das construções QU-;
(9.9) (9) [O que] Maria comprou? (9.10) Maria viu-[nos] comprar frutas. (9.11) (a) Maria sabe [comprar frutas].
(b) Maria sabe [que voce adora frutas].
d) Além destes casos, são incluidos também os objetos oracionais finitos (9.11)(a) e infinitivos (9.11)(b).
Em geral, no entanto, a etiqueta não é atribuída a dependentes do verbo que não possam ocorrer como sujeitos em uma construção passiva.
9.4.3
Objeto Indireto
Segundo Castilho (2010), o Português Brasileiro possui dois tipos de complementos preposicionais seguindo o verbo: objetos indiretos e oblíquos. Estas expressões são sempre preposicionadas e, portanto, é necessário distinguir seu uso. As principais diferenças entre elas seriam:
a) Objetos indiretos são proporcionais aos pronomes dativos (me, te, lhe), enquanto oblíquos não;
b) Objetos indiretos são preenchidos exclusivamente por sintagma preposicionado nucleado por "a" e "para", enquanto oblíquos podem ocorrem com outras prepo- sições;
c) Objetos indiretos podem coocorrer juntamente com o objeto direto, enquanto oblíquos tendem a ser o único argumento interno do verbo;
Além disso a construção em que figuram os objetos indiretos não é conversível à voz passiva.
A etiqueta IObj é aplicada exclusivamente para objetos indiretos, como nas senten- ças em (9.12), enquanto os complementos oblíquos são associados a função Dependente.
(9.12) (a) Maria deu um livro [para mim]. (b) Maria [me] deu um livro.
(c) Maria deu um livro [para João] ler.
9.4.4
Dependente
A etiqueta genérica Dependente (Dep) é atribuída a todos os argumentos verbais não cobertos por Ext, Dobj ou IObj. Isto inclui advérbios, sintagmas preposicionados, sintagmas verbais e orações que ocorram depois de seus verbos, adjetivos ou nomes regentes, em sentenças declarativas normais, além dos complementos oblíquos. Esta etiqueta inclui
tanto o que é referenciado comumente como "argumentos" quanto o que é referenciado como "adjunto". No esquema de anotação da FrameNet, esta distinção é capturada via o status de Coreness do Elemento de Frame.
9.5
Valências
Usando a terminologia da FrameNet (FILLMORE, 2008), uma Unidade Lexical evoca um Frame e uma "descrição de valência" de uma dada Unidade Lexical apresenta o conjunto de maneiras pelas quais os acompanhantes sintáticos da Unidade Lexical introduzem informação sobre os elementos significantes do Frame evocado. Dito de outra forma, a "descrição de valência" mostra a associação dos Elementos de Frame s, com as Funções
Gramaticais e com os Tipos Sintagmáticos.
As tabelas a seguir mostram as valências que foram utilizadas neste trabalho, em relação às Unidades Lexicais e Frames descritos na seção 9.3. Esta descrição é reconheci- damente incompleta, uma vez que ela é derivada da análise de algumas poucas dezenas de sentenças em corpus e de algumas sentenças contruídas. Além disso, de maneira geral foram considerados apenas os Elementos de Frame nucleares. Para simplificar a represen- tação, as valências que se diferenciam apenas pela variação de Elementos de Frame s do mesmo CoreSet foram agrupadas em uma mesma linha. Por exemplo, o CoreSet (Agente, Causa, Instrumento) com a função gramatical "Argumento Externo" é representado como [Agente|Causa|Instrumento].ext. Para a implementação no framework LUDI, no entanto, cada valência é considerada individualmente.
9.5.1
Corpo físico
Frame II.1 - Movimento_corporal_causativo
UL: <abrir.v>
V1 [Agente|Causa|Instrumento].ext, Parte_corporal.dobj, Experenciador.dep
UL: <abertura.n>
V1 [Agente|Causa|Instrumento].ext, Parte_corporal.dep, Experenciador.dep
Frame II.2 - Movimento_corporal_incoativo
UL: <abrir.v>
Frame II.3 - Movimento_corporal_estativo
UL: <aberto.a>
V1 Parte_corporal.ext, Experenciador.dep
9.5.2
Entidades Físicas
Frame III.1 - Abrir_físico_causativo
UL: <abrir.v>
V1 [Agente|Causa|Instrumento].ext, [Conteiner|Portal].dobj, [Conteudo|Interior|Exterior|Fronteira].dep
V2 [Agente|Causa|Instrumento].ext, Portal.dobj, Conteiner.dep, [Conteudo|Interior|Exterior|Fronteira].dep
UL: <abertura.n>
V1 [Agente|Causa|Instrumento].ext, [Conteiner|Portal].dep, [Conteudo|Interior|Exterior|Fronteira].dep
Frame III.2 - Abrir_físico_incoativo
UL: <abrir.v>
V1 [Conteiner|Portal].ext, [Conteudo|Interior|Exterior|Fronteira].dep V2 Conteiner.ext, Portal.dep, [Conteudo|Interior|Exterior|Fronteira].dep V3 Conteiner.dep, Portal.ext, [Conteudo|Interior|Exterior|Fronteira].dep
Frame III.3 - Abrir_físico_estativo
UL: <aberto.a>
V1 [Conteiner|Portal].ext, [Conteudo|Interior|Exterior|Fronteira].dep V2 Conteiner.ext, Portal.dep, [Conteudo|Interior|Exterior|Fronteira].dep V3 Conteiner.dep, Portal.ext, [Conteudo|Interior|Exterior|Fronteira].dep
9.5.3
Aspecto
Frame IV.1 - Iniciar_evento_causativo
UL: <abrir.v>
V1 [Agente|Causa|Instrumento|Evento_inicial].ext, [Evento|Entidade].dobj
UL: <abertura.v>
V1 [Agente|Causa|Instrumento|Evento_inicial].ext, [Evento|Entidade].dobj
Frame IV.2 - Iniciar_evento_incoativo
UL: <abrir.v>
V1 [Evento|Entidade].ext, Tempo.dep
Frame IV.3 - Iniciar_evento_estativo
UL: <aberto.v>
V1 [Evento|Entidade].ext
Frame IV.4 - Estado_de_segredos
UL: <aberto.a>
V1 Fenômeno.ext, Conhecedor.dep
9.5.4
Modalidade
Frame V.1 - Possibilitar_evento_causativo
UL: <abrir.v>
V1 [Agente|Causa|Instrumento|Evento_inicial].ext, Meio.dobj, Evento.iobj
Frame V.2 - Possibilitar_evento_incoativo
UL: <abrir.v>
Frame V.3 - Possibilitar_evento_estativo
UL: <aberto.a>
V1 Meio.ext, Evento.iobj
9.5.5
Estado Mental, Emocional ou Psicológico
Frame VI.1 - Mudança_mental_causativo
UL: <abrir.v>
V1 [Agente|Causa|Instrumento].ext, Parte_corporal.dobj, Evento.iobj, Experencia- dor.dep
Frame VI.2 - Mudança_mental_incoativo
UL: <abrir.v>
V1 Parte_corporal.ext, Evento.iobj, Experenciador.dep
Frame VI.3 - Mudança_mental_estativo
UL: <aberto.a>
V1 Parte_corporal.ext, Evento.iobj, Experenciador.dep
Frame VI.4 - Abrir_ceder
UL: <abrir_mão.v>
V1 Capitulador.ext, [Força|Questao].iobj
VI.5 - Abrir_mental_estativo
UL: <aberto.a>
10 A desambiguação de <abrir.v> usando
LUDI
Este capítulo apresenta os resultados da aplicação do Framework LUDI para desambiguação de sentenças com o verbo <abrir.v>. A escolha das sentenças (coletadas em corpus ou construídas) se deu tanto pela sua potencial ambiguidade na interpretação (por máquina), quanto pela condição de prototipicalidade em relação aos Frames definidos no capítulo 9. O objetivo é avaliar a eficácia dos algoritmos utilizados, bem como levantar os pontos que ainda necessitam de correções ou merecem alguma melhoria.
Cada experimento é indicado pela expressão "abrir_x", onde "x" é uma entidade ou evento relacionado. Para cada experimento são apresentados:
a) A motivação da escolha da expressão usada;
b) A sentença e os segmentos usados como entrada para os algoritmos (juntamente com as funções gramaticais);
c) O grafo que representa o resultado da aplicação do modelo conexionista estru- turado. Embora, somente pelo grafo, não seja possível visualizar as diversas etapas da aplicação dos algoritmos, ele mostra a inferência final realizada. d) Comentários sobre o resultado obtido.