• Nenhum resultado encontrado

2.1 FrameNet

2.1.2 Tipos de anotação

Além do uso dessas relações entre frames, a FrameNet utiliza dois tipos de anotação: a de texto corrido e alexicográfica (RUPPENHOFER et al., 2010). A anotação de texto corrido é caracterizada por não possuir uma UL alvo definida a priori para a anotação, isto é, toda UL encontrada na sentença é anotada. A sentença (20) exemplifica esse tipo de anotação.

(20) Parque da Lajinha is a [greatEvaluation] [placePlace] [toPurpose] [walkSelf_motion]

[orAlternatives] [readReading_activity] a[bookText]21.

Na sentença (20), não há uma única unidade lexical alvo, ou seja, todas as unidades lexicais presentes na sentença tais como great.n, place.n, to.p, walk.v, read.ve book.n evocam diferentes frames e são correlacionados em uma única anotação. Casos como “a”e “Parque da Lajinha” não são anotados porque a FrameNet não considera em suas anotações artigose nomes próprios. A cópula também não é anotada como UL uma vez que o predicador é o nomeplace.

Diferentemente da anotação de texto corrido, a anotação lexicográfica baseia-se em uma única UL alvo, isto é, os frames selecionados para uma determinada sentença são aqueles evocados pela UL alvo. A Figura 18 apresenta um exemplo de anotação lexicográfica da FrameNet Berkeley.

Figura 18: Anotaçãolexicográfica da FrameNet Berkeley (RUPPENHOFER et al., 2010, p. 32)

Na Figura 18, a sentença “Anything that displeased her I did” (Qualquer coisa que desagradasse a ela eu fiz) é anotada lexicograficamente a partir da UL alvodisplease.v (desagradar.v). Através dessa UL, a anotação se dá em camadas, tais como FE (Frame Elements – Elementos de Frame), GF (Grammatical Function – Função Gramatical), PT (Phrase Type – Tipo Sintagmático) e Other (Outros). Embora o foco seja apresentar que a anotação lexicográfica se dá em camadas, é importante frisar que a anotação de texto corrido também utiliza as mesmas camadas. Em relação aos Elementos de Frame (EFs), como mencionado anteriormente, eles compõem a valência semântica do frame, já a Função Gramatical (FG) se relaciona à estrutura argumental da sentença, isto é, se a expressão linguística é um argumento externo (Ext), se é um Objeto (Obj), entre outras classificações. O Tipo Sintagmático (TS) está relacionado à natureza do sintagma a ser classificado, ou seja, se é um NP (Sintagma Nominal), um PP (Sintagma Preposicionado), entre outros. Na camada “Outros” serão marcadas quaisquer outras informações relacionadas à unidade lexical alvo, isto é, informações que não se adéquam às outras camadas como informações sobre cópula e verbos suporte (RUPPENHOFER et al., 2010).

Na Figura 18, o frame evocado pela UL displeased.v é Stimulate_emotion, dessa forma, na camada dos Elementos de Frame, as expressões “Anything” e o relativo “that” estão inseridas no EF de Stimulus (Estímulo), enquanto que “her” é marcada no EF de experenciador. Na camada da Função Gramatical, “Anything” e “that” são marcados como externos (Ext), ao passo que “her” é marcada como objeto (Obj). Em relação ao Tipo Sintagmático, todas as palavras são marcadas como NPs, uma vez que são sintagmas nominais. E, finalmente, na camada Outros, “Anything” é marcado como antecedente (Ant), e “that” é marcado como relativo (Rel).

Embora a anotação lexicográfica da FrameNet consiga, através de várias camadas de anotação e dos Elementos de Frame que compõem um evento, demonstrar e anotar sentenças de variadas naturezas, há sentenças que, por serem retiradas de diferentes tipos de texto, não apresentam todos os EFs ou são anafóricas. Para essas situações, a FrameNet utiliza a marcação de Instanciação Nula. A Instanciação Nula pode ser de três tipos: Instanciação Nula Construcional (CNI), Instanciação Nula Definida (DNI) e Instanciação Nula Indefinida (INI) (FILLMORE & BAKER, 2010).

A Instanciação Nula Construcional se refere àquelas construções em que expressões linguísticas não aparecem, uma vez que a sua ausência é intrínseca à

natureza dessas construções. Exemplos desse tipo de construção são os imperativos, como explicitado na sentença (21) e as passivas, exemplificada na sentença (22).

(21) Close thedoor. (22) The housewassold.

Na sentença (21), o sujeito é omitido, uma vez que a construção dos imperativos licencia essa ocorrência, sendo, portanto, uma CNI. Na sentença (22), informações como: quem vendeu a casa, para quem a casa foi vendida ou por quanto ela foi vendida não fazem parte, obrigatoriamente, da construção das passivas. Desse modo, assim como os imperativos, a construção licencia o não aparecimento dessas expressões linguísticas, sendo subentendidas.

A Instanciação Nula Definida (DNI) está relacionada à omissão de um determinado termo, no entanto, diferentemente da Instanciação Nula Construcional, em que a construção licencia esse processo, na DNI, mesmo a expressão linguística sendo omitida, é possível recuperá-la ao longo da leitura da sentença. A sentença (23) exemplifica a DNI.

(23) Lastweek I tookmyLinguisticsexam. I passed.

Na sentença (23), o objeto de pass.vestá elíptico, indicando um processo anafórico, isto é, retomando um tópico conversacional explorado anteriormente.

A Instanciação Nula Indefinida (INI) também indica um processo anafórico, entretanto, diferentemente da DNI, não é possível retomar o referente exato. As sentenças em (24) exemplificam essa instanciação.

(24) - Wouldyoulike some cake? - Thanks, I already ate.

No exemplo (24), não é possível retomar o referente do objeto elíptico de eat.v,isto é, não é possível saber o que o interlocutor comeu, mas, apenas, que ele já comeu algo. Dessa forma, o objeto após o verbo seria marcado como Instanciação Nula Indefinida.

Como é possível perceber, a FrameNet apresenta nuances importantes quanto à análise semântica e sintática, uma vez que procura detalhar e alcançar as

particularidades semânticas e sintáticas da língua. Diferentemente do PropBank e da AMR, a FrameNet é uma representação que não se limita à estrutura predicado- argumento, pois ela procura representar as variadas expressões linguísticas de modo detalhado, sem uma representação generalizante. Dessa forma, a FrameNet apresenta uma alta granularidade (BONIAL et al., 2014), isto é, apresenta uma análise mais detalhada, já que utiliza diversas camadas de análise, como as camadas de anotação – Elementos de Frame, Função Gramatical e Tipo Sintagmático –, algo distinto do formato mais generalizante do PropBank e da AMR com as estruturas de predicado- argumento.

Considerando esse processo, a FrameNet foi ampliada a partir de suas ramificações no mundo inteiro, as quais analisam as sentenças de diferentes línguas a partir da Semântica de Frames. Nesse contexto, projetos que integram a FrameNet podem ser citados, como o SALSA Project (BURCHARDT et al., 2006) que analisa textos em alemão, a partir dos frames da base de dados da FrameNet de Berkeley (FILLMORE & BAKER, 2010). Além do SALSA, outras ramificações analisam diferentes línguas, como o chinês, o japonês, o espanhol, o português brasileiro, entre outras. Nessa perspectiva, é importante ressaltar que o trabalho exposto nesta dissertação está inserido em uma dessas ramificações: a FrameNetBrasil.