• Nenhum resultado encontrado

3. METODOLOGIA DE PESQUISA

3.3 Procedimentos adotados para a análise dos dados

3.3.2 Análise da associação semântica

O estudo da associação semântica de estruturas sintagmáticas tem uma grande representatividade na análise de palavras que coocorrem com certa frequência, como é o caso do objeto de pesquisa deste trabalho, uma vez que essa característica da língua pode fornecer generalizações e refletir um tipo regular de agrupamento lexical.

A associação semântica existe quando uma palavra ou sequência de palavras é associada na mente de um usuário da língua por um conjunto semântico ou classe (HOEY, 2005, p. 24). Para Hoey (2005), existem informações sobre a maneira como as estruturas sintagmáticas são construídas que podem ser explicadas levando em consideração a associação semântica desses itens lexicais e não apenas a colocação como um arranjo de palavras.

Ao analisar a associação semântica de uma única palavra, o substantivo ’consequence’ (consequência), Hoey (2005) identificou que a palavra “consequência” no sentido de “result” (resultado), em oposição ao sentido de “significance” (sentido), tem “preferência semântica”, no que diz respeito ao ato de se associar com outro item lexical. Com ajuda de uma ferramenta eletrônica de concordância para análise do corpus de pesquisa, composto por textos do jornal The Guardian, foram encontrados 456 exemplos em que a palavra “consequência” era modificada por um adjetivo. Ao fazer a classificação desses adjetivos, do ponto de vista semântico, o pesquisador verificou que 59% dos adjetivos que modificavam a palavra “consequence” representava uma classe de adjetivos que faziam alusão à lógica subjacente ao processo em que “consequência” era descrito. Como exemplo, no corpus analisado, a palavra “consequence” foi pré-modificada por três adjetivos: logical (lógica), ineluctable (inelutável) e direct (direta). Considerando o contexto em que apareceram, esses adjetivos faziam menção à lógica implícita no processo ao qual “consequência” estava sendo descrita e, por este motivo, são chamados de (adjetivos de ‘lógica’), “logic’ adjetives”. Vejamos o exemplo dado por Hoey (2005, p.25):

Mr Haughey’s support for liberal reform is a direct consequence of the election of President Mary Robinson last November.

Na ocorrência acima, temos a associação de “consequence” com o adjetivo “direct”, e esse adjetivo, que está modificando o substantivo, faz alusão a um processo lógico, em que o apoio de Mr Haughey para a reforma liberal é uma consequência evidente e clara das eleições da presidente Mary Robinson.

A análise de Hoey (2005) demonstrou que a análise da associação semântica da palavra “consequence” pode oferecer informações sobre a “preferência semântica” da palavra.

Contudo, em nosso corpus, para proceder com a análise semântica, tivemos que fazer uma adaptação do modo como o pesquisador mencionado fez sua análise.

Primeiro, diferentemente de Hoey (2005), que utilizou uma ferramenta eletrônica de concordância para identificar a associação semântica da palavra “consequence”, selecionamos composições sintagmáticas em que pelo menos um de seus itens era produtivo. Consideramos uma unidade lexical produtiva aquela que formou, pelo menos, quatro composições

sintagmáticas. Por exemplo, a unidade lexical ‘sensor’ se associou a outros substantivos para formar várias composições. Logo, essas composições foram objeto de análise em nossa pesquisa para a identificação de um possível padrão de associação semântico.

O critério de selecionar composições formadas por uma unidade lexical produtiva deu- se pelo fato de o nosso corpus de composição já ser constituído, ou seja, não era necessário utilizar de nenhuma ferramenta para identificar grupos lexicais, como realizado na pesquisa que serve de base para este trabalho.

Em seguida, ao selecionarmos composições sintagmáticas com itens lexicais produtivos, realizamos uma análise da associação semântica dos itens lexicais da composição com o intuito de verificar se existe algum padrão sobre a “preferência semântica” do componente da composição que se mostrou produtivo.

Para o procedimento de análise das composições sintagmáticas, considerando os principais campos semânticos e subcategorias, adotamos um sistema de categorias (etiquetador semântico) chamado USAS (UCREL sistema de análise semântica) (ACHER; WILSON; RAYSON, 2002) adaptado por um recurso chamado O Léxico semântico de Lancaster (PIAO, ARCHER et al., 2005) utilizado para mapear o potencial semântico dos modelos de multipalavras (multiword expression – MWE).

O léxico semântico de Lancaster (PIAO et al., 2005) se destaca quanto à analise semântica de coocorrências lexicais, que é âmbito de estudo deste trabalho. Trata-se de uma classificação semântica que consiste em um conjunto de classes semânticas organizadas como um thesaurus. Desta forma, o léxico semântico de Lancaster (PIAO et al., 2005) consiste em uma proposta de análise de conteúdo e, por esse motivo, oferece uma concepção de mundo geral.

Segundo Abalada, Cabarrão e Cardoso (2010) existem duas vantagens importantes de se utilizar o léxico semântico de Lancaster (PIAO et al., 2005) para o tratamento semântico do léxico. A primeira vantagem está no fato desse material linguístico ser organizado por campos semânticos, divididos em classes e subclasses, e não por relações entre palavra e significado. Essa organização, segundo as pesquisadoras mencionadas, garante uma homogeneidade às classes, já que o material linguístico mantém entre si relações semânticas de sinonímia, antonímia, hiperonímia, hiponímia, holonímia e meronímia (ABALADA et al., 2010).

Outra vantagem apontada por Abalada et al. (2010) está relacionada ao fato de o léxico semântico de Lancaster (PIAO et al., 2005) ser uma classificação que permite a aplicação tanto em corpora mais abrangentes, quanto mais específicos, o que não seria possível com uma taxonomia para domínios específicos. Desta forma, seria possível a aplicação dessa classificação em palavras pertencentes a um domínio específico, como uma área científica, a partir de informações de apenas uma classe.

Atualmente o sistema de classificação semântica, o léxico semântico de Lancaster, é composto por 21 classes (campos semânticos) (FIGURA 3) e 232 subcategorias. Vejamos os exemplos dos 21 campos semânticos.

FIGURA 3: Os campos semânticos

Fonte: (PIAO et al., 2005)

Apresentamos também o exemplo de algumas das 232 subcategorias (FIGURA 4). Nesse caso temos subcategorias que foram criadas a partir da classe F: food and farming (alimentos e agricultura):

FIGURA 4: As subcategorias dos campos semânticos

Fonte: (PIAO et al., 2005)

Definidos os pressupostos da classificação, aplicou-se a classificação semântica a um grupo de composição sintagmática em que, pelo menos, um componente era produtivo, ou seja, se repetia.

A aplicação foi feita por meio de uma etiquetagem manual aos grupos de composição sintagmática, de modo a identificar a classe semântica dos componentes do item lexical e verificar o padrão semântico dessas ocorrências dentro de uma área de especialidade.

3.3.3 Análise do aspecto colocacional das composições sintagmáticas

A maneira como as palavras se agrupam dentro de um discurso pode refletir um tipo de priming colocacional que, por sua vez, pode refletir um padrão de uso de uma palavra ou sequência de palavras em um determinado contexto. Hoey (2005), por exemplo, constatou que a palavra “winter” se coloca com a preposição “in”. Logo, o pesquisador concluiu que “in

winter” forma um priming colocacional dentro de um contexto e esse padrão de uso da palavra "winter” é uma informação importante sobre o uso das palavras em contexto.

Com o objetivo de evidenciar o priming colocacional das composições sintagmáticas dentro do discurso publicitário, fizemos a leitura exaustiva dos textos publicitários que compõem nosso corpus a fim de identificar características semelhantes quanto ao agrupamento de composições sintagmáticas com ‘preposições’, ‘artigos’, etc. Como conhecemos e manuseamos o corpus com grande frequência, não utilizamos ferramentas específicas pela busca de colocações das unidades analisadas. Utilizamos apenas ferramentas como o localizar, o que serviu para potencializar a pesquisa.

Ao identificar um priming colocacional e testar a confiabilidade dos dados encontrados, utilizamos o Google para buscar pelas composições sintagmáticas que se colocavam com preposições, para verificar que se tratava de um priming colocacional ou se a motivação para tal agrupamento teria outras razões. Desta forma, procedemos com a busca de algumas composições em contextos publicitários, porém precedidas de outras unidades lexicais.

Em outra análise, ainda sobre a aspecto colocacional, buscamos evidenciar o priming colocacional textual das composições dentro do contexto publicitário. Hoey (2005) identificou que algumas palavras ou sequência de palavras estão preparadas para aparecerem em correntes coesivas, ou seja, fazerem ligações através de expressões semanticamente relacionadas à palavra ou à sequência fonte.

Dessa forma, a partir da leitura dos textos publicitários, buscamos identificar as composições que formavam uma corrente coesiva. Como estamos lidando com textos publicitários, que normalmente, possuem um tamanho reduzido, esperamos encontrar composições sintagmáticas na formação de pequenas correntes coesivas.