• Nenhum resultado encontrado

2. METODOLOGIA E EXTRAÇÃO DOS DADOS

2.2. Extração dos dados e formação do corpus de estudo

O segundo passo para a análise dos usos de stellen, após a verificação dos sentidos do verbo nos dicionários, concentrou-se naa elaboração de um corpus de estudo monolíngue em alemão, a partir de excertos de textos presentes no banco de dados COSMAS II, do Institut für Deutsche Sprache (IDS), da Universidade de Mannheim. A opção pela elaboração de um corpus de estudo com base nesses textos se justifica pelo fato de se acreditar que o exame de exemplos reais da interação entre os falantes pode trazer maiores contribuições para o mapeamento de usos do verbo.

O banco de dados COSMAS II dá acesso ao Deutsche Referenzkorpus (DeReKo), que é considerado um corpus em constante expansão, mantido pela Universidade de Mannheim desde 1964 e organizado em diferentes coleções de corpora – os chamados “Archive”. O corpus escolhido para a extração dos dados foi o “Wikipedia Artikel und Diskussionen”, um corpus virtual do COSMAS II. Segundo a organização do banco de dados, os arquivos (Archive) possuem corpora virtuais, que constituem um recorte dos textos presentes na coleção de corpora.

O corpus Wikipedia Artikel und Diskussionen é composto por artigos publicados no site Wikipédia e por discussões entre os autores cadastradosque podem opinar sobre a veracidade das informações inseridas nos artigos. Como o objetivo da presente pesquisa se centra em uma análise baseada nos usos da língua, acredita-se que a escolha por esse corpus traz como vantagem o fato de que, muito provavelmente, a linguagem utilizada pelos indivíduos abrangerá dois registros distintos: um mais formal, utilizado nos artigos, e outro não muito elaborado, com elementos que o aproximam da língua falada, presente nas discussões.

O procedimento adotado consistiu na busca pela forma lematizada do verbo: na tela inicial, optou-se pela busca “Lemma”, como se observa nas figuras a seguir, a fim de se ter acesso a todas as formas morfológicas do verbo.

Tendo em mãos a lista de palavras composta por todas as formas lematizadas do verbo stellen, foi feita uma primeira desambiguação do verbo e do substantivo Stelle na sua forma conjugada, na opção “Suchbegriff-Expansionslisten”:

Figura 4 Busca pela forma lematizada do verbo no Cosmas II

O próximo passo foi trabalhar com os dados em KWIC (Key Words in Context), ou seja, em linhas de concordância, a partir da própria função disponibilizada pelo COSMAS II. Tendo em vista que os resultados obtidos no arquivo “Wikipedia Artikel und Diskussionen” totalizaram 467.224 ocorrências, fez-se necessário realizar um recorte no corpus, para que os dados pudessem ser analisados em tempo viável. Assim, optamos por organizar as ocorrências de forma aleatória, como uma tentativa de contemplar a totalidade do corpus, a partir de amostras distintas.

Além das linhas de concordância, trabalhou-se com os parágrafos em que os resultados ocorrem, os chamados “Belege”. Os dados gerados a partir da organização em forma aleatória foram exportados para a constituição do corpus de estudo. Como o COSMAS II possui um limite de 10 mil ocorrências para a exportação decidimos inicialmente trabalhar com esses dados.

No processo de organização do corpus de estudo, foi ainda necessário descartar manualmente ocorrências de verbos separáveis. A partir das ocorrências restantes foi montado o corpus de estudo, que é composto por 36.653 palavras. Para a análise dos dados, fizemos um recorte que consiste em ocorrências formadas pelo verbo stellen como verbo pleno e por contextos em que ele funciona como verbo-suporte. Casos em que o verbo ocorre na sua forma nominal, ou seja, como particípio com função de adjetivo ou de advérbio, não foram enfocados. Além disso, foram contemplados outros fraseologismos que se encontram nas fronteiras com as CVS, como colocações verbais e expressões metafóricas.

O corpus de estudo pode ser considerado um corpus pequeno, contudo acreditamos que ele seja adequado para uma análise qualitativa. O fato de dados estatísticos não serem contemplados na presente pesquisa não impede que apontamentos acerca da frequência de ocorrências no corpus sejam feitos, todavia eles não serão a base para as conclusões sobre do uso do verbo stellen.

Comparando as acepções presentes nos dicionários com os dados obtidos no corpus, observa-se que as acepções 8, 9, 13,16, e 21 não foram encontradas no corpus formado a partir dos textos fornecidos pelo Cosmas II. Algumas hipóteses podem ser formuladas para explicar esse fenômeno, como por exemplo, o tamanho do corpus e o fato de que, durante a extração dos dados, não buscamos encontrar exemplos específicos, mas trabalhamos com dados que foram fornecidos pelo COSMAS II. Além disso, seria ainda possível argumentar, que as acepções não encontradas no corpus podem indicar a sua baixa frequência de uso, o que somente uma análise quantitativa, que não consta nos nossos objetivos, poderima confirmar. No que diz respeito às acepções que não foram encontradas no corpus, mas que julgamos ser

relevantes para a análise, cabe citar que optamos por procurar especificamente por esses exemplos na Web, a partir da ferramenta de busca Google.

No que diz respeito aos exemplos específicos de CVS, verificamos que as CVS encontradas no nosso corpus estão de acordo com as listas propostas apresentadas por Helbig e Buscha (2001) e Kamber (2008), como se observa na tabela a seguir:

CVS Helbig e Buscha (2001) Kamber (2008) Corpus In Abrede stellen X X Ansprüche stellen X X Einen/den Antrag stellen X X X In Aussicht stellen X X X Unter Beobachtung stellen X X In js. Belieben stellen X

Unter Beweis stellen X X

Zur Debatte stellen X

In Dienst stellen X X

Eine Frage stellen X X X

In Frage stellen X X X

Zur Schau stellen X X

In Rechnung stellen X X X

Vor Gericht stellen X X

Unter Schutz stellen X X

Auf den Kopf stellen X X

Zur Verfügung stellen X X X

zur Eröterung stellen X X

Die/eine Forderung stellen

X X

unter Strafe stellen X X

Diagnose stellen X

As únicas CVS que não foram encontradas no corpus são in js Belieben stellen e zur Debatte stellen. Embora a CVS zur Debatte stellen não tenha sido encontrada no corpus, a CVS zur Diskussion stellen, cujo significado é muito semelhante ao daquela construção, é recorrente no corpus, mas não consta nas listas apresentadas pelos autores.

Embora reconheçamos que o nosso corpus não apresente todas as acepções presentes nos dicionários consultados e também não contenha contextos de usos para todas as CVS contidas nas listas de Helbig e Buscha (2001) e Kamber (2008), acreditamos que a sua utilização combinada às informações dispostas nas listas de CVS e às acepções dos dicionários nos permite trabalhar com dados que fornecem uma ampla perspectiva de usos do verbo stellen.

Por fim, cabe ainda citar que para análise foram escolhidos os exemplos mais prototípicos que revelam aspectos relevantes, sendo os demais exemplos dispostos nos Anexos da presente pesquisa. Em um primeiro momento, testamos a possiblidade de trabalhar os dados obtidos em linhas de concordância, porém, nos deparamos com uma dificuldade em se alinhar orações distintas, em razão da ordem sintática dos elementos em alemão, já que o verbo pode assumir posições distintas em orações subordinadas, orações nas vozes ativa e passiva etc. Por esse motivo, não se mostrou viável trabalhar com os dados em linhas de concordância, fazendo- necessária a leitura de períodos completos para a compreensão do sentido da construção.