• Nenhum resultado encontrado

ANÁLISE E PARÂMETROS DE CONSTRUÇÃO DOS CORPORA

MAIS RELAÇÕES

5.2 ANÁLISE E PARÂMETROS DE CONSTRUÇÃO DOS CORPORA

Apresentamos na Tabela abaixo o número dos textos utilizados, das fontes, das palavras totais que constituem os corpora e o dos termos extraídos: Número de textos Número de fontes Número de palavras Número de termos corpus italiano 5 5 79.140 100 corpus português 33 4 112.182 100 Total 38 9 191.322 200

68 Tabela 4: Descrição numérica dos corpora

A contagem das palavras foi efetuada de duas formas:

-i) de forma automática (usando a funcionalidade de contagem de palavras (tokens) do Acrobat Reader), para os textos disponibilizados em suporte eletrónico (elencados nas linhas a seguir);

-ii) de forma manual e por aproximação (contagem manual de 3 páginas do corpo do texto e extrapolação para o total de páginas, sem capas, índices e páginas em branco), o que resulta numa pequena margem de erro, para os textos disponibilizados apenas em formato impresso em papel (elencados nas linhas a seguir).

5.2.2 Corpus italiano

Relativamente ao Italiano, o corpus conta com 5 textos: 3 monografias, um catálogo e uma revista.

Dois dos livros (monografias) consistem em obras de caráter descritivo e de divulgação, que exploram o mundo da Arte Urbana do ponto de vista da expressão artística, das técnicas, das correntes e dos objetivos tantos sociais como de meios de comunicação. Estes estão disponíveis apenas em suporte de papel. A terceira monografia é uma das primeiras publicações que saiu em Itália em língua italiana nos anos 90. Escrito em colaboração por autores de língua italiana e inglesa, apresenta a versão bilingue no mesmo texto. Esta obra apresenta um excursus histórico sobre a evolução da Arte Urbana desde o seu princípio nos Estados Unidos até a sua chegada à Europa, através de vários testemunhos de artistas que participaram na redação do livro. Este livro existe também apenas em suporte de papel.

A seguir, temos um catálogo de um artista italiano que descreve o seu último trabalho e está disponível, em formato eletrónico, on-line.

69 O último texto é um número de uma revista especializada, de caráter científico, que se ocupa de temáticas sociais e, nomeadamente, no número utilizado, do uso do espaço urbano e dos muros relativamente aos graffiti e à Arte Urbana. Este é disponibilizado on-line e é de livre acesso.

5.2.3 Corpus português

O corpus português, por seu lado, é constituído por trinta e três textos: um artigo; cinco números da revista GAU, especializada (que correspondem a vinte e dois artigos agrupados por secções, quatro entrevistas e quatro editoriais), uma monografia e um catálogo.

O artigo, que foi retirado de uma revista académica brasileira, encontra- se disponível em formato eletrónico e foca o aspeto comunicativo da Arte Urbana.

Os textos da revista GAU, publicada pela Galeria de Arte Urbana, editada pela Câmara Municipal de Lisboa, e também disponível on-line, tratam da Arte Urbana sob vários pontos de vista no contexto português e lisboeta, apresentando os projetos e os trabalhos que estão a ser desenvolvidos na área citadina. Contemplam também o testemunho dos artistas que participam ativamente na promoção desta área artística.

A monografia consiste num texto de caráter argumentativo e descritivo da realidade juvenil ligada aos graffiti e a sua evolução nos últimos anos. O autor, apesar de não fazer parte do mundo dos artistas de rua, propõe uma visão “desde o interior” da comunidade dos writers7

e oferece um relato acerca do que é Arte Urbana, quem são os protagonistas e quais são as práticas que esta arte envolve.

Por último, o catálogo é da autoria de um artista angolano que

7 “writer”: artista que realiza obras de arte urbana (ver synset correspondente, anexos)

70 apresenta o próprio trabalho.

Em ambos os corpora, temos textos que se encontram disponíveis em suporte eletrónico e de acesso livre on-line e outros que apenas estão em suporte de papel. As referências bibliográficas completas das fontes dos corpora são dadas na secção com o mesmo nome, no final deste trabalho.

Como referido na subsecção 4.1.1 do capítulo anterior, os parâmetros que definem a constituição de um corpus relacionam-se diretamente com o tipo de trabalho em causa e com a função do corpus no âmbito desse trabalho. Assim, tendo em conta os objetivos que queremos alcançar com esta investigação, os textos foram escolhidos segundo os seguintes critérios: i) Línguas (variedade padrão e falantes nativos como autores);

ii) Domínio de especialidade (Arte Urbana); iii) Data (contemporâneos);

iv) Riqueza terminológica (permitem extrair uma diversidade e quantidade de itens lexicais interessante);

v) Representatividade (relevantes e significativos no domínio em causa, segundo a nossa avaliação).

Embora todos os textos selecionados correspondam às características acima listadas, cada um deles apresenta traços peculiares. Para exemplificar, no caso das monografias, do artigo académico e das revistas, encontramos de forma mais marcada um conjunto terminológico diversificado. São portanto, textos de maior riqueza terminológica. De forma geral, os textos caracterizam-se por um registo formal e por objetividade nas descrições e na apresentação das diferentes temáticas mas apesar de os autores não expressarem diretamente a sua opinião pessoal, deixam-na transparecer perante as questões levantadas nas obras. No caso da primeira publicação surgida na realidade italiana e dos textos da revista portuguesa, a situação é diferente quanto ao registo, já que apresentam um alto nível de informalidade e usam gíria, mas considerámo-los relevantes: a primeira, por marcar um

71 ponto de viragem na história do graffiti, ou seja, a passagem de foco dos Estados Unidos para a realidade europeia; a segunda, por valorizar um trabalho relativo a um contexto local que está a ganhar cada vez mais reconhecimento e visibilidade. Acreditamos que o registo que se encontra nestes dois exemplos seja parte integrante e caracterizante da área escolhida e que, portanto, é importante que existam exemplares com estas características nos corpora de modo a obter um quadro o mais completo possível das variantes terminológicas.

Os catálogos, por seu lado, representam um exemplo de como o artista descreve o próprio trabalho. Não foram, propositadamente, selecionados nomes muito conhecidos sobre os quais já muito foi escrito e dito, mas sim dois artistas menos populares: consideramos que esta opção é um contributo pessoal para a divulgação de trabalhos que não têm grande visibilidade, por um lado, e que representa o contacto que temos pessoalmente com a Arte Urbana, por outro.

Procuramos de forma constante um equilíbrio entre os textos italianos e os textos portugueses, tanto quanto às suas características como quanto à escolha do tipo das fontes, o que leva a afirmação de considerar estes corpora como comparáveis se justifique. De facto, à primeira vista, os corpora podem parecer relativamente diferentes, no que respeita ao número e à tipologia das fontes. Note-se que o corpus italiano é composto por mais livros enquanto o corpus português agrupa mais artigos e entrevistas e contém um número maior de palavras. No entanto, as diferenças nas tipologias textuais são compensadas pelos conteúdos. Como assinalado mais acima, cada texto apresenta um matiz diferente, mas cada um tem o próprio equivalente no outro corpus e o processo utilizado para a extração da terminologia em estudo foi o mesmo. Com isso conseguimos, segundo cremos, obter um número razoavelmente coerente de itens lexicais especializados deste domínio.

72 dificuldades em encontrar textos que tivessem as características certas para fazerem parte dos corpora. Em primeiro lugar, porque não existe muito material de acesso livre e fácil. O facto de ser uma área de conhecimento relativamente recente influencia com certeza a divulgação dos textos específicos da área. Para além disso, só nos últimos anos mudou o ponto de vista sobre a Arte Urbana, que passou a ser tratada realmente como um fenómeno artístico e não apenas como fenómeno social das áreas mais marginais da sociedade. Para além disso, muitos recursos da área são principalmente constituídos por imagens, devido à natureza do tópico, e o monopólio da língua inglesa é quase total. Isto nota-se também no léxico de especialidade que é maioritariamente de proveniência inglesa.

Relativamente ao corpus português, é ainda importante esclarecer uma questão acerca das fontes utilizadas: todos os textos constituintes do corpus utilizam a variedade padrão do Português Europeu. Apesar de aparecer, por exemplo, uma revista editada por uma instituição brasileira, o autor do artigo em causa é português, e os poucos termos pertencentes à variedade brasileira que pudessem surgir no texto não foram recolhidos. No caso do catálogo artístico relativo ao trabalho de um autor angolano, considerámos que não houvesse barreiras linguísticas relevantes para o presente trabalho pelo facto de os países pertencentes aos PALOP (Países Africanos de Língua Oficial Portuguesa) utilizarem a variedade do Português Europeu como norma. Naturalmente, neste caso há que considerar que possa haver variação; no entanto, justificamos esta opção tendo em conta o pouco tempo de existência da área e as dificuldades de recolha de textos em Português Europeu na mesma área.