• Nenhum resultado encontrado

4. Complexidade lexical

4.3. Densidade

O outro indicador de complexidade lexical considerado nos estudos sobre aquisição e desenvolvimento linguístico é a densidade lexical, assumida como um dos principais indi- cadores da trajetória do desenvolvimento rumo a uma escrita mais académica (Colombi 2002: 72), relacionando-se com a capacidade que um escritor possui de dispor a informação e condensá-la. Implica, portanto, os modos como a informação representada pelo léxico é incorporada na estrutura gramatical. Segue-se, assim, que um texto lexicalmente mais denso é um texto mais informativo, o que assenta no facto de serem os itens lexicais os portadores primários do conteúdo referencial (Ravid 2004: 346).

É importante salientar que a densidade (e naturalmente também a diversidade, já que se elabora sobre o léxico) se associa à capacidade cognitiva que crianças e jovens adquirem de usar a língua separada de contextos físicos imediatos, no que se convencionou chamar de língua descontextualizada, isto é, sem o suporte de contextos conversacionais (Snow

28 Diferentemente da medida TTR, em que 1 é o máximo, a medida D não tem um limite preesta-

Complexidade lexical

47

1983, cf. Schleppegrell 2004: 8). Apesar de diversas críticas a que tal compreensão tem sido sujeita, a capacidade de produzir textos deslocados dos seus contextos reais, expressa, por exemplo, para referir o passado, antecipar o futuro ou especular sobre mundos possíveis alternativos à realidade, continua a ser bastante valorizada nos sistemas educacionais, sendo tipicamente referida como uma capacidade de ordem superior (MacLure 1999: 247). Por outras palavras, um texto com baixa densidade lexical configura-se como mais dêitico, mais situado no aqui-agora do discurso, sendo comummente um texto com características da modalidade falada; por oposição, um texto que apresenta taxas mais altas de densidade le- xical estará mais próximo da modalidade escrita.

Como acontece com a diversidade lexical, também há diferentes formas de medição da densidade lexical, mas duas destas tornaram-se já tradicionais na literatura (Baker et al. 2006). A primeira proposta vem de Ure (1971) e Halliday (1987), que se fundamentam na relação entre os itens lexicais, ou palavras de conteúdo, e os itens gramaticais, ou palavras funcionais, que se estabelece num texto, expressando-a em forma de proporção. Posterior- mente, Ure (1977) sugere uma reformulação à sua técnica: a proporção de itens lexicais pelos itens totais, o que é secundado por Stubbs (1996: 72), que acrescenta que a densidade deve ser expressa pela percentagem de ocorrências de itens lexicais, portanto multiplicando- se o resultado por cem. Tome-se, para a ilustração da aplicação da medida reformulada, os excertos anteriormente utilizados, reescritos em (3) e (4), com os itens lexicais em itálico: 3. Sim as redes sociais sim são importantes hoje em dia para a gente comunicar. Sim eu sou

a favor porque as redes sociais são precisas tal como o Facebook e a gente fala por ele com a família e com os amigos. E primos e tias e etc... e muita mais gente. (gpts_2_5c_mda)

4. As redes sociais, hoje em dia, são um importante meio de comunicação, servindo também para o entretenimento das pessoas. O Windows Live Messenger permite-nos falar com amigos em tempo real, e para mim é uma das únicas maneiras que tenho de falar com pessoas que moram longe ou que já não vejo há muito tempo. (ls2_2_10a_fdl)

No exemplo (3), há um conjunto de 16 itens lexicais para um total de 52 itens (dos quais 36 são itens gramaticais), de que resulta uma taxa de densidade lexical, se considerada a fórmula itens lexicais/itens totais, de 0,31, de que se lê que 31% dos itens totais são lexi-

48

cais. Inversamente, do total de palavras empregues no excerto, 69% são palavras gramati- cais. Quanto ao excerto (4), que tem um total de 56 palavras, das quais 25 são lexicais e 31 são gramaticais, tem-se um rácio de 0,45 item lexical, sendo possível afirmar que 45% dos itens totais equivalem a itens lexicais e que 55% são itens gramaticais.29

A segunda proposta de medição da densidade lexical é também de Halliday (1987, 2005, 2009), para quem a densidade se mede pela frequência média de itens lexicais30 por orações, excluindo-se as orações encaixadas (embedded clauses). O linguista sustenta que a oração é a unidade mais óbvia, mais natural para se avaliar a densidade, visto ser a maior unidade gramatical da língua, mas não exclui a possibilidade de se considerar outras unida- des, apresentando recentemente uma definição mais abrangente (2009: 75): “the quantity of lexicalized information packed into a given unit in the grammar”. No entanto, Halliday afirma (2005: 168-9) que a aplicação do cálculo de densidade no escopo da oração, como ele propõe, é mais significativa quando na comparação da fala com a escrita, já que aquela, ainda segundo o linguista, tende a ser construída com mais orações do que esta. Por isto, não se utiliza esta forma de medição nesta tese, já que se trata de uma comparação entre textos unicamente da modalidade escrita. Acrescente-se que as medidas até este ponto re- feridas são convergentes em termos de resultados, como garantem Berman e Ravid (2009: 98), podendo resultar a sua aplicação em simultâneo ao mesmo conjunto de dados redun- dante.

Wolfe-Quintero et al. (1998: 105) listam várias outras técnicas de medição do uso do léxico, como, por exemplo, o rácio de nomes pelo total de tokens ou o rácio de verbos pelo total de tokens. Apesar de Wolfe-Quintero et al. (1998) referirem estas técnicas para a ava- liação da diversidade, entendo-as como mais adequadas à avaliação da densidade, já que envolvem a especialidade categorial do léxico, tornando-se, portanto, complementares às medidas clássicas de Ure (1971) e Halliday (1987). Deste modo, torna-se possível falar em densidade nominal (rácio de nomes pelos itens totais) ou em densidade verbal (rácio de

29 É importante reiterar que o conceito de item, na complexidade lexical, equivale ao de palavra

ortográfica, o que se expressa pela anotação do item ‘dia’, no excerto, como nome, e não como parte da locução adverbial de tempo.

Complexidade lexical

49

verbos pelo total de itens). Neste trabalho, portanto, utiliza-se primeiramente a medição clássica (Ure 1971, Halliday 1985, Johansson 2009) – o rácio de itens lexicais (e as especi- alidades) pelo total de itens, expressa em forma percentual, e secundariamente, aplicam-se as medidas por especialidade (densidade por especialidade de classes de palavras).

As discussões sobre como calcular a densidade não se têm centrado somente em ques- tões de natureza matemática, mas também em questões de natureza linguística. Dizem res- peito à diferenciação entre itens lexicais e itens gramaticais. Ure (1971: 445), por exemplo, inclui como itens lexicais, ou itens com propriedades lexicais – em oposição aos itens com propriedades gramaticais – todos os nomes, verbos e adjetivos. Strömqvist et al. (2001: 48) admitem como itens lexicais nomes, adjetivos e verbos, mas excluem os verbos auxiliares e os verbos copulativos. Há ainda autores que optam por descrever as ocorrências especia- lizadas de itens lexicais, como fazem Ravid e Berman (2006), que avaliam as ocorrências de nomes num grupo de textos falados e escritos em registos narrativos e não narrativos.

Como observa Halliday (1989: 61), entre itens lexicais e itens gramaticais existe uma relação escalar, não existindo uma divisão nítida entre uns e outros, mas é possível fazê-la em favor da coerência metodológica do trabalho. Nesta tese, consideram-se as recomenda- ções de Mendes (2013: 258), que, aceitando também que há uma relação escalar entre itens lexicais e itens gramaticais, admite como itens mais próximos do pólo lexical os seguintes: nomes, adjetivos (incluindo numerais ordinais), verbos plenos e advérbios terminados em - mente.

Apresentados os fundamentos necessários à compreensão das medidas de diversidade e densidade lexical, procede-se à descrição dos procedimentos metodológicos adotados es- pecificamente para a obtenção destas medidas.