14 letras = 0,14%
CORPUS 23. TXT Bytes 618.802
17. Uso de caracteretas ou emoticons:
Bjão !!!
bjim
$(".)$
diculpa (>.<)bjos
Pra mim nem é muito esforço!ashuashuashasuhsa :*
xeru =********
antes estarei por aí fica com Deus... beijos ;**
é q ando p lah d ocupada!
eu tow beem \o/
a parada pode dizerrr ;**
Conforme vimos nos dados, as modificações realizadas nas palavras se referem basicamente ao registro mais simplificado possível da fala, sem preocupação com grafia oficial, interessando aos jovens apenas estabelecer contato, passar adiante suas idéias. A regra básica é uma simplificação da língua, com abundantes abreviações, siglas ou reduções. Elas vão do uso de uma simples consoante para representar uma palavra (q, p = que, para) passando pela ausência de uma vogal no vocábulo (fla, tmpo, pod, kda = fala, tempo, pode, cada) até a ausência total de vogais (cmg, gnt, tb, qnd, ngm, sb = comigo, gente, também, quando, ninguém, sabe).
Essas reduções, entretanto, não são aleatórias, pois há uma lógica. Observamos que são privilegiadas as consoantes, cujos nomes suprem as vogais não escritas. Por exemplo, “dxa”, em que “d” corresponde à sílaba “dei → de” (na fala o ditongo “ei” não é fortemente pronunciado) e o “xa” é a segunda sílaba de “deixa”. Mais claro fica em “kbça” (k = ca + b = be + ça), estendendo-se a regra para “blz” em que o “z”, pela seqüência de sons só poderá ser a sílaba “za” e não o nome da letra (zê), porque não existe “beleze” em português. Dessa forma, percebemos claramente que ler esses textos não é ler letras e que a nova grafia não é aleatória, mesmo na aparente transgressão gráfica na comunicação dos jovens.
Sobre quantas variantes de forma possíveis, percebemos que não são muitas, até quatro, como em “td, tdu, tudu, tdo”. O que pode acontecer são variações com o acréscimo de vogais
ALTERAÇÕES DE GRAFIA
192
ou “s” para indicar a intensidade da idéia a ser passada. Assim, uma coisa é escrever “T amu, bjs, bjo, mto”, outra bem mais forte é registrar “T amuuuuuuuu, bjssssssssssss, bjoooooooooooooo, mtoooooooooooooo”. Essas são variações livres, aliás, todas as regras no internetês não são seguidas com muito rigor. Aparentemente não há leis de espécie alguma cobrando coerência, apenas que sejam grafias inteligíveis para os “iniciados” nessa linguagem até certo ponto cifrada. Se houvesse leis, os jovens, por serem jovens e contestadores, talvez as abandonassem e criassem outras formas de se comunicar.
O internetês utiliza um sistema gráfico que procura reproduzir as falas da forma bastante fiel. Pouco interessam os grafemas utilizados, a prioridade é transmitir rapidamente uma mensagem ao interlocutor. As transformações existentes visam a simplificar e facilitar a escrita. Dessa forma, por exemplo, o dígrafo “qu” (e às vezes o “c”) é trocado pela consoante que sequer faz parte do alfabeto oficial do português, o “k” (aki, ke, poko), o “ch” transforma-se em “x” (axo, maxuca) e até o “ss” pode virar um “x” como pronunciado em “máximo”
(axim). Mas a maior transformação refere-se à supressão de letras, sejam de todas as vogais (vc
= você, tc = teclar, tb = também, ctg = contigo), seja de somente uma delas (nunk = nunca, dpois = depois, kra = cara, pod = pode). Uma transformação que chama a atenção foi a de representar a nasalidade sem utilizar o til, escrevendo “un” ou “um” após a vogal nasal (naun, noçaum). Outra forma de mudança gráfica está na maneira de indicar a sílaba acentuada das oxítonas, em que o acento agudo foi alterado para “h” (neh, ateh, tah, bah). Um bom exemplo de registro variado é a expressão de risos ou gargalhadas, visto nos diálogos literários como
“ahahahah”, no internetês é comum aparecer “rsrsrssrsrsr”, “rsssssssss”, “KKKKKKKK”,
“hauhauahauahauaha”, “hahaahhaha”, “hehhehehe”, ou até mesmo um misto de letras maiúsculas e minúsculas, como “aUAheUheAHuaha”.
Sobre que símbolos são equivalentes a palavras, não foram muitos os encontrados por ser o corpus pesquisado composto de depoimentos e não de conversa de chat, por exemplo, em que a linguagem é mais espontânea. Nos depoimentos, algumas palavras são transformadas em símbolos ou desenhos, como acontece com o sinal “+” para significar “mais” ou, mais raramente, para indicar a conjunção “mas”, a forma gráfica “-” para “menos” e o “T +” para
“até mais”. Na verdade, o internetês é uma recriação gráfica da língua, com representações e simbologias. Os sinais de pontuação, por exemplo, podem ser dispostas na frase de tal modo que signifiquem uma interjeição ou frase inteira. Todos os sinais não podem ser analisados isoladamente, mas em seu contexto, como representação das emoções humanas. E para dizer
ALTERAÇÕES DE GRAFIA
193
muito com poucos meios foram criados os emoticons (emotional icons). São uma fusão de caracteres, que formam as chamadas “carinhas” ou “smilies”, expressão de sentimentos e situações com o uso criativo do teclado, que substituem palavras.
Como pudemos ver e ler nos dois pequenos textos iniciais desta seção, não lemos letra por letra, vemos o conjunto de caracteres e entendemos o seu significado como um todo. É assim com as “palavras” e palavras utilizadas pelos jovens na Internet. Normalmente lemos a abreviatura como palavra inteira, a forma resumida é um substituto apenas da palavra. Quando vemos “cap.”, por exemplo, não falamos “cap” mas “capítulo”, assim como na forma “p/”, vista como “para” e não “pê barra”. Poucos casos de abreviaturas são falados como siglas, é o caso de “tv” (tevê) ou “wc” (vecê). Já “ap.” (apartamento) nos últimos anos passou também a ser dito como “apê”, mas aqui cabe a pergunta: é a leitura da abreviatura ou é uma redução de palavra longa, como as utilizadas pelos jovens (sempre eles!) para “refri” e ‘bici” (refrigerante e bicicleta)? Quando no internetês aparecem “tb” ou “vc” ninguém que domina esse código vai ler “tebê” ou “vecê”, mas “também” e “você”.
Há que se levar em conta que o internetês não é escrito só com palavras grafadas que transgridem as normas ortográficas vigentes hoje. Das 2000 palavras mais freqüentes do Corpus Geral do Orkut, apenas 439 possuíam alguma alteração (o que nos dá 21,19%) em relação à grafia “culta”. As quase 80% demais estavam grafadas de acordo com a norma oficial. Isso é o que buscamos ilustrar na Figura 9, a seguir.
ortografia alterada
ortografia oficial
Figura 9: Proporção de palavras do internetês alteradas graficamente e sem alteração (das 2000 palavras mais freqüentes do Corpus Geral do Orkut).
Por que então a grafia do internetês provoca tantos incômodos, “mexe” tanto com as pessoas, se apenas 20% de sua grafia é alterada? Porque tradicionalmente há maior
ALTERAÇÕES DE GRAFIA
194
valorização com a forma do que com o conteúdo da escrita. Aliás, Bagno se refere a isso como paranóia ortográfica. E acrescenta: “Ora, saber ortografia nada tem a ver com saber a língua.
São dois tipos diferentes de conhecimento. A ortografia não faz parte da gramática da língua, isto é, das regras de funcionamento da língua (grifo do autor)” (BAGNO, 2002, p. 131).
Outra informação importante é salientar que não nos comunicamos por uma lista de palavras que se lêem isoladamente, mas em contexto. É nesse contexto que descobrimos o que significam. Assim, uma palavra do internetês vista isoladamente que, a princípio, não apresenta significado algum, ao ser observada na frase onde ocorre desfaz o “mistério” e passa a ter significação. Isso ocorreu conosco ao obtermos a wordlist. Como não são todos os itens lexicais grafados de modo incomum numa frase, então pela relação com as palavras grafadas de modo “normal” entendemos a mensagem escrita.
Passemos agora à observação de alguns itens lexicais do internetês, analisando sua freqüência de uso nas diferentes regiões do Brasil. Pretendemos averiguar se essa escrita eletrônica tem emprego uniforme em todo o Brasil ou se, assim como o léxico em geral de uma língua, tem variações diatópicas. Para a coleta dos dados apresentados no Quadro 34 utilizamos o recurso do WordSmith Tools chamado Concordância, em que a palavra solicitada aparece contextualizada por 4 palavras antes e 4 depois. As concordâncias de gnt (= gente), por exemplo, no subcorpus Rio Branco, mostraram:
N Concordance Set Tag Word No. File % 1 ! Cante novamente ki a gnt pede bis! É pique, 410 c:\corp8.txt 1 2 teu ladoo, por mais q a gnt naum se fale muuuu 464 c:\corp8.txt 1 3 ra Saidinhu q uma vez a gnt brigo e td mais....fic 13.209 c:\corp8.txt 41 4 inhu tem qnt tempo q a gnt se conhece heim??? 13.187 c:\corp8.txt 41
Os itens lexicais pesquisados foram inicialmente buscados dentre as 500 primeiras palavras típicas do internetês (Anexo VII). Depois, algumas outras formas diferentes de grafar foram acrescentadas à lista, mesmo que pouco freqüentes, para efeitos de comparação, como vlw/valeu e dolu (= adoro).
ALTERAÇÕES DE GRAFIA
195
Quadro 34: Distribuição de diferentes formas lexicais por região do Brasil TYPE Ma-
naus Be- lém
Bra- sília
Cuia- bá
Porto Alegre
Reci- fe
Rio .Branco
RJ Sal- vador
Scraps apenas
GERAL
abs 0 0 0 0 0 0 0 0 0 2 2
bah 0 1 0 0 31 0 0 1 0 3 284
bjim 1 0 1 7 0 0 2 0 2 9 25
bju 7 3 3 9 3 8 4 4 6 10 96
bjo 8 4 11 7 4 3 5 4 4 21 245
beijo 5 5 5 5 5 8 4 10 11 26 157
bjs 14 6 7 3 5 8 17 5 4 67 211
bjaum 4 2 10 10 5 4 2 3 6 9 121
dolu 0 0 1 11 1 0 3 1 2 0 192
falow 5 4 1 0 0 6 5 2 0 4 36
flw 5 3 3 5 2 13 2 3 0 20 89
gnt 9 31 14 11 40 10 4 26 9 8 363
gente 86 47 119 88 113 89 105 118 94 52 604
mt 93 95 75 11 19 46 39 148 33 10 855
mtu 18 5 30 20 37 7 13 9 14 2 530
mto 79 40 165 144 95 37 74 100 57 26 1587
muito 246 210 185 170 167 197 224 165 156 113 3401
naum 105 110 64 71 42 59 40 80 38 50 1192
nao 89 54 106 127 151 53 73 91 66 88 1418
não 144 176 199 195 207 243 204 172 186 281 3567
namo 0 0 0 0 1 3 0 0 0 1 11
ngm 1 1 8 5 1 3 5 11 2 9 74
ninguem 7 19 9 7 9 9 8 5 9 6 143
ninguém 11 8 3 5 10 14 8 4 10 15 147
pq 135 226 157 157 151 177 148 185 190 67 3158
porque 22 19 24 19 28 34 34 21 23 17 485
q 574 722 477 508 545 449 501 593 469 327 9028
que 617 593 649 705 784 753 791 695 703 552 11537
tah 35 33 38 56 48 30 25 52 19 43 789
tb 16 12 24 25 19 28 10 28 38 31 382
tbm 43 44 30 34 24 18 28 19 92 56 568
também 3 15 8 6 17 11 23 13 12 23 239
t 40 167 55 72 88 73 89 59 33 26 1369
ti 46 117 41 61 108 17 169 43 23 26 1407
te 402 679 471 536 400 767 789 446 1172 239 8922
tu 103 161 31 9 414 192 139 27 8 110 2699
vlw 2 1 4 2 6 4 4 14 5 19 88
valeu 8 4 9 4 11 4 5 8 4 32 139
vc 537 425 502 564 195 372 469 623 626 459 6347
voce 21 8 32 36 17 13 7 36 25 8 239
você 94 88 163 143 58 167 155 127 175 128 1816
vcs 8 17 6 11 8 6 7 12 7 36 188
Os dados do Quadro 34 permitem várias constatações sobre a variação ortográfica presente no internetês do Orkut. Eles indicam, pela grande freqüência de uso, que formas
ALTERAÇÕES DE GRAFIA
196
foram adotadas, quais estão sendo substituídas e se há emprego de formas alteradas e oficiais com igual intensidade:
1) No geral, não há significativo predomínio de determinadas alterações gráficas por região.
2) As variações existentes por região são relativas a vocábulos, como o expressivo emprego de bah em Porto Alegre, bjim e dolu em Cuiabá, tu em Porto Alegre, Recife e Belém.
3) Poucas formas típicas do internetês têm maior incidência por regiões. Exemplos são flw em Recife, gnt em Porto Alegre, mt, vlw e ngm no Rio de Janeiro e tbm em Salvador.
4) Algumas formas têm mesmo padrão de uso em todo Brasil, como pq, q, tah e vc.
5) Tendência a certos usos parece indicar preferência por região. É o caso de no Rio de Janeiro aparecer com destaque a maneira mais reduzida de escrever (apenas consoantes): mt, ngm, tb e vlw.
6) Algumas formas reduzidas estão substituindo, em todo país, as formas ortográficas oficiais: pq x porque, vc x você, tb e tbm x também.
7) Mesmo com variações, certas formas oficiais ainda são as mais empregadas em todo o Brasil. Ex.:
Manaus: muito (246 ocorrências) x mto (79), mtu (18), mt (93) Salvador: muito (156) x mto (57), mtu (14) mt (33)
Recife: não (243) x nao (53), naum (59)
Rio de Janeiro: não (172) x nao (91), naum (80) Brasília: te (471) x t (55), ti (41)
Rio Branco: te (789) x t (89), ti (69)
8) Algumas formas coexistem na escrita com certa similaridade de freqüência em todas as regiões:
Porto Alegre: que (784) e q (545) Belém: que (593) e q (722)
9) Não se percebe significativo uso das formas típicas do internetês no subcorpora de scraps, conforme esperávamos. Em algumas regiões, chega a ser menor o emprego de formas características nos scraps do que nos depoimentos. É o caso de mtu, mt, pq, t e ti.
Percebemos que o internetês não tem um número tão elevado de formas modificadas a ponto de ameaçar a escrita da Língua Portuguesa. Quando comparadas as formas em uso na Internet com a forma oficial, quantitativamente, são poucos os exemplos em que novas formas
ALTERAÇÕES DE GRAFIA
197
substituem a norma padrão de escrever. Alguns exemplos têm uso pouco expressivo, conforme pudemos verificar com os levantamentos feitos em nossos corpora.
O internetês revela-se, nos nossos dados, como uma fala digitalizada e cifrada, surgida na Internet e manifestada por caracteres alfanuméricos. Para entender essa sua característica, também devemos levar em conta o aspecto relacionado ao suporte em que tal escrita é registrada. Afinal, os historiadores da escrita são unânimes em dizer que a alteração do suporte (tijolo, papiro, papel, monitor) é fator de mudanças na escrita e na leitura. Por exemplo, escrever de forma não cursiva é a mais indicada para pedra ou tijolo. Escrever, portanto, teclando no computador, especialmente on-line, é certamente algo que induz a transformações, principalmente pela velocidade que se quer dar àquilo que se transmite por escrito. Suportes especiais explicam escritas especiais.
5.4. INDÍCIOS DE ORALIZAÇÃO SOBRE A ESCRITA
Na Seção 5.2, ao observarmos as palavras mais freqüentes em corpus de fala, escrita e internetês (E, QUE, DE, A, O, É e EU) afirmamos haver uma junção entre fala e escrita nesse último, com características da oralidade muito marcantes. Aprofundaremos agora o exame desse indicativo buscando reconhecer e categorizar traços/especificidades e exemplos de oralização na escrita do Orkut.
As características que depreendemos da observação do Corpus Geral do Orkut são as seguintes:
1) Presença de marcadores conversacionais