• Nenhum resultado encontrado

Tradução de Dayane Celestino de Almeida

No documento Perspectivas em linguística forense (páginas 79-98)

Linguistas que trabalham com métodos computacionais, estatísticos e estilísticos de análise de autoria textual e elaboração de perfis linguísticos têm se baseado em versões bastante simplistas da noção de identidade linguística, com foco nos conceitos de (i) socioleto ou ii) idioleto. Princípios razoavelmente bem estabelecidos da sociolinguística, tais termos se referem a (i) as variedades linguísticas associadas a certos grupos sociais determinados pelas seguintes categorias: sexo/gênero, idade, classe social etc., e (ii) a ideia de que cada indivíduo apresenta uma versão própria da sua língua. Ambos os fenômenos baseiam-se num entendimento do uso linguístico enquanto produto das experiências sociolinguísticas, o que parece se opor a avanços que têm sido feito em outros campos, tais como a análise do discurso e a antropologia linguística, em que a língua tem sido cada vez mais vista em termos interacionais — como um recurso que se utiliza para indexar ou desempenhar, criar certas identidades em oposição a um mero produto dessas identidades. Neste trabalho, nós nos propomos a abordar essa aparente lacuna ao delinear nossa própria teoria de língua e identidade, ligada a pesquisas em andamento sobre a relação entre

Título original “Resources and constraints in linguistic identity performance: a theory of

1

língua e identidade em contextos on-line. Defendemos que a língua é de fato um recurso fundamental para a construção e o desempenho de identidades, mas também levamos esse argumento mais adiante ao sugerir que os recursos que empregamos — linguísticos ou de outra natureza — direcionam nossas possibilidades de perfórmance identitária. Sugerimos que uma teoria que afirma que identidades são inteiramente negociadas na interação terão dificuldades para dar conta da ideia de persistência de traços identitários que está no centro das tarefas de atribuição de autoria. Ao postular esse modelo de identidade recurso-restrição, reconciliamos conceitos contemporâneos de identidade linguística com as bases teóricas da análise de autoria textual em contextos forenses.

ANÁLISE DE AUTORIA, PERFIS LINGUÍSTICOS E A NOÇÃO DE IDIOLETO

Os linguistas forenses podem se deparar com uma grande variedade de tarefas no âmbito da análise de autoria (ver Coulthard, 2010; Grant, 2008). Elas incluem a elaboração de um perfil sociolinguístico de um autor e também a tarefa de comparar um ou mais textos anônimos com textos cuja autoria é conhecida. O ponto de partida para essas duas tarefas é o entendimento das causas de consistência e variação na produção linguística.

Na elaboração de perfis, o objetivo é depreender o máximo possível de informações sociolinguísticas do autor, puramente com base em suas escolhas linguísticas. Isso requer uma demonstração das diferenças existentes entre grupos. Linguistas forenses e computacionais que pesquisam a elaboração desses perfis mencionam taxas de sucesso impressionantes para identificação de gênero do autor — masculino ou feminino, em seu sentido mais simples — (e.g. Argamon et al., 2003), idade (e.g. Koppel, Schler e Argamon, 2009) e outras variáveis sociolinguísticas. Tais trabalhos parecem estar baseados numa visão essencialista de categorias sociais como gênero e, além disso, assenta-se numa visão determinista do relacionamento entre língua(gem) e identidade. É essencialista na medida em que a atribuição de textos individuais a cada um dos dois grupos de gêneros depende de critérios externos de gênero, pré determinados pelos pelos pesquisadores, e determinista porque a predição baseia-se na premissa de que deve haver alguma correlação causal entre o pertencimento a um determinado grupo e as características linguísticas produzidas.

Na análise de autoria comparativa, em que um texto anônimo (ou um conjunto de textos) é associado a conjuntos específicos de textos cuja autoria é conhecida, encontram-se premissas similares. Coulthard (2004, p. 432) afirma que abordar tais problemas se fundamenta na ideia de que "cada falante nativo tem a sua própria versão — distintiva e individual — da língua que fala e escreve". Mesmo que essa forte afirmação possa ser posta à prova em termos teóricos, é verdade que a análise comparativa de autoria fundamenta-se ao menos na ideia de que um indivíduo "linguístico" apresenta consistência no uso linguístico ao longo de diferentes textos e que esse uso consistente pode ser comprovadamente distintivo (ver Grant, 2010). Existem alguns casos de sucesso bastante conhecidos na análise de autoria comparativa e também uma série de avaliações acadêmicas de métodos que parecem sustentar a ideia de um indivíduo linguístico que permanece, persiste através do tempo e, talvez, através de gêneros e modos de produção diferentes (ver, por exemplo, Chaski, 2005, 2007; Grieve, 2007; Solan e Tiersma, 2005).

O conceito de "indivíduo linguístico", uma pessoa que faz escolhas gramaticais e lexicais em um texto, permanece em certa medida pouco examinada na literatura sobre atribuição de autoria, mas é algumas vezes igualada à noção teórica de idioleto. A noção abstrata de idioleto deriva grandemente de um paradigma cognitivista. Para linguistas forenses trabalhando neste paradigma, a noção de idioleto é fundamental para qualquer discussão em termos de distinguir os usos linguísticos dos indivíduos (Howald, 2008) e a produção linguística de um indivíduo é vista como um resultado das estruturas de sua cognição, como algum comportamento interno "automatizado e inconsciente" (Chaski, 200, p. 8). Da perspectiva cognitivista, tanto os padrões individuais quanto os padrões de grupo são o resultado da padronização e sistematização da língua (Howald, 2008, p. 232).

Por outro lado, linguistas forenses que adotam uma abordagem mais sistêmica ou estilística veem essa noção de idioleto indiscutivelmente menos central para métodos de análise de autoria, focando, em vez disso, no estilo individual como manifestado pela cosseleção de determinados elementos, marcadores linguísticos. O conceito de estilo idioletal de Turell (2010) é um bom exemplo disso. A autora afirma que o foco não está no sistema linguístico de um indivíduo, mas "como esse sistema, compartilhado por muitas pessoas, é usado de maneira distintiva" (Turrell, 2010, p. 217). Nessa literatura, reconhece-se que as escolhas linguísticas são motivadas pelas experiências sociais dos indivíduos e o contexto mais amplo da produção de um texto específico (Argamon e Koppel, 2013; Grant, 2010; Nini e Grant, 2013). Assim, tanto da perspectiva cognitivista quanto da estilística, o estilo linguístico de um

indivíduo é visto como um produto ou da competência linguística e da capacidade cognitiva, por um lado, ou de diferentes experiências sociohistóricas e contextos, por outro. Para depreender e tecer comentários sobre o provável background de um autor, ou para fornecer uma opinião sobre a semelhança ou diferença entre as escolhas linguísticas de um autor em comparação a um texto anônimo, o linguista deve observar as estruturas cognitivas dos indivíduos ou as suas experiências sociolinguísticas, incluindo o seu pertencimento a certas categorias sociais, verificando como essas questões, até certo ponto, determinam as escolhas linguísticas que eles provavelmente farão ao produzir um texto.

A utilidade da noção de idioleto no trabalho de análise de autoria é também enfraquecida pelo fato de que a sua existência não pode ser empiricamente provada ou falsificável. Apesar de algum consenso de que a demonstração da existência de idioletos é a base para o estabelecimento da ideia de que as técnicas de atribuição de autoria são suficientes (Howald, 2008), está claro que até mesmo uma vasta quantidade de dados linguísticos de muitos indivíduos não poderia comprovar totalmente a forte afirmação de Coulthard sobre a singularidade linguística, conforme mencionado acima. Uma vez que, em casos forenses, é altamente improvável a necessidade de se comparar um autor com um conjunto infinito de autores-candidatos, alguns pesquisadores defendem que haja um foco na consistência ou diferença entre pares ou pequeno grupos (Grant, 2013), em vez dessa noção de idioleto. Em se tratando da discussão teórica sobre idioleto, Grant (2010; 2013), Kredens (2002) e Kredens e Coulthard (2012) indicam que comparar o estilo linguístico de um indivíduo com um corpus de dados de uma população relevante seria aceitável. Estabelecer a 'Taxa Básica Conhecida" (Turell e Gavalda, 2013) para características linguísticas específicas permite uma compreensão mais profunda do fenômeno idealizado de idioleto, mas uma dificuldade prática na compreensão dessas taxas de base na linguística é a identificação e a amostragem de uma população relevante. Uma resposta prática típica para essa dificuldade pode estar no estabelecimento das taxas básicas da comunidade de prática caso a caso (ver, e.g. Wright, 2013; 2014), mas isso demanda muito tempo e pode limitar os casos para apenas alguns.

Como vimos, os sucessos práticos, tanto de abordagens estilísticas quanto de estilométricas, são enfraquecidos por premissas ou de uma visão essencialista de identidade, ou de uma visão determinista ou de uma visão ao mesmo tempo essencialista e determinista. A literatura nos leva de alguma forma a resolver esses problemas. Por exemplo, o trabalho computacional de Bamman et al (2014) sobre

diferenças de gênero no Twitter aborda de frente o problema de a maioria dos trabalhos sobre a elaboração de perfis sociolinguísticos se basear em "uma imagem simplista e enganosa de como a linguagem mostra a identidade pessoal" (Bamman et al. 2014, p. 135), e o estudo tenta atenuar essa suposição descrevendo a linguagem de gênero em termos do gênero dos interagentes típicos de um indivíduo, bem como através das definições de gênero definidas externamente. Isso vai de alguma forma na direção dos entendimentos atuais do gênero linguístico como desempenho (ver Butler, 1990), em vez de uma categoria pré-determinada.

Uma visão mais sofisticada do indivíduo linguístico é aquela que acomoda a ideia de que "categorias de identidade impostas externamente geralmente têm, no mínimo, tanto a ver com a própria posição de identidade e interesses do observador, quanto com qualquer tipo de realidade social objetivamente descritível" (Bucholtz e Hall, 2004, p. 370). Tal ponto de vista faz emergir algumas questões ligadas a uma forte relação determinística entre os indivíduos e os textos que eles produzem. Com o intuito de abordar essas questões, nós passamos agora a discutir noções contemporâneas de identidade, contrastando-as com as abordagens anteriores, de cunho essencialista.

LINGUAGEM E IDENTIDADE

Le Page e Tabouret-Keller (1985) foram indiscutivelmente os pioneiros do que se entende modernamente por língua e identidade, estabelecendo o modelo de "Atos de identidade" que serve de ponto de partida para teorias que influenciaram nossa própria abordagem do fenômeno. Influenciado pela teoria da acomodação de Giles (1973), o princípio central de tal modelo é que indivíduos produzem padrões de comportamento linguístico que se assemelham àqueles dos grupos com os quais se identificam em um dado momento, e eles podem produzir padrões que são diferentes dos padrões das pessoas das quais eles querem se distinguir (1985, p. 181). Este modelo foi um dos primeiros a enfatizar o papel do indivíduo como um agente criativo que projeta variadas identidades por meio de seu comportamento linguístico, colocando-o ao lado de abordagens mais recentes "em que o papel constitutivo, agentivo da linguagem é enfatizado" (Rickford, 2011, p. 251). Essas primeiras explorações do relacionamento entre linguagem e identidade prepararam o caminho para o pensamento linguístico contemporâneo sobre a questão, permitindo

que sociolinguistas tais como Bucholtz e Hall (2004; 2005) promovessem a compreensão coletiva do papel que a interação desempenha na construção da identidade. Como afirma Johnstone, "é mais esclarecedor pensar em fatores como gênero, etnia e público como recursos que os falantes usam para criar vozes únicas, do que restritores de como eles falarão" (1996, p. 11, grifo nosso).

De acordo com Bucholtz e Hall (2004), a língua é um dos muitos recursos simbólicos que estão disponíveis para a produção identitária, uma posição que decididamente vai contra as abordagens mais determinísticas que discutimos na seção anterior. Em vez de ser um produto do pertencimento de alguém a certas categorias sociais, a língua é encarada, desse ponto de vista, como um recurso flexível que desempenha um papel central na formação de identidades. Para Bucholtz e Hall, as identidades não são "inteiramente pré determinadas, mas negociadas durante a interação" (2004, p. 376). Para alguns autores, no entanto, parece estar mais ou menos estabelecido que as identidades são de fato inteiramente "negociadas na interação". Os estudiosos que abordam o assunto a partir de uma posição analítico-metodológica ou de conversação — por exemplo, aqueles representados em Antaki e Widdicombe (1998) — interpretam identidades como se tornando relevantes apenas quando os participantes os orientam e exibem através dos detalhes de sua interação. A sociolinguística variacionista passou por uma virada na mesma direção, saindo do entendimento mais tradicional de identidade enquanto uma categoria estática e claramente delimitada, em direção a uma interpretação mais dinâmica das identidades, sendo estas desempenhadas na e pela interação (por exemplo, Eckert, 2000 e Androutsopoulos e Georgakopoulou, 2003).

É interessante, portanto, inferir da formulação de Bucholtz e Hall que eles admitem a possibilidade de que alguns aspectos ou graus de identidade podem ser parcialmente "pré determinadas". Esse reconhecimento cria um espaço teórico para que se trabalhe na teoria de identidade de modo a melhor compreender que identidades podem ser, em alguma medida restringidas, e esse espaço teórico talvez seja um reflexo do espaço no artigo de Bamman et al (2014) que abre espaço para uma posição menos essencialista sobre a identidade a partir de uma posição estilométrica. Nosso propósito no restante deste trabalho é explorar este espaço para sugerir um modelo unificado da persona linguística que se baseia tanto nas concepções tradicionais do idioleto quanto nas teorias mais contemporâneas da identidade linguística. Propomos uma nova conceptualização da identidade como nem inteiramente o resultado de categorias sociais impostas externamente, nem totalmente emergente de forma interacional, uma vez que rejeitamos a visão

essencialista e determinista de identidade, mas mesmo assim desejamos dar conta das diferenças linguísticas entre os indivíduos que persistem por diferentes momentos interacionais. Nosso objetivo em desenvolver um tal modelo é estabelecer um alicerce para o trabalho de análise de autoria e uma nova tarefa na linguística forense que vimos desenvolvendo, nomeadamente, uma síntese de autoria, como descrito na próxima seção.

A PERSISTÊNCIA DA IDENTIDADE NA SÍNTESE E NA ANÁLISE DE AUTORIA

Desde 2009, temos nos envolvido com o treinamento de policiais sob disfarce (PSD) na tarefa específica de assunção de identidades on-line. Este trabalho foca 1 principalmente em Exploração Sexual e Abuso de Crianças (ESAC) on-line e um 2 cenário típico envolve um policial, com autorizações e permissões adequadas, assumindo as contas on-line de uma criança, fazendo-se passar por ela numa conversa com um suspeito de pedofilia, com o objetivo de fazer com o que suspeito se revele e possa ser preso. Essa tarefa é mais específica do que outras tarefas mais

gerais de disfarce como, por exemplo, a mera ofuscação de um autor . Denominamos 3

essa tarefa síntese de autoria. Temos treinado policiais sob disfarce designados para para assumir outras identidades para realizar uma análise linguística estruturada das interações capturadas entre a criança e o pedófilo antes de entrar na Internet para representar a criança. Nossa pesquisa demonstra vantagens claras para o policial por envolver-se nessa análise de autoria da identidade do alvo antes da ação (MacLeod e Grant, 2017).

A assunção de identidades põe em evidência os problemas teóricos relacionados com a ideia de um indivíduo linguístico. Para se tornar uma "persona linguística" diferente, o indivíduo precisa entender não apenas quem aquela persona é, mas também como uma tal persona é criada e transmitida. Isso requer uma análise de performance identitária em cada situação interacional específica e separadamente, e também uma compreensão de como a identidade linguística pode permanecer ao longo de diferentes interações em que contexto, modo de produção e destinatários

N. do T.: Em inglês, "undercover police officers" (UCOs).

1

N. do T.: Em inglês, "Child Sexual Exploitation and Abuse" (CSEA).

2

Ver http://pan.webis.de/clef17/pan17-web/index.html para tarefas de atribuição de

3

podem mudar. Omoniyi (2006) nota que o foco dos modelos interacionistas são os momentos da expressão da identidade, o que vai ao encontro da alegação de Coupland de que a atenção do pesquisador deve ser voltar para momentos e contextos específicos em que pessoas empregam estilos sociais para construir sentidos (Coupland, 2007, p. 3). Precisamos reconhecer que cada texto e cada interação é, na verdade, um momento de expressão de identidade, mas além disso, argumentamos que a própria ideia de uma identidade pessoal também sugere

persistência. Em outras palavras, para que um autor seja identificado, ou para que

uma identidade seja desempenhada com sucesso, é necessário haver alguns elementos da persona que permaneçam estáveis através de diferentes momentos interacionais, e através de diferentes contextos e gêneros.

Uma teoria que propõe que identidades são totalmente negociadas durante as interações terá dificuldades em lidar com a ideia da persistência da identidade pessoal. No trabalho prático, o propósito de assumir identidades em contextos forenses é criar uma persistência na identidade executada, mascarando o fato de que o policial se põe no lugar da criança que estaria ao teclado. A persistência da identidade é extremamente importante para o trabalho de análise de autoria. A atribuição de autoria é essencialmente uma questão de generalização, já que envolve a observação de características linguísticas num conjunto de textos cuja autoria é conhecida e o pressuposto de que essas características permanecerão nos textos anônimos ou naqueles cuja autoria esteja sob disputa. Criar motivos razoáveis para tal generalização pode envolver uma compreensão das "Taxas Básicas" (Turell e Gavalda, 2013) das características linguísticas e um entendimentos das fontes de variação de estilo entre textos de diferentes gêneros e modos de produção. Essencialmente, no entanto, essa premissa pode ser entendida na medida em que a afirmação de que certas características linguísticas refletem uma identidade do autor que persiste através da produção de diferentes textos.

A persistência da identidade pessoal tem sido foco na literatura filosófica há bastante tempo. Noonan (2003) faz uma revisão histórica útil e considera também posições contemporâneas. Pensar sobre esta questão frequentemente começa com enigmas como O Navio de Teseu. Plutarco, que introduz o quebra-cabeça, pergunta-se se o Navio de Teseu continua sendo o mesmo navio, se com o passar do tempo, tábua a tábua, suas partes são substituídas até que, em última análise, nenhuma das madeiras originais permaneça. Uma identidade pessoal fluida que muda de acordo com o contexto e a interação é análoga a esse quebra-cabeça. Se a identidade é performativa e criada através de cada interação e, assim, diferente quando mudam

contextos e destinatários, então tem que haver um questionamento sobre o que, se alguma coisa, permanece igual quando um indivíduo passa a se comunicar com destinatários diferentes em contextos diferentes. A literatura filosófica geralmente destaca a importância da identidade pessoal das memórias e, para muitos filósofos, embora as memórias possam ser perdidas ou apenas parciais, a identidade pessoal é criada através de uma cadeia mnemônica que remonta à infância. Um adulto terá algumas lembranças confiáveis de sua adolescência, os adolescentes têm algumas lembranças confiáveis da infância e assim por diante, até a primeira infância. A identidade persistente, mas mutável, pode ser vista nessa cadeia de memória em que cada elo envolve aspectos da "mesmice" ou da diferença. Diferenças extremas entre um eu infantil e um eu adulto estão ligadas através dessas memórias que mudam lentamente.

A persistência da identidade não requer, portanto, uma identidade estática, imutável. Entretanto, requer mais entendimento sobre quais aspectos da performance identitária permanecem estáveis enquanto os recursos nos quais nos baseamos mudam em cada interação específica. Uma teoria que explique a identidade precisa, então, resolver essas aparentes contradições principalmente para poder ser útil ao linguista forense envolvido com tarefas de autoria.

UM MODELO DE IDENTIDADE LINGUÍSTICA BASEADO EM RECURSOS E RESTRIÇÕES

Como já mencionado, Johnstone (2006) sugere que fatores sociais podem ser vistos como recursos disponíveis para a performance identitária em vez de

No documento Perspectivas em linguística forense (páginas 79-98)