O reconhecimento de palavras é o objetivo último da perceção da fala. Refere-se à capacidade dos ouvintes ativarem e reconhecerem uma expressão ouvida como sendo uma palavra familiar contida no seu léxico mental. A facilidade com que reconhecemos palavras depende de mecanismos de perceção da fala.
O processo de reconhecimento de palavras tem sido explicado com base em dois tipos de modelo, os modelos sequenciais e os modelos de competição lexical.
Nos modelos sequenciais de reconhecimento de palavras, o sistema de reconhecimento processa as palavras recebidas com a máxima eficiência. É o caso da versão inicial da teoria
Cohort (Marslen-Wilson & Welsh, 1978) que se assume enquanto uma descrição qualitativa
22 memorizados no léxico são entidades de processamento computacional ativos. Segundo esta teoria, múltiplos candidatos lexicais são ativados de acordo com a parte inicial de uma palavra, e são depois progressivamente eliminados por input inadequado até restar apenas um único item lexical ativo. (Marslen-Wilson & Welsh, 1978). Assim, uma palavra com um
ponto de unicidade (i.e., o ponto a partir do qual uma palavra alvo é diferente de todos os
outros candidatos lexicais) precoce teria um reconhecimento mais rápido. A versão mais recente desta teoria apresenta diferenças substanciais relativamente à teoria original (Gaskell & Marslen-Wilson, 2002). O acesso lexical deixa de ser considerado um fenómeno de tudo ou nada, sustentando-se que as palavras são ativadas de forma gradual e, esta ativação é, em parte, determinada pela semelhança entre os sinais de entrada e a representação lexical armazenada. Neste contexto, também a importância do início das palavras foi relativizada reconhecendo-se que, desde que seja registada a sequência natural do fluxo de fala recebido, uma palavra pode ser ativada mesmo que o seu início não seja totalmente correspondente ao input acústico (Miller & Eimas, 1995).
Os modelos de competição lexical consideram a segmentação da fala como um subproduto da competição lexical. Segundo esta perspetiva, a concorrência lexical ocorre diretamente entre candidatos a palavra compatíveis com o input. O Trace (McClelland & Elman, 1986) é um dos modelos de competição lexical. Trata-se de um modelo quantitativo, originalmente desenhado para reconhecer a fala a um nível segmental e depois alargado para simular o reconhecimento de palavras. De acordo com este modelo, o reconhecimento de palavras e a segmentação da fala emergem juntos como parte integrante do processo de ativação da palavra. Os mecanismos de ativação e competição permitem a segmentação de palavras sem necessidade de recorrer à ajuda de pistas, fonéticas ou de acentuação, para limites de palavras. No entanto este modelo apresenta algumas limitações. As evidências crescentes do sucesso dos ouvintes na segmentação da fala em línguas artificiais utilizando apenas como informação disponível as características estatísticas da fala (e.g. Fernandes et al., 2007; Saffran et al., 1996; Toro, et al., 2009), mostram claramente que a atribuição restrita da segmentação da fala ao mecanismo de competição lexical é uma teoria muito redutora.
A maior parte da investigação sobre reconhecimento de palavras foca-se na forma como os ouvintes estabelecem relações entre os sinais acústicos que recebem e as suas características fonéticas, como os fonemas, e as palavras, pois a maioria da literatura assumiu unidades deste tipo. No entanto, existem outros fatores não segmentais que têm vindo a ser alvo de investigação, incluindo a prosódia, acentuação e também fatores relacionados com a
23 pronúncia. Além disso, parece estar estabelecido que o reconhecimento de palavras é mais eficaz quando a palavra está inserida num contexto de frase previsível do que quando não tem esse suporte (Samuel, 2011).
Embora permaneça alguma controvérsia relativamente à natureza da corrente de informação que influencia o reconhecimento de palavras faladas, existe alguma unanimidade relativamente ao papel das características fonéticas, ao nível do fonema, e das representações lexicais (Samuel, 2011).
Mattys et al. (2005) propuseram a existência de uma hierarquia, com pistas diferentes a ter impactos diferentes em diferentes condições. Em boas condições de escuta, o reconhecimento de palavras é dominado pelas pistas lexicais, com valor moderado pela fonotática (informação sublexical, de tipo segmental) sendo que a acentuação lexical (informação sublexical, de tipo suora-segmental) se apresenta pouco útil. No entanto, em más condições de escuta, o valor das diferentes pistas sofre uma inversão e a utilização da acentuação lexical é dominante.
Muitas pesquisas têm mostrado que a aprendizagem da leitura e da escrita altera a forma como o cérebro humano processa a linguagem falada (Booth et al., 2004; Dehaene et al., 2010; Perre & Ziegler, 2008) existindo evidências de que a experiência com a forma escrita das palavras parece alterar a natureza das representações lexicais (Ranbom, & Connine, 2011). Este processo ocorre mesmo apesar das diferenças claras entre linguagem oral e leitura: as crianças começarem a falar muito antes de aprenderem a ler e escrever; recorrermos essencialmente à modalidade auditiva para o reconhecimento da linguagem falada enquanto no reconhecimento da linguagem escrita recorremos, essencialmente, à modalidade visual (Perre, Pattamadilok, Montant & Ziegler, 2009).
A capacidade de ler em voz alta e/ou escrever corretamente as palavras pode, à semelhança do que acontece com a segmentação da fala, refletir uma capacidade de deteção de regularidades estatísticas. Aprender a ler e escrever numa ortografia alfabética significa aprender as correspondências entre símbolos visuais arbitrários (no sistema de escrita alfabético, os grafemas) e as unidades linguísticas significativas de uma língua (fonemas). Em línguas em que um mesmo grafema corresponde a mais do que um fonema, o mapeamento entre grafemas e fonemas pode ser pensado como sendo probabilístico (Arciuli & Simpson, 2011). Por exemplo, a letra <c> é normalmente ensinada como correspondendo ao fonema /k/ (e.g. cão), mas existem palavras em que esta letra grafa o fonema /s/ (e.g. cinema). Segundo Arciuli e Simpson (2011), mesmo que apenas a primeira correspondência seja explicitamente
24 ensinada, é provável que as crianças aprendam de forma implícita a segunda como resultado do aumento de exposição à linguagem escrita, tornando-se sensíveis a pistas contextuais como a coocorrência de letras e a respetiva pronuncia (Share, 1995). Assim, pode dizer-se que a AE pode estar relacionada com as competências de leitura de pelo menos duas formas. Por um lado, permite a deteção de correspondências probabilística entre grafemas e fonemas e por outro, permite a deteção de regularidades que existem entre grafemas. Além disso, impulsiona o desenvolvimento de uma série de recursos linguísticos (incluindo o vocabulário) que podem, eles próprios, melhorar a capacidade de leitura.
Nos primeiros anos de alfabetização, qualquer que seja a natureza ou tamanho das unidades envolvidas (grafema-fonema, sílaba, etc.), as representações fonológicas, para as quais vão ser aprendidas as representações ortográficas, pertencem a um sistema funcional previamente estabelecido e especialmente desenvolvido para o reconhecimento da linguagem falada. Reelaborar num nível mais explícito essas representações fonémicas implícitas é um processo cognitivamente difícil e lento. A capacidade para atribuir um rótulo fonémico a um grafema e, ao invés, um grafema a um fonema, e a capacidade para descodificar uma sequência de grafemas enquanto uma palavra exige mecanismos de conversão que se adquirem paulatinamente.
Mais tarde, com o aumento da experiência de leitura, as palavras escritas, podem ser identificadas de forma automática. Esta capacidade tem sido explicada pela possibilidade de ocorrer uma dispensa progressiva da mediação fonológica, passando o acesso às representações correspondentes no léxico mental a ser baseado exclusivamente em informações ortográficas (e.g., Coltheart, Rastle, Perry, Langdon, & Ziegler, 2001). No entanto, outros modelos mais recentes (e.g., Harm & Seidenberg, 2004) propõem que esta capacidade envolve a ativação de representações interconectadas de informação sublexical ortográfica e fonológica. Por outras palavras, esta última proposta sugere que a mediação fonológica está envolvida mesmo na leitura automática e do reconhecimento visual das palavras em paralelo pelo leitor hábil.
As palavras escritas variam no grau de consistência ortográfica (i.e., na relação entre a forma falada - fonologia -) e a forma escrita - ortografia). No Português Europeu (PE), tal como em outras línguas, existem palavras cujas rimas podem ser escritas de mais do que uma forma (e.g., /Ɛl/ em “mel” e “pele”) e palavras cujas rimas fonológicas apenas podem ser escritas de uma forma (e.g., /ɔR/, “morre”, “corre”). Ao contrário de palavras com uma
25 cuja forma fonológica é sempre representada pelos mesmos grafemas; e.g., a rima /il/ é sempre grafada por <il>, como em mil, vil, verosímil), palavras com ortografia inconsistente podem ser representadas por mais do que uma sequência ortográfica, como no exemplo supracitado para as palavras mel e pele.
Durante o reconhecimento auditivo de palavras a ortografia é ativada e, por isso, o grau de consistência ortográfica influencia a perceção da fala (e.g., Perre & Ziegler, 2008; Ventura, Morais & Kolinsky, 2007). Por exemplo, adultos (letrados fluentes) reconhecem de forma mais precisa e rápida, palavras consistentes do que inconsistentes numa tarefa de perceção da fala sem exigências ortográficas (Ziegler, Ferrand, & Montant, 2004).
Este efeito de consistência não resulta de uma confusão devida a diferenças fonéticas entre os itens consistentes e inconsistentes, uma vez que Ziegler et al. (2004) manipularam o grau de inconsistência das palavras mantendo a mesma rima fonológica. Para isso selecionaram pares de palavras monossilábicas inconsistentes que tinham a mesma rima fonológica mas diferiam na probabilidade da relação grafo-fonológica, ou seja, palavras inconsistentes com grafias dominantes e palavras inconsistentes com grafias subdominantes. Os resultados confirmaram o efeito de consistência global, uma vez que os participantes produziram respostas mais rápidas e mais precisas para palavras consistentes e registaram o desempenho mais baixo nas palavras inconsistentes com grafias subdominantes.
Num estudo posterior, Perre et al. (2009) colocaram duas hipóteses sobre o mecanismo pelo qual a ortografia afeta o reconhecimento de palavras faladas. A primeira possibilidade seria a coativação online, isto é, em simultâneo, da informação ortográfica sempre que se ouve uma palavra. Assim, a aprendizagem da leitura e da escrita consistiria na criação de associações fortes e permanentes entre estas duas modalidades da linguagem. A segunda possibilidade assume que a ortografia está intimamente relacionada com a fonologia sendo que durante o processo de aprendizagem da leitura e da escrita a ortografia contamina a fonologia, alterando desta forma a natureza das representações fonológicas. Assim, ao longo do desenvolvimento da leitura, as palavras com ortografia consistente desenvolveriam representações fonológicas mais refinadas do que as palavras com ortografia inconsistente. Embora os resultados obtidos mostrem que o efeito de consistência ortográfica se situa de forma clara numa área fonológica, corroborando assim a segunda possibilidade, os autores colocam a hipótese das duas possibilidades anteriores não serem mutuamente exclusivas deixando em aberto a possibilidade de a aprendizagem da leitura e da escrita alterar, de forma permanente, a natureza das representações fonológicas através da criação de representações
26 fonológicas que refletem grafias consistentes e estas redes serem diretamente ligadas a outras redes visuo-gráficas que são coativadas online.
Perre e Ziegler (2008) utilizaram PREs (medidos por EEG) para controlar a ativação
online da ortografia manipulando a consistência ortográfica quer no início quer no final das
palavras faladas. Os resultados mostraram diferenças nos PREs pré-lexical e lexical entre palavras ortograficamente consistentes e inconsistentes. Em ambos os casos as diferenças nos PREs ocorreram cerca de 200ms após o início da inconsistência, o que fornece uma forte evidência de uma ativação online da ortografia durante o reconhecimento de palavras. No entanto alguns estudos demonstraram, que embora o efeito consistência ortográfica esteja ancorado em inconsistências das unidades sublexical, parece não afetar as representações pré- lexicais, surgindo apenas com estímulos ou em situações que envolvem a ativação lexical. Por exemplo as evidências encontradas em adultos de um efeito de consistência ortográfica tanto no Francês (Pattamadilok et al., 2007; Ziegler & Ferrand, 1998) como em PE (Ventura et al., 2004) restrito a palavras e não observável em pseudopalavras. Para além disso o efeito de consistência também não é observável em tarefas que exigem um menor envolvimento das representações lexicais como é o caso da tarefa de shadowing. Nesta tarefa os adultos tipicamente não apresentaram efeito consistência nem em palavras nem em pseudopalavras (Pattamadilok et al, 2007; Ventura et al., 2004, Ziegler et al, 2004). Também Ziegler et al. (2004) perceberam que, o tamanho do efeito de consistência é decrescente de acordo com a tarefa utilizada (DL, Deteção da rima, Shadowing ).
Por outro lado os trabalhos de Ventura et al. (2008, 2009) mostram que em crianças até ao 5.º ano escolar o efeito de consistência ortográfica se verifica tanto em palavras como em pseudopalavras. Este resultado sugere que pelo menos em PE, a natureza lexical do efeito de consistência ortográfica será precedida por uma fase de natureza sublexical.
Ventura et al. (2007), num trabalho com participantes adultos, verificaram que estes são mais rápidos nas decisões lexicais para palavras do que para pseudopalavras, e registaram uma interação significativa entre lexicalidade e consistência, com o efeito de consistência presente apenas em palavras e não em pseudopalavras. O efeito de consistência ortográfica foi também encontrado em crianças do 2.º ao 4.º ano de escolaridade na decisão lexical auditiva. As crianças produziram mais erros e foram mais lentas na tarefa de decisão lexical para itens inconsistentes, em que a rima pode ser escrita de duas formas, do que para palavras consistentes em que a rima apenas pode ser escrita de uma forma. Além disso, o mesmo efeito de consistência foi encontrado para pseudopalavras. A observação de um efeito de
27 consistência geral, tanto para palavras como para pseudopalavras, na decisão lexical sugere uma ampla influência da ortografia no sistema de reconhecimento da palavra falada das crianças. O efeito de consistência não foi verificado em pré-leitores, garantindo que os efeitos de consistência ortográfica observados dependem exclusivamente da aprendizagem da leitura.
Estes resultados levaram Ventura et al. (2007) considerar duas hipóteses relativas ao curso de desenvolvimento da influência do conhecimento ortográfico no reconhecimento de palavras. A hipótese “lexical tardia”, segundo a qual a ortografia só pode influenciar o reconhecimento de fala quando estão disponíveis representações ortográficas bem especificadas de palavras. Segundo esta hipótese o efeito de consistência apresentaria desde o início o padrão de resultados encontrado em adultos, ou seja, o desempenho no reconhecimento de palavras iria variar em função do seu grau de consistência, mas o mesmo não se verificaria relativamente às pseudopalavras onde o grau de consistência ortográfica não teria qualquer efeito no desempenho na tarefa de decisão lexical auditiva. E a hipótese “início
sublexical”, segundo a qual o padrão adulto seria precedido por uma fase em que o uso
intensivo de procedimentos de transcodificação grafo-fonológicos faz conexões ou associações diretas e fortes entre as representações de novas unidades sublexicais ortográficas e as representações fonológicas já disponíveis das unidades correspondentes, levando a um efeito de consistência generalizado, ou seja, um efeito observado em palavras e pseudopalavra.
Para os autores, a diferença de resultados entre jovens leitores e leitores fluentes explica-se por uma mudança de um mapeamento dominantemente sublexical nos primeiros para um mapeamento dominantemente lexical nos segundos. Embora o conhecimento ortográfico seja menos consolidado, e ativado de forma menos automática em crianças do que em adultos, parece que em crianças o fluxo de informação das representações ortográficas para as representações fonológicas é muito mais generalizado. Num sistema de leitura em desenvolvimento, o uso intensivo de procedimentos de descodificação grafo-fonológica estabelece conexões diretas e fortes entre as novas representações de unidades ortográficos sublexicais e as representações fonológicas já disponíveis das unidades correspondentes, o que resulta no surgimento de um efeito de consistência quer para palavras quer para pseudopalavras. Com o aumento da eficiência de descodificação grafo-fonológica e automatização do acesso a representações ortográficas lexicais, há uma diminuição do fluxo de informações entre fonologia e ortografia sublexicais. A partir deste ponto, as fortes conexões entre as representações ortográficas e fonológicas seriam restritas ao nível lexical e
28 o efeito de consistência para pseudopalavras desapareceria. Assim, o facto de nos primeiros anos de alfabetização, todos os tipos de sequências fonológicas serem influenciadas pela sua ortografia real ou potencial correspondente e, mais tarde, quando os indivíduos se tornam leitores e escritores competentes, apenas o reconhecimento de palavras faladas ser suscetível à influência de ortografia, está relacionado com as diferentes características dos processos de alfabetização precoce e especializada. Ou seja, o grau de eficiência, e provavelmente o conteúdo informativo, das representações fonológicas e ortográficas utilizadas na leitura e na escrita, mudam à medida que estas capacidades aumentam (Ventura, et al., 2007).
Um trabalho posterior procurou responder à questão sobre qual seria o ponto de viragem no desenvolvimento dos efeitos de consistência ortográfica. Ventura et al. (2008) verificaram que o padrão adulto do efeito de consistência era verificável após seis anos de experiência em leitura, desaparecendo nessa altura o efeito de consistência para pseudopalavras.