• Nenhum resultado encontrado

A transcrição de dados

No documento Estudos da Língua Brasileira de Sinais II (páginas 30-33)

ID-Sinais para organização e busca de dados em corpus de Libras

2. A transcrição de dados

Os projetos de pesquisas desenvolvidos desde 1994 sobre a coordena- ção da professora Ronice Quadros sempre envolveram coleta de dados de produção espontânea em crianças adquirindo a língua brasileira de sinais. Os dados coletados fazem parte de um banco de dados para estudos da aquisição da língua brasileira de sinais do Núcleo de Aquisição de Língua de Sinais – NALS. Este banco de dados fica a disposição de pesquisadores brasileiros

2 Esse sistema está disponível para download gratuitamente em <http://tla.mpi.nl/tools/tla-tools/elan/>.

Faz parte de um projeto europeu especializado para transcrição de línguas e tem sido atualizado sistematica- mente na transcrição de dados de línguas de sinais.

3 Esta pesquisa contou com o financiamento do CNPQ por meio deste edital (processo 471478/2010-5) para aplicação dos recursos pelo período de dois anos e por meio de Produtividade de Pesquisa (proces- so 304102/2010-5) para o desenvolvimento da pesquisa pelo período de três anos (2010-2013), portanto, encontra-se em andamento.

que querem investigar a aquisição desta língua. O banco de dados é composto por vídeos e por transcrições com acesso restrito por determinação do con- selho de ética, uma vez que envolve crianças.

Para garantir a pesquisa respeitando as normas do conselho de ética desenvolveu-se um termo de compromisso para o acesso aos dados e desde então, pesquisadores tem acessado o banco de dados para realização de inves- tigações na área de aquisição e linguística da Libras.

A partir de 2006, iniciou-se a utilização do Sistema de Transcrição ELAN (EUDICO Linguistic Annotator). Esse sistema permite a criação, edição, vi- sualização e busca de anotações através de dados de vídeo e áudio. O ELAN favorece a transcrição de vídeos, pois, permite realizar anotações em linhas, denominadas trilhas. Essas anotações estão associadas a trechos dos vídeos, de modo que cada anotação selecionada permite a localização e exibição do vídeo de maneira sincronizada.

O ELAN contribui significativamente para investigações no campo das línguas de sinais, pois essas requerem algum tipo de registro que represente os sinais para servirem como referência para as análises das produções em si- nais. Na maioria dos casos, os pesquisadores de línguas de sinais usam glosas ou alguma forma escrita de sinais. Esse uso tem se tornado central para as análises resultantes destas pesquisas. Como se observa nas investigações de- senvolvidas no ‘Núcleo de Aquisição de Língua de Sinais (NALS)’ e também no grupo de pesquisa ‘Estudo da Comunidade Surda: Língua, Cultura, His- tória’ coordenado pelo professor Leland McCleary na Universidade de São Paulo, assim como nas pesquisas realizadas por Pizzio (2006, 2011), Moreira (2007), Correia (2007), Leite (2008), Barbosa (2009), Anater (2009), Adriano (2010), Nicoloso (2010), Christman et al. (2010) e Souza (2010), só para citar alguns. Nessas pesquisas, a manipulação de vídeos que registram a língua de sinais utilizando diferentes recursos tecnológicos permite a extração de dados antes dificilmente identificados, ampliando os conhecimentos linguísticos da língua. Como observaram Armstrong e colegas (1995):

Looking back, it appears that linguistics was made possible by the inven- tion of writing. Looking ahead, it appears that a science of language and communication, both optic and acoustic, will be enabled, in all probability, not by refinements in notational systems, but by increasing sophistication in techniques of recording, analyzing, and manipulating visible and auditory events electronically. (Armstrong et al., 1995, p. 13-14)

No entanto, os pesquisadores sempre têm referido à falta de uma forma mais padronizada para escrever sinais, bem como as inconsistências resultan-

tes deste fato (por exemplo, Miller 2001, Pizzuto & Pietrandrea 2001). Diante dessa dificuldade, a maioria dos pesquisadores precisa revisar os dados trans- critos ao procederem com as análises. Os vídeos precisam ser consultados sistematicamente, pois as transcrições não são confiáveis. Mesmo assim, as transcrições continuam ser feitas, pois são importantes nas investigações em línguas de sinais. As transcrições servem como base dos dados para a reali- zação das análises e servem também ao pesquisador para organizar e manter uma documentação de todas as decisões para as análises. Idealmente, deve- riam servir para buscar recorrências dos dados que estão sendo investigados. Por exemplo, ao estudar as perguntas QU, o pesquisador poderia colocar a informação recorrente QU e buscar todas as ocorrências em múltiplas ses- sões de dados de várias crianças. Se o sistema de transcrição for padronizado adequadamente tal ação torna-se possível.

As transcrições podem ser ainda melhores, caso seja adotado um con- junto de glosas uniforme para cada sinal (Johnston 2001, 2008; Johnston & deBeuzeville 2008). Nesse sentido, é imprescindível o desenvolvimento de um Identificador de Sinais.

Com o Identificador de Sinais, os transcritores dos vídeos passam a con- tar com uma ferramenta de consulta para inserção de glosas utilizadas de forma mais consistente por vários usuários. Além disso, os próprios usuários podem sugerir a inclusão de novos sinais e respectivas glosas. Dessa forma, o Identificador de Sinais passa a ser alimentado sistematicamente a partir de demandas impostas pelas produções em sinais que estão sendo transcritas. Os transcritores estarão, portanto, escolhendo a glosa do sinal a partir de um identificador de sinais único, ou seja, o Identificador de Sinais da Libras. Dessa forma, a trilha de anotação dos sinais contém sempre as mesmas glo- sas correspondentes aos mesmos sinais, independentemente do transcritor, tornando as transcrições muito mais consistentes.

As glosas que identificam os sinais são uma espécie de etiqueta para o sinal usando uma palavra do português. Apesar da glosa ser constante, pode haver mais de uma tradução possível para o português e o inglês, conside- rando o contexto das ocorrências de um dado sinal. Em nosso modelo de análise o transcritor conta com outras trilhas para registrar as traduções para o português e o inglês das produções transcritas.

Essa forma está de acordo com as orientações de melhores práticas para anotação de línguas de sinais sugeridas por Johnston (2001, 2008). As glosas passam a identificar sinais específicos. Johnston e seus colegas levaram anos para desenvolver um banco de dados para a língua de sinais australiana. O

banco de dados atual conta com duas partes: um dicionário público, disponí- vel online (www.auslan.org.au) e uma versão do sistema de anotação que inclui as glosas dos sinais desta língua.

O Identificador de Sinais desempenha esta função fundamental para a constituição do corpus de sinais da Libras, contendo lista de sinais com in- formações referentes à sua glosa, sua escrita em sinais e a tradução para o português e para o inglês do sinal identificado. Pois, embora existam alguns dicionários disponíveis em Libras, esses não atendem o objetivo proposto para o Identificador de Sinais, uma vez que seu fim é outro. Os dicionários disponíveis apresentam definições e possíveis traduções para o português, mas não o nome (glosa) dado ao sinal. O Identificador de Sinais apresenta esta função específica, além de oferecer o sinal filmado, a versão escrita desse sinal e suas respectivas traduções para o português e a Libras.

Com a disponibilização do Identificador de Sinais, a comunidade cientí- fica que estuda a Libras, bem como outros interessados, tem disponível uma ferramenta metodológica que permite identificar os sinais e suas respectivas glosas para a realização dos registros das produções na Libras.

A constituição de corpora de línguas de sinais utilizando o conceito das identificações de sinais consistentes requer um banco de dados de sinais com suas respectivas glosas. A proposta do Identificador de Sinais de Libras aten- de este requisito, enquanto sistema que contém uma lista de sinais com suas respectivas glosas, organizado de tal forma a facilitar a busca destes sinais e a sua identificação.

No documento Estudos da Língua Brasileira de Sinais II (páginas 30-33)