• Nenhum resultado encontrado

A Indexação ao Corpus de Origem: Registo Scripto e Registo Audio

1. Objectivos e Procedimentos Metodológicos

1.2. O Corpus de Trabalho

1.2.5. A Organização do Corpus

1.2.5.1. A Indexação ao Corpus de Origem: Registo Scripto e Registo Audio

De forma a poder recuperar no corpus do Português Fundamental (PF) os originais audio das gravações, na Ficha de Indexação, sob o ponto 1.1., surgem informações sobre a sua localização nos arquivos do Centro de Linguística da Universidade de Lisboa (daqui para a frente referido como CLUL). Para tal foi mantido o código inicial das interacções e incluído o do investigador responsável pela recolha dos dados, de acordo com a identificação numérica que consta da publicação do PF.

Quanto ao seu registo audio, referem-se os dois suportes magnéticos do CLUL mais o novo suporte digitalizado em CD a partir da cassete-matriz, o qual será entregue ao Centro de Linguística com a conclusão do presente trabalho. Mencionam-se, ainda, o tempo total da interacção (em relação ao qual foi realizado o levantamento de tópicos conversacionais) e o tempo total de transcrição (que corresponde aos segmentos tópicos seleccionados que permitem cotextualizar o EN). Surge, também, uma avaliação da qualidade da gravação e, nalguns casos, alguns comentários sobre aspectos específicos da gravação em causa, como interrupções, suspensão da gravação, etc.

Observe-se o exemplo seguinte, que corresponde à secção 1.1. da Ficha de Indexação da Interacção com o código C932.

Quadro 1

Indexação ao Corpus de Origem: registos scripto e audio

1.1.CORPUS DE ORIGEM Português Fundamental

1.1.1. COD Origem C 294 1.1.2. Entidade / Investigador CLUL [15]

1.1.3. Registo Áudio Cassete A 53e / Matriz L54b /CD Lisboa 8 (entrevistas – A294) Boa qualidade de audição; dificuldades nas sobreposições de vozes;

Tempo Total da Interacção: 9m 49s

Tempo Total da Transcrição: 0m-1m 43s; 3m 30s-6m7s = 4m

24s

Na secção 1.1. são dadas informações sobre o CORPUS DE ORIGEM da interacção.

28

Na secção 1.1.2. é identificada a entidade responsável pela sua recolha – CLUL – bem como o investigador envolvido – [15-C00] – neste caso o investigador com o n.º 15, que fez gravações na cidade do Porto – C00 –.

Na secção 1.1.3. surgem as informações referentes ao registo audio. Assim, a interacção C294 encontra-se na cassete de consulta com o código A53 e corresponde à gravação indexada com a letra – e – da mesma cassete. Na cassete matriz, tem o código L54 e corresponde à gravação indexada pela letra – b. A gravação foi digitalizada para o CD Lisboa 8 (entrevistas), surgindo sob o código A294. A actual indexação permite identificar uma incongruência no Corpus de Origem quanto ao local de recolha.

Ainda na secção 1.1.3., é feita uma apreciação geral sobre a qualidade da gravação e referido quer o tempo total da interacção – 9m 49s – quer o tempo total da transcrição – 4m 24s. No presente caso, dado que foram identificados e transcritos dois segmentos em momentos diferentes da interacção, este valor corresponde à soma dos tempos de cada um deles. Além disso, é possível saber a que altura da interacção corresponde cada um: o primeiro cobre 1 minuto e 43 segundos contados desde o início da gravação; o segundo segmento transcrito cobre o tempo decorrido entre os 3 minutos e 30 segundos e os 6 minutos e 7 segundos.

1.2.5.2. Caracterização Sociolinguística da Interacção

Como foi referido acima, o cabeçalho da Ficha de Indexação inclui, a par da localização geográfica da recolha realizada e da data em que tal ocorreu15, todo um conjunto de informações com que se pretende (macro-)contextualizar o tipo de interacção em causa.

Domínio: de acordo com a maior ou menor proximidade entre interlocutores (que se reflecte nas relações pessoais, nas formas de tratamento, nos conhecimentos partilhados e no envolvimento pessoal na conversação) foram definidos os seguintes domínios de interacção: privado informal – pi – e privado semi-formal – psf –.

15

Embora no presente exemplo tenha sido encontrado o ano da gravação, na maioria das interacções apenas foi possível estabelecer que se trata do início dos anos 70. Nesses casos o último dígito da data é substituído por um ponto interrogação: – 197? –

29

Área Temática: após uma primeira leitura de todos os Enunciados Narrativos recolhidos, foram definidas as seguintes áreas temáticas – casa e família; profi (profissão); vida-pessoal e vida social – que estão directamente relacionadas com os Tópicos de Conversação.

No Quadro 2, elaborado a partir do Corpus Global, é possível observar o tipo de temas que podem ser realizados no âmbito de cada uma das áreas temáticas superiores.

Quadro 2

Áreas Temáticas dos ENs  casa e família

1. relação marido / mulher 2. relação pais / filhos 3. relação entre irmãos

4. relação com outros familiares 5. relação donos da casa / empregados 6. histórias da casa 7. humor  vida pessoal 1. relações amorosas 2. relações de amizade 3. estudos 4. tempo livre 5. imagem de si 6. acidentes 7. doenças  vida social

1. relação cidadão –Estado 2. relação pais – professores 3. questões socioeconómicas 4. visão do outro 5. racismo 6. humor  vida profissional 1. percurso profissional 2. relações profissionais 3. caracterização da actividade 4. histórias da profissão

Uma ressalva para as narrativas de cariz humorístico: como surgem alguns exemplos de narrativas de experiência pessoal deste tipo, ligadas a diferentes áreas temáticas, decidiu-se juntar a este grupo os três exemplos de Anedotas que ocorrem no Corpus, que, de outra forma, teriam que ser excluídas por não caberem em nenhuma das áreas temáticas estabelecidas. Como se pretende, numa investigação futura, retornar a este género da oralidade, decidiu-se mantê-las, provisoriamente, sob a categorização temática das interacções em que são realizadas.

Área Geográfica: os ENs foram recolhidos em interacções referentes aos distritos do Porto (código C) e de Lisboa (código A).

30

Exemplificando, o consultor do Corpus pode tirar as seguintes informações ao observar o ponto 1 (Cabeçalho) da Ficha de Indexação:

Quadro 3

Cabeçalho da Ficha de Indexação

1. A INTERACÇÃO COD: C294 pi-casa e família

LOCAL: Porto DATA: 1970

DOMÍNIO: privado – informal – casa e família – relação marido / mulher – humor N.º PALAVRAS: 1118

O CÓDIGO da Interacção – C294 pi-casa e família – é composto pelo código do corpus de origem – C294 – acrescido de informações sobre o DOMÍNIO – pi (privado informal) – e sobre a ÁREA TEMÁTICA – casa e família.

De seguida, pode obter informações sobre o LOCAL e a DATA da recolha, no presente exemplo o distrito do Porto e 1970, respectivamente.

Sob a denominação DOMÍNIO, surge a explicitação da segunda parte do CÓDIGO, incluindo agora mais informações sobre os conteúdos temáticos – relação marido / mulher – e intencionalidade – humor (valor perlocutório: fazer rir) – dos EN(s) em causa. Por último, obtém a informação do N.º DE PALAVRAS TRANSCRITAS, no presente caso, 1118.

Desta forma, adquire-se uma ideia geral quer sobre o Contexto quer sobre o Conteúdo do(s) EN(s) trabalhado(s). Ao mesmo tempo, é-se informado da extensão do segmento da interacção transcrito.

De seguida, passa-se para a caracterização sociológica dos participantes na interacção.

31 Quadro 4

Secção 1.2. da Ficha de Indexação: Caracterização dos interlocutores na interacção

1.2. PARTICIPANTES

1.2.1. Número 3

1.2.2. Caracterização sócio-cultural Narrador: *ANT Narratário-entr.: *JN Outro(s): *LEO 1.2.2.1. Idade 30 Faixa etária: 20 28

F 3 L A00 00 1.2.2.2. Género M M 1.2.2.3. Nível de Instrução 6 6 1.2.2.4. Grupo Profissional A A 1.2.2.5. Localidade de Residência A00 ?

1.2.2.6. Influências Linguísticas ? Dist. Origem: L01

1.2.2.7. Outras características do narrador

Engenheiro de máquinas com o curso de filologia românica. Uso de idiomatismos – fazer fitas – e expressões coloquiais como pá, género pontapé nas costas, que revelam à vontade na interacção.

Na secção 1.2., surgem as informações referentes aos PARTICIPANTES na interacção. Na subsecção 1.2.1. é referido o número de intervenientes e na 1.2.2. é feita a caracterização sociocultural do Narrador e do Narratário principal, de acordo com os dados disponíveis nos ficheiros do Corpus do PF. As informações recolhidas resultam da comparação dos dados existentes nas fichas de transcrição originais com as informações anotadas nas fichas individuais de cada um dos sujeitos seleccionados para o levantamento do corpus. Nos casos em que faltam informações, surgem pontos de interrogação no espaço previsto para a sua inserção.

Nas secções 1.2.2.3. e 1.2.2.4., as informações são apresentadas de acordo com a categorização do Corpus de Origem. Assim, o Narrador ANT tem um Nível de Instrução de grau 6, que corresponde à detenção de um diploma académico, e pertence ao Grupo Profissional A, que engloba as Profissões Liberais, Técnicos e Equiparados. Se o Narratário JN pertence aos mesmos escalões de categorização nos dois itens em causa, a terceira pessoa envolvida na interacção, LEO, tem um Nível de Instrução de grau 3, que equivale ao terceiro ciclo do ensino básico (8. e 9. classes) e pertence ao Grupo Profissional L que inclui as Donas de Casa, Mulheres-a-dias e Empregados Domésticos. É de realçar que, normalmente, não existem dados disponíveis para a caracterização de outros intervenientes na interacção para além do informante principal

32

e do responsável pela recolha. Pontualmente, surge alguma referência ao laço de ligação afectiva com o primeiro. Neste caso, a caracterização só é possível porque a parte da interacção em que LEO domina o espaço comunicativo foi aproveitada posteriormente como unidade autónoma de análise com o código A560 pi-vida pessoal.

As informações referentes à secção 1.2.2.6. pretendem dar conta das influências de outras variantes dialectais sempre que o falante tenha residido mais de dois anos num outro local. O único interveniente na interacção para o qual há dados disponíveis, LEO, não sofreu nenhuma influência.

Mesmo que toda esta informação não venha a ser considerada como variável a ter em conta na presente investigação, considerou-se relevante para a constituição do presente corpus recolher todos os dados disponíveis no CLUL sobre os participantes das interacções. Dada a morosidade e exaustividade do trabalho de transcrição da oralidade, pretende-se, assim, facilitar e promover a sua utilização em futuras investigações e a partir de outras perspectivas de análise.

Retornando à Ficha de Indexação, na secção 1.2.2.7. teve-se em conta dois tipos de dados: aqueles que explicitam a classificação do narrador nas secções 1.2.2.3. e 1.2.2.4., bem como usos linguísticos que, de alguma forma, marcam idiossincraticamente o seu discurso e/ou contribuem para caracterizar o registo adoptado. Este tipo de informações, recolhidas na totalidade da gravação, é relevante para a indexação da interacção ao domínio privado informal (ver no Cabeçalho a entrada Domínio).

No bloco seguinte, referente à secção 1.2.3. da ficha, são avançados dados relevantes para a identificação da relação entre os interlocutores. Estes dados são fundamentais para a caracterização da situação de interacção e para a sua indexação a um determinado DOMÍNIO. A par do estabelecimento da relação socioafectiva entre os interlocutores, consideraram-se também marcas linguísticas de tratamento que podem corroborar informações disponibilizadas pelo investigador do PF a este respeito, ou fundamentar uma categorização dessas relações no caso em que não haja informações disponíveis.

33 Quadro 5

Secções 1.2.3. e 1.2.4. da Ficha de Indexação: Relações entre os interlocutores

1.2.3. Relação entre os participantes

1.2.3.1. Familiares *ANT-*LEO (casal) 1.2.3.5. Desconhecidos - 1.2.3.2. Amigos *JN- *ANT -*LEO 1.2.3.6. Relação Hierárquica

1.2.3.3. Colegas 1.2.3.7. Relação decorrente da Sit. Enunciação

1.2.3.4. Conhecidos 1.2.3.8. Outra

1.2.4. Formas de tratamento

Segunda pessoa *ANT *LEO – tu tens o descaramento de dizer

(...); não me puxes pela língua //

*ANT  *JN – mas tu não conheces Sevilha ? Terceira pessoa com ou sem

pronome sujeito

*JN  *LEO – vá lá buscar o casaco / *LEO  *JN – percebe?

Terceira pessoa com forma nominal *LEO  *JN – comprei um casaco tão giro / Alçada // Fórmulas de delicadeza/deferência

Assim, no presente exemplo, à relação de casal entre ANT e LEO correspondem formas de tratamento da segunda pessoa. Também a relação de amizade entre ANT e JN é pautada pela mesma forma de tratamento, enquanto que aquela que une LEO a JN revela um maior distanciamento, que é marcado pelas formas de terceira pessoa, com e sem forma nominal. Estes dados são confirmados no próprio desenvolvimento da interacção pelos papéis assumidos por cada um dos interlocutores: a intimidade entre o casal permite a ANT relatar dois episódios de cariz humorístico passados com a mulher. Além disso, há uma notória cumplicidade entre os homens na avaliação do narrado, cumplicidade que não é partilhada por LEO.

Na secção seguinte da ficha, referente ao ponto 2., é feita a caracterização da Situação de Enunciação, tendo em conta dois tipos de informações:

Informações relativas ao CONTEXTO: se disponíveis, são referidas informações que permitam identificar o espaço físico em que ocorre a interacção. Além disso, procura-se estabelecer o maior ou menor grau de proximidade (ou distância) entre interlocutores e o à vontade com que participam na conversação.

Informações relativas ao COTEXTO: foi feito um levantamento de todos os Tópicos Conversacionais da interacção identificando os EN(s) transcritos (que surgem sublinhados) e a sua relação com o discurso anterior e posterior.

34 Quadro 6

Secção 2 da Ficha de Indexação: A situação de enunciação

2. SITUAÇÃO DE ENUNCIAÇÃO

Não é possível identificar com exactidão o espaço físico. Pela inexistência de ruídos de fundo, pode-se concluir que os interlocutores se encontram num espaço fechado, provavelmente a casa do casal, uma vez que a mulher, a dada altura, vai buscar um casaco que comprou em Espanha.

Os interlocutores estão muito à vontade, especialmente *ANT. O registo informal e coloquial do narrador revela o seu à vontade em relação à situação de enunciação.

Tópicos da conversa: ida a Sevilha – altura em que foram – lugares que visitaram – saídas e

compras – relação com a cidade – os amigos que visitaram – episódio que aconteceu à mulher no armazém dos Preciados – lugar onde ficaram – lugares onde comiam – pequeno almoço – referência à entrevista – referência a um programa cultural – bairros de Sevilha – ida ao cinema (descrição) – comentários sobre o anfitrião – situação de entrevista – possibilidade de ir a Sevilha – compras – episódio da compra do casaco – o Corte Inglês – apresentação do casaco – retoma da avaliação da narrativa – comentários sobre o casaco – compra de roupa – (im)possiblidades de ir ao flamenco – idas ao cinema – comentários sobre os anfitriões – compras com o anfitrião – imposição de andar com o anfitrião – comparação de Espanha e Portugal pelo anfitrião – as repetições do anfitrião – comentários positivos sobre os anfitriões.

Documentos relacionados