• Nenhum resultado encontrado

I. Relatório de Atividades

N/A
N/A
Protected

Academic year: 2021

Share "I. Relatório de Atividades"

Copied!
31
0
0

Texto

(1)

aspectos tecnológicos na construção de um

corpus histórico do português

I. Relatório

de Atividades

M a r i a C l a r a P a i x ã o d e S o u s a

I E L - U n i c a m p

Relatório de Pesquisa

apresentado à FAPESP

Junho, 2006

0 4 / 0 3 4 6 2 - 4

(2)

a p r e s e n t a ç ã o

Este Relatório de Atividades é a Parte I do segundo Relatório Anual de Pesquisa do projeto “Memórias do Texto: Aspectos tecnológicos na construção de um corpus histórico do português” (04/03462-4).

O Relatório de Atividades está organizado em cinco seções:

• A seção I apresenta um breve resumo dos objetivos para o período, dos resultados alcançados, e das perspectivas para o desenvolvimento da pesquisa.

• A seção II apresenta um balanço completo das metas e resultados alcançados entre setembro de 2005 e junho de 2006.

• A seção III apresenta um detalhamento dos resultados quanto à estruturação do trabalho técnico da pesquisa.

• A seção IV apresenta um detalhamento dos resultados quanto à estruturação da reflexão teórica envolvida na pesquisa.

• A seção V aponta as perspectivas para o prosseguimento da pesquisa.

Além deste Relatório de Atividades, o Relatório Anual de Pesquisa é composto ainda pela Parte II – Produtos, em que se apresenta a documentação da preparação de textos para o Corpus Histórico do

Português Tycho Brahe. A documentação divide-se em dois volumes: Edições Críticas Eletrônicas:

Diretrizes e Fundamentos, e Manual de Procedimentos. Este Relatório de Atividades remete aos dois volumes, quando relevante, para o detalhamento do desenvolvimento do sistema de preparação.

(3)

S u m á r i o

a p r e s e n t a ç ã o... 2

I. Resumo ... 4

II. Balanço de Metas e Resultados... 5

1. Resumo Pontual de Metas e Resultados... 5

1.1. Metas Estabelecidas para o segundo ano... 5

1.2 Resultados Obtidos no segundo ano... 6

3. Quadro Resumo Cronológico... 7

III. Detalhamento dos Resultados: Estruturação do Trabalho Técnico... 8

Visão Geral... 8

1. Gestão do Módulo de Preparação... 9

1.1 Reestruturação da Documentação ... 9

1.2 Reestruturação da Equipe... 12

1. Ampliação do Corpus... 13

1.1 Transcrição de Novos Textos... 13

1.2 Adaptação dos textos da Fase I... 13

2. Desenvolvimento do Sistema ... 14

2.1 Diretrizes de Transcrição... 14

2.2 Diretrizes de Edição... 14

2.3 Desenvolvimento da Catalogação... 14

IV. Detalhamento dos Resultados: Estruturação da Reflexão Teórica ... 15

1. Visão Geral... 15

2. Atividade Acadêmica... 16

2.1 Balanço Geral... 16

2.2 Resumo Pontual... 17

2.2.1 Participação em Eventos Científicos... 17

2.2.2 Publicações em Meio Impresso... 17

2.2.3 Experiência Docente... 18

2.2.4 Indicação a Prêmios... 18

3. Preparação do Seminário “Memórias do Texto”... 19

3.1 Esboço Conceitual do Seminário... 19

3.2 Atividades Preparatórias Realizadas... 20

3.2.1 Encontro com o projeto Memórias de Leitura, e II Simpósio de Literatura e Informática... 20

3.2.2 Encontro na I Oficina de Anotação ... 21

3.2.3 Experiência de Anotação Sintática no Seminário Temático de Lingüística Histórica... 21

4. Preparação do Artigo “Memórias do Texto”... 22

4.1 Esboço Conceitual do Trabalho... 22

4.2 Atividades Preparatórias Realizadas... 24

4.2.1 Elaboração do volume “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”... 24

4.2.2 Elaboração do Artigo: “Critical Hipereditions: New Challenges for Text-Critique”... 25

4.2.3 Bibliografia Estudada... 26

V. P e r s p e c t i v a s... 28

1. Objetivos Gerais... 28

2. Plano de Procedimentos... 29

2.1 Gestão dos Trabalhos da Equipe Técnica... 29

2.2 Desenvolvimento do Hipertexto Crítico... 29

2.3 Organização e Realização do Seminário ... 30

2.4 Elaboração do Livro... 30

3. Cronograma... 31

(4)

I. Resumo

A meta principal deste neste segundo ano de pesquisa era dirigir o foco dos trabalhos à edição de textos e à reflexão teórica, paralelamente ao prosseguimento dos avanços técnicos do trabalho de preparação de textos junto ao Corpus Histórico do Português Tycho Brahe.

Os trabahos foram organizados em dois ciclos, conforme proposto no planejamento de atividades realizado em junho de 2005: um ciclo dedicado à estruturação do trabalho técnico, e um ciclo didicado à estruturação do trabalho teórico.

No que se refere à estruturação do trabalho técnico, planejava-se finalizar o sistema de preparação dos textos, lançando uma versão estruturada do Corpus Histórico com acesso a todos os textos no novo sistema, devidamente documentado num Manual de Procedimentos. Além disso, previa-se que o resultado desse trabalho técnico formaria um artigo a ser submetido para publicações da área de tecnologias de texto. Estes dois objetivos gerais foram plenamente atingidos.

Quanto à estruturação da reflexão teórica, planejava-se dedicar o início do ano de 2006 à pesquisa histórica sobre os textos, com vistas à preparação de um segundo artigo, e organizar um seminário em torno dos textos do Corpus Histórico, sob diversos pontos de vista teóricos. Esta vertente da pesquisa avançou consideravelmente neste segundo ano. No decorrer do estudo bibliográfico e das primeiras tentativas de sistematização do artigo sobre os aspectos históricos dos textos, percebi entretanto a necessidade de modificar os objetivos gerais da reflexão teórica. De início, propunha uma reflexão historiográfica sobre os textos do Corpus; neste momento, proponho uma reflexão melhor caracterizada no âmbito da crítica textual.

O terceiro ano da pesquisa será dedicado centralmente ao aprofundamento da reflexão teórica, concretizando-na sob forma de um trabalho a ser publicado como artigo ou como livro, e por meio da realização do seminário.

(5)

II. Balanço de Metas e Resultados

1 . R e s u m o P o n t u a l d e M e t a s e R e s u l t a d o s

1 .1. Meta s Est abelecidas para o segundo ano

O quadro a seguir mostra as metas de trabalho estabelecidas no Cronograma proposto no relatório anterior, de junho de 2005:

Quadro 1: Cronograma estabelecido para o segundo ano de pesquisa:

Final do primeiro ano de pesquisa (Junho a Agosto de 2005):

1. Preparação para o lançamento da Versão Preliminar do Catálogo Dinâmico; 2. Oficina com a equipe do Projeto Memórias de Leitura (agosto, 2005);

Segundo ano de pesquisa (Fase I: Setembro a Dezembro de 2005)

3. Lançamento do Catálogo Dinâmico, Versão Preliminar: setembro de 2005; 4. Seleção e supervisão da transcrição de novos textos;

5. Desenvolvimento do sistema de preparação de textos; 6. Desenvolvimento do Catálogo Dinâmico ;

7. Elaboração do artigo

“Aspectos tecnológicos da construção de um corpus eletrônico do português”.

Segundo ano de pesquisa (Fase II: Janeiro a Agosto de 2006)

8. Lançamento do Catálogo Dinâmico em Versão Completa; 9. Elaboração do artigo

“Memórias do texto: aspectos históricos na construção de um corpus eletrônico do português”; 10. Organização do Seminário “Memórias do Texto”.

Na seção a seguir, pontuam-se os resultados obtidos em cada um dos itens acima.

(6)

1 .2 Res ul tados O bt idos no s egundo ano

1. Preparação para o lançamento do Catálogo Dinâmico (inclui pontos 3, 6 e 8 do quadro acima)

Em setembro de 2005, o Catálogo Dinâmico, em estágio avançado de elaboração, substituiu o catálogo antigo do Corpus Histórico (cf. Seção III.2.2.3).

2. Oficina com a equipe do Projeto Memórias de Leitura

• A oficina foi realizada em agosto de 2005, tendo como repercussão a abertura de uma nova vertente de interação acadêmica para o projeto Memórias do Texto. Como resultado direto deste processo, apresentei o projeto no II Simpósio Nacional de Literatura e Informática, a convite da Profa. Marcia Abreu. (cf. IV.2.2.1 e IV.3.2.1).

4. Seleção e supervisão da transcrição de novos textos

• Neste segundo ano, quatro novos textos foram transcritos, o texto piloto foi terminado, e dois novos conjuntos de documentos estão sendo preparados para inclusão, a partir de transcrições de manuscritos (cf. III.1.1.1).

5. Desenvolvimento do sistema de preparação de textos

• O sistema de preparação está amadurecido, e seu esquema de documetação foi reestruturado (cf. III.2). O sistema foi estendido para a preparação de textos transcritos a partir de originais manuscritos, um avanço consolidado pela realização da I Oficina de Anotação, em conjunto com o grupo de pesquisas do PHPB da Bahia, na UFBa, em abril de 2006. (cf. IV.3.2.2). 6. Elaboração do artigo “ Aspectos tecnológicos da construção de um corpus eletrônico do português ”.

O artigo foi elaborado, sob o título “Metadata and XML standards at work: a corpus repository of

Historical Portuguese texts”, em colaboração com Thorsten Trippel. Foi submetido e aceito em

uma das mais importantes conferências internacionais da área de tecnologias da linguagem (Language Resources Evaluation, LREC); a comunicação foi realizada em 23 de maio, e o artigo será publicado nos anais do encontro (cf. IV.2.2.1).

7. Elaboração do artigo “ Memórias do texto: aspectos históricos na construção de um corpus eletrônico do português

• Dois trabalhos preliminares foram elaborados em preparação para esta meta. A partir de um pequeno artigo sobre “O texto digital” (apresentado na I Oficina de Anotação em Salvador), elaborei o volume “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”. No mesmo âmbito de reflexão, submeti um resumo de artigo para ser apresentado na conferência internacional “Literaturas: Del Texto al Hipertexto”, na Universidade Complutense de Madri. As duas atividades se refletiram no desenvolvimento da reflexão para o artigo (cf. IV.4).

8. Organização do Seminário “ Memórias do Texto

(7)

3 . Q u a d r o R e s u m o C r o n o l ó g i c o

2 0 0 5

A g o s t o

Participação em Evento: Oficina com a equipe do Projeto Memórias de Leitura

Atividade Acadêmica: Início do Curso: Lingüística Histórica, LL 132

S e t e m b r o

Participação em Evento: VI Jornada Alemã de Lusitanistas (Leipzig, 15.09)

Atividade de Pesquisa: Lançamento do Catálogo Dinâmico, Versão Preliminar

O u t u b r o

Participação em Evento: II Simpósio Nacional de Literatura e Informática (Florianópolis, 08.10)

N o v e m b r o

Participação em Evento: V Encontro de Corpora (São Carlos, 25.11)

D e z e m b r o

Atividade Acadêmica: Participação na banca de defesa de tese de doutoramento de Zenaide de Oliveira Novais Carneiro: “Cartas Brasileiras (1808-1904): Um Estudo

Lingüístico-Filológico” (Campinas, 13.12).

2 0 0 6

J a n e i r o

Atividade Acadêmica: Curso Ministrado na III Escola de Verão em Lingüística Formal da América do Sul: Contato Lingüístico e Mudança Sintática. (Campinas, 16.01 – 21.01)

F e v e r e i r o

Atividades de Gestão do Grupo de Pesquisa: Início do Treinamento dos novos integrantes da Equipe Técnica do Módulo de Preparação do Corpus Histórico

M a r ç o

Atividade Acadêmica: Início do Curso: Seminário Temático em Lingüística Histórica (LL 424)

Outras Atividades: Submissão de artigo para o Seminário Internacional Literaturas: Del

Texto al Hipertexto, Universidade Complutense de Madrid, setembro de 2006.

A b r i l

Participação e Organização de Evento: I Oficina de Anotação (Salvador, 18.04 – 21.04)

M a i o

Atividade Acadêmica: Participação em concurso público para o cargo de professor doutor, área de Filologia e Língua Portuguesa, FFLCH-USP (São Paulo, 08.05 – 10.05).

Participação em Evento: V International Conference for Language Resources and Evaluation

(LREC 2006) – representada pelo co-autor (Gênova, 23.05)

(8)

III. Detalhamento dos Resultados:

Estruturação do Trabalho Técnico

V i s ã o G e r a l

Os planos para a estruturação do trabalho técnico incluíam, no relatório anterior, as seguintes metas específicas:

• Metas para seleção e inclusão de novas obras:

• Início da transcrição anotada e edição de novos materiais

Metas para a anotação da estrutura bruta:

• Finalização da adaptação dos 42 textos da primeira fase

• Finalização da transcrição anotada e da edição dos cinco textos selecionados até agora.

• Desenvolvimento de um sistema de controle de versões, com aplicação de uma numeração automática das partes do texto codificadas.

• Metas para a edição dos textos:

• Verificação da consistência e correção da aplicação do novo sistema de edição aos 42 textos da Fase I, resultando em sua finalização completa

Finalização da edição do texto-piloto e desenvolvimento das Diretrizes de

Edição.

Metas para o Catálogo Dinâmico:

Término da versão-teste atual, ou seja: inclusão de todos os 42 textos da Fase

I, com vistas ao lançamento de uma Versão Preliminar em Setembro de 2005;

• Desenvolvimento técnico, incluindo: concepção e aplicação de buscas mais refinadas (incluindo buscas cruzadas); concepção e aplicação de técnicas para a geração de sub-corpora compactados para download; refinamento da categorização por gêneros.

Lançamento de uma Versão Completa, com a absorção dos desenvolvimentos acima, no início de 2006.

Tais metas foram cumpridas satisfatoriamente, como se resume pontualmente em III.1 e III.2 a seguir. Antes disto, em III.1 a seguir, resumem-se alguns pontos importantes relativos à gestão do Módulo de Preparação de Textos neste ano.

(9)

1 . G e s t ã o d o M ó d u l o d e P r e p a r a ç ã o

1 .1 Reest ruturação da Docum entação

Neste ano, foram implementadas algumas mudanças no sistema de documentação do Módulo de Preparação de Textos, tendo sido o antigo Manual de Preparação dividido em dois volumes.

Esta divisão foi realizada por conta do aumento do volume de informações a serem incluídas na documentação. A equipe técnica julgou mais apropriado ter um manual de consulta rápida, para uso cotidiano, em volume separado; este volume é denominado “Manual de Procedimentos”.

Questões conceituais e diretrizes gerais estão no volume separado, sob o título “Edições Críticas

Eletrônicas: Fundamentos e Diretrizes”.

Os quadros a seguir mostram as tábuas de conteúdos de cada volume.

(10)

Conteúdo do “

Manual de Procedimentos

Introdução ao Sistema de Preparação de textos no Corpus Tycho Brahe Objetivos

Histórico

I. Informações Preliminares I.1 Estruturas de Diretório

I.2 Sistema de nomeação dos arquivos I.3 Documentação de Anotação

I.3.1 Gramática da anotação XML no Corpus (DTD) I.3.2 Modelo de Documento .xml

II. Anotações de Transcrição Resumo

II.1 Procedimentos de Transcrição II.1.1 Digitação

II.1.2 Anotação da Estrutura Bruta

II.1.3 Estruturas a serem Anotadas - Resumo II.1.4 Estruturas a serem Anotadas - Aplicação II.1.5 Checagem no browser (debug)

III. Anotações de Edição Resumo

III.1 Procedimentos de Anotação de Edição III.1.1 Revisão das Anotações de Transcrição III.1.2. Elementos de Anotação

III.1.3 Procedimentos de Anotação III.1.4 Procedimentos de Checagem IV. As transformações XLST

IV.1 Procedimentos de Ativação

IV.1.1 Ativação das transformações – via local IV.1.2 Ativação das transformações – via remota IV.2 Programações de Transformação

V. Catalogação Resumo

V.1 Anotação de Catalogação

V.1.1 Esquema da anotação de cabeçalhos V.1.1 Amostra: cabeçalho de um texto do Corpus V.1.3 Exemplo de uma ficha catalográfica V.2 Ativação do Catálogo Dinâmico

V.2.1 Ativação do Catálogo – via local V.2.1 Ativação do Catálogo – via remota VI. Adaptações para os textos da Fase I

1. Histórico

2. Adaptação da anotação da estrutura bruta 2.1 Resumo

2.2 Procedimentos

3. Adaptação da anotação de Edição 3.1 Resumo

3.2 Procedimentos 4. Adaptação dos cabeçalhos 4.1 Resumo

(11)

Conteúdo de “

Edições Críticas Eletrônicas: Fundamentos e Diretrizes

I n t r o d u ç ã o I. Fundamentos

1. O Processamento Eletrônico de Textos 1.1 Conceitos Introdutórios

1.2 A codificação eletrônica da informação 1.3 Breve tipologia dos textos eletrônicos 2. Controle do Processamento Eletrônico

2.1 Motivações para o processamento controlado

2.2 O Hipertexto como forma de processamento controlado 2.3 A linguagem de anotação extendida, ou XML

3. Etapas do Trabalho de Edição Eletrônica 3.1 Procedimentos de Edição – Visão Geral 3.2 Procedimentos da Edição Eletrônica II. Diretrizes de Transcrição

1.Visão Geral

2. Diretrizes para a transcrição de originais 2.1 Normas para a transcrição de originais 2.2 Exemplo: Transcrição de um original impresso III. Normas de Edição

1.Visão Geral

2. Diretrizes para as edições interpretativas 2.1 Normas de Edição Interpretativa 2.2 Exemplo: edição interpretativa

3. Diretrizes para a transposição digital de outras edições

3.1 Exemplo: Transposição Digital de uma edição semi-diplomática 3.2 Normas para a Transposição Digital de Outras Edições IV. Sistema de Apresentação

1. Visão Geral

2. Exemplo da apresentação de um texto editado eletronicamente 3. Fonteiras do Sistema: o Hipertexto Crítico

(12)

1 .2 Reest ruturação da Equi pe

Neste ano, três novos bolsisitas de Capacitação Técnica chegaram ao Projeto Temático, duas delas no regime TT2. Com isto, foi possível reestruturar a equipe, que fundamentalmente se dividiu entre duas alunas trabalhando diretamente na transcrição dos textos (etapa que inclui a digitação e a anotação da estrutura textual), e duas alunas trabalhando na edição de textos.

O quadro a seguir mostra a estrutura atual da equipe e suas atribuições.

Equipe de Transcrição e Estruturação (TT1)

Anna Carolina Garcia de Souza

• Etapa de Anotação Estrutural dos Originais Manuscritos

• Assitência à elaboração da documentação do Manual de Procedimentos

Layâna Castro

• Anotação Estrutural e Adaptação dos textos para as Ferramentas Automáticas

Daiane Moro

• Anotação Estrutural e Adaptação dos textos para as Ferramentas Automáticas

Equipe de Edição (TT2)

Gilcélia de Menezes

Edição de Textos - Originais Impressos

• Assitência à elaboração da documentação das Diretrizes de Edição

Ana Luiza Araújo

(13)

1 . A m p l i a ç ã o d o C o r p u s

1 .1 Trans crição de Nov os Tex tos

Em 2005, quatro novos textos foram transcritos:

Duarte Galvão (1435-1517) : Chronica do muito alto e muito esclarecido principe D. Affonso

Henriques primeiro Rey de Portugal. , 1726 (Ferreira, 1689-1739, ed. Lit). [cód: g_009]

Fernão Lopes: Chronica del Rey D. Ioam I de Boa Memoria e dos reys de Portugal o decimo, 1644.[cód: L_002]

Rui de Pina (1440?-1522?): Chronica do muito alto e muito esclarecido principe Dom Diniz,

sexto rey de Portugal, 1729 (Ferreira, 1689-1739, ed. Lit). [cód: p_002]

Manuel dos Santos (1672-1760 ): Historia sebastica, 1735. [cód: s_002]

O texto piloto foi terminado (integralmente anotado e editado em versão modernizada):

Magalhães de Gandavo: Historia da prouincia de Sancta Cruz a que vulgarmente chamamos

Brasil, 1576 [cód: g_008]

Adicionalmente, novos textos estão sendo preparados para inclusão, a partir de transcrições de manuscritos:

Corpus “Cartas Brasileiras”, editado por Z. Carneiro (UEFS)

Corpus “Atas da Irmandade do Rosário”, editado por Klebson Oliveira (PHBP-UFBa)

1 .2 Adapta çã o dos text os da Fas e I

As metas previam que todos os 42 textos da Fase I fossem inteiramente finalizados entre 2005 e 2006. Entretanto, alguns deles ainda estão em processo de preparação. Este atraso se deve fundamentalmente a uma re-organização do sistema de anotação lingüística automática, que teve impacto direto no sistema de preparação. No âmbito do Módulo de Anotação Lingüística, estão sendo implementadas mudanças importantes no etiquetador automático; este agora requer que os textos sejam enviados de uma nova forma para serem etiquetados.

No sistema anterior, o etiquetador marcava “palavras compostas” com etiquetas compostas:

dele ► dele/P+PRO

No novo sistema, o etiquetador analisará formações como esta separadamente: dele ► de ele ► de/P ele/PRO

A eliminação das etiquetas compostas irá aumentar consideravelmente a performance do etiquetador, e terá ainda conseqüências importantes na análise sintática automática.

Por outro lado, esta inovação implicou em um processo adicional de preparação. Por sobre as edições já realizadas, os textos a serem etiquetados precisam passar pelo processo de separação das palavras compostas, como no exemplo acima (dele ► de ele). Um dos textos foi já preparado nos novos moldes (as Memórias do Marquês de Fronteira e Alorna, a_003); todos os demais textos ainda não etiquetados precisarão ser assim preparados nos próximos meses.

(14)

2 . D e s e n v o l v i m e n t o d o S i s t e m a

2 .1 D iret rizes de Trans crição

As principais metas para o desenvolvimento do sistema de anotação estrutural eram criar um sistema de correspondência automática que permitisse melhor controle de versões, e adaptar as diretrizes para a transcrição de manuscritos.

O sistema de correspondência automática foi desenvolvido: as estruturas anotadas nos textos (sentenças e anotações de edição) estão numeradas, permitindo o controle de versões. A numeração é feita por uma programação automática por mim desenvolvida, gravada como <insert_ids.xsl> no diretório <www.ime.usp.br/~tycho/cgi-bin>.

O sistema foi ampliado para a transcrição de manuscritos. Presentemente, a equipe técnica está adaptando dois conjuntos de manuscritos editados sob forma de “Edições Simi-Diplomáticas” (cf. 1.1 acima), de forma inteiramente integrada ao nosso sistema de anotação.

• O desenvolvimento conceitual do sistema de transcrição está documentado no volume de Fundamentos e Diretrizes, seção II.

• Os procedimentos técnicos de transcrição estão documentados no Manual de Procedimentos, seção II.

• Há uma seção especial sobre a transposição de outras edições para o sistema eletrônico, no volume de Fundamentos e Diretrizes, seção III.3.

2 .2 D iret rizes de Edição

Com o término da edição modernizada do texto-piloto (g_008), foram sistematizadas as Diretrizes que orientarão as edições deste ponto em diante. A aluna Gilcélia de Menezes, bolsista de Capacitação Técnica 2, será a responsável direta pela edição dos quatro novos textos já integralmente transcritos (cf. 1.1 acima).

• O desenvolvimento conceitual do sistema de edição e a sistematização das normas de edição estão documentados no volume de Fundamentos e Diretrizes, seção III.

• Os procedimentos técnicos de edição estão documentados no Manual de Procedimentos, seção II.

2 .3 D es envolvim ent o da Cat al og ação

Neste ano, todos os textos foram incluídos no Catálogo Dinâmico, que compõe agora o sistema principal de acesso ao Corpus (via <www.ime.usp.br/~tycho/corpus/arquivos/catalogo.htm>).

• O desenvolvimento conceitual do sistema de catalogação e apresentação dos textos estão documentados no volume de Fundamentos e Diretrizes, seção IV.

(15)

IV. Detalhamento dos Resultados:

Estruturação da Reflexão Teórica

1 . V i s ã o G e r a l

Esta seção apresenta um detalhamento dos trabalhos de estruturação da reflexão teórica da pesquisa. Os planos para esta estruturação incluíam, no relatório anterior, a preparação de um artigo e a organização de um seminário. Com o caminhar das pesquisas neste último ano, estes planos se desenvolveram de modo bastante interessante; entretanto, o aprofundamento dos estudos neste sentido provocou uma reformulação dos objetivos inicialmente estabelecidos – em especial no que se refere à preparação do artigo.

A idéia inicial do artigo propunha um trabalho de cunho historiográfico, que tomasse como ponto de partida o estudo dos ambientes editoriais em que foram produzidos os textos do Corpus para contextualizá-los historicamente. Neste sentido, o relatório apresentava algumas metas específicas e um levantamento bibliográfico preliminar, com seis títulos sobre a história da formação da norma escrita portuguesa, as reformas ortográficas, e a instituição das tipografias, e obras específicas sobre a questão dos efeitos no texto. Planejou-se, ainda, realizar um cotejo entre algumas obras utilizadas no corpus a parir de re-edições do século 20 e suas edições originais. Com o desenvolvimento desta vertente mais reflexiva dos trabalhos, nestes meses passados, os objetivos mais específicos do artigo foram bastante modificados, como procuro explicitar mais adiante.

Quanto ao seminário, a idéia inicial foi explicitada da seguinte forma no relatório de 2005 :

“O foco do encontro será a reflexão sobre o texto, a partir de diferentes áreas: linguística computacional, linguística histórica, linguística textual, filologia, teoria literária. Um dos objetivos dessa realização será pôr à prova a multiplicidade de usos do Corpus Histórico, e fomentar as diversas perspectivas de reflexão que ele pode propiciar” (cf. Relatório Anual, 10.06.2005)

Com o desenvolvimento da pesquisa neste ano, os objetivos do seminário foram consolidados, e conceituados de modo mais objetivo, como se mostra mais adiante.

Este desenvolvimento será melhor contextualizado, aqui, ao ser precedido de um relato das atividades acadêmicas realizadas ao longo do último semestre de 2005 e até este ponto do ano de 2006. Assim, na seção IV.2 a seguir, procedo à descrição das atividades acadêmicas relevantes; em seguida, as seções IV.3 e IV.4 descrevem, respectivamente, o estado atual da preparação do seminário e do artigo.

(16)

2 . A t i v i d a d e A c a d ê m i c a

2 .1 Balanço G eral

Há três pontos a serem ressaltados nas atividades acadêmicas desenvolvidas até esta altura do segundo ano de pesquisas, quanto ao seu impacto no desenvolvimento da reflexão teórica proposta nesta pesquisa.

O primeiro ponto é o avanço obtido por meio de participações em encontros científicos. Foram especialmente importantes, neste sentido, os resultados da participação no II Simpósio nacional de

Literatura e Informática, e a organização da I Oficina de Anotação junto ao projeto CorPorA. No primeiro

caso, a experiência mostrou as possibilidades de interface deste projeto com o trabalho dos estudiosos da área de crítica literária – uma vertente que, desde o início, tinha como objetivo aprofundar. No segundo caso, a experiência revelou os caminhos que se podem percorrer na confluência entre o trabalho de lingüística computacional e a pesquisa de cunho filológico. Volto aos dois temas na seção 3.

Um segundo ponto que merece ser destacado está relacionado a uma atividade ainda corrente, representada pelo trabalho didático junto ao curso “Seminário Temático de Lingüística Histórica”. A proposta central deste curso foi a de explorar “verticalmente” um texto representativo do Português Clássico, para dar aos alunos a oportunidade de trabalhar com um texto de época e explorar as múltiplas possibilidades de análise lingüística que ele oferecia. Escolhi para isto trabalhar com o texto-piloto editado nesta pesquisa, a “História...” de P. M. Gândavo. O resultado desta experiência, no que toca especificamente os objetivos do projeto Memórias do Texto, é uma repercussão no sentido de uma melhor conceituação da proposta do Seminário. Voltarei a esta experiência na seção 3. Um terceiro ponto a ser destacado remete à minha participação, no início de maio, em um concurso público para uma vaga de docente na Universidade de São Paulo, na área de Filologia e Língua Portuguesa. O resultado imediato do concurso foi negativo, uma vez que meu perfil acadêmico não foi considerado adequado para o cargo. Entretanto, considero que esta experiência teve um desdobramento muito positivo e diretamente relevante para o desenvolvimento deste trabalho de pesquisa. Em função dos estudos realizados para a preparação das provas, reuni uma extensa bibliografia na área da Filologia e da Crítica Textual (listada na seção 4.3.), com a qual tinha pouco contato anterior, em função da minha formação acadêmica mais voltada para a lingüística. O estudo dessas obras de referência, além de possibilitar uma sistematização terminológica para os procedimentos de transcrição e edição dos textos do Corpus, está se revelando como central na elaboração da reflexão teórica planejada neste projeto de pesquisa, ao desenhar um melhor contorno conceitual para a minha reflexão sobre o tema das Memórias do Texto.

(17)

2 .2 Res um o Pontual

2.2.1 Participação em Eventos Científicos

1. “Anotação Xml e Transformação Xslt aplicadas a documentos históricos” Seção da I Oficina de Anotação – Projeto CorPorA

Universidade Federal da Bahia (Ufba), 19 a 22 de abril, 2006

2. “Metadata and XML standards at work: a corpus repository of Historical Portuguese texts”.

Comunicação à V International Conference on Language Resources and Evaluation (LREC 2006). Com T. Trippel.

Gênova, 22 a 28 de maio, 2006.

3. “A Anotação da variação de grafia no Corpus Histórico do Português Tycho Brahe:

Frentes abertas para estudos do léxico”

Participação na mesa-redonda “Linguística computacional e Léxico”, V Encontro de Corpora. Universidade Federal de São Carlos (UFSCar). São Carlos, novembro de 2005.

4. “Memórias do Texto”.

Participação na mesa-redonda “Bibliotecas e bancos de dados digitais de literatura”,

II Simpósio Nacional de Literatura e Informática. Universidade Federal de Santa Catarina (UFSC), Universidade Estadual do Rio de Janeiro (UERJ), Universidade de Brasília (UnB). Florianópolis, outubro de 2005.

5. “Novas perspectivas para antigas questões: A periodização do português revisitada”. Com Charlotte Galves e Cristiane Namiuti.

Comunicação à sessão “Estruturas Gramaticais do Português Europeu”, VI Jornada Alemã de Lusitanistas.

(Viagem financiada pela Fundação C. Gulbenkian e Instituto Camões) Leipizg, setembro de 2005.

2.2.2 Publicações em Meio Impresso

2.2.2.1 Em Capítulo de Livro

1. Lingüística Histórica. Em “Introdução às Ciências das Linguagem: Língua, Sociedade e Conhecimento”. José Horta Nunes, e Claudia Pfeiffer (Orgs.). Campinas, Pontes.

2.2.2.2 Em Periódicos Internacionais

1. The Change in clitic placement from Classical to Modern European Portuguese: Results from the Tycho Brahe

Corpus. Com Charlotte Galves e Helena Britto. Em “Journal of Portuguese Linguistics: Special

Issue on variation and change in the Iberian languages: the Peninsula and beyond”. Vol 4 , n.1. 2006.

2. “Clitic placement and the position of subjects in the history of European Portuguese”. Com Charlotte Galves. Em T. Geerts, I. Van Ginneken & H. Jacobs (orgs.): “Romance Languages and Linguistic Theory: selected papers from ‘Going Romance’ 2003”. John Benjamins, pp. 93-107. 2005. 2.2.2.3 Em Atas de Encontros Científicos

1. “Metadata and XML standards at work: a corpus repository of Historical Portuguese texts”. Com T. Trippel. Em “Papers from the V International Conference on Language Resources and Evaluation (LREC 2006)”.

2. “Novas perspectivas para antigas questões: A periodização do português revisitada”. Com Charlotte Galves e Cristiane Namiuti. Em “Atas da VI Jornada Alemã de Lusitanistas”. No prelo.

(18)

2.2.3 Experiência Docente

2.2.3.1 Cursos Regulares Correntes

Seminário Temático em Lingüística Histórica (LL 424)

Pós-graduação, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, março a junho, 2006.

2.2.3.2 Cursos Regulares Ministrados Lingüística Histórica (LL 132)

Pós-graduação, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, agosto a dezembro, 2005.

2.2.3.4 Cursos Extra-curriculares Ministrados

1. Anotação XML: estruturas, edição, transformações. I Oficina de Anotação – Projeto Corpora

Universidade Federal da Bahia (Ufba) 19 a 22 de abril, 2006

2. Contato Lingüístico e Mudança Sintática,

III Escola de Verão em Lingüística Formal da América do Sul (EVeLin 2005) 16 a 21 de janeiro, 2006.

3. Lingüística Histórica,

II Escola de Verão em Lingüística Formal da América do Sul (EVeLin 2004) 08 a 13 de janeiro, 2005.

2.2.3.5 Participação em Bancas Examinadoras

Membro de Comissão Julgadora de Defesa de Doutorado em Lingüística Candidata: Zenaide de Oliveira Novais Carneiro.

Título da Tese: “Cartas Brasileiras (1808-1904): Um Estudo Lingüístico-Filológico”. Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, 13 de dezembro de 2005.

2.2.3.6 Suplência a Bancas Examinadoras

1. Suplente de Comissão Julgadora de Defesa de Doutorado em Lingüística Candidata: Norma Lúcia Fernandes de Almeida.

Título da Tese: “Sujeito nulo e morfologia verbal no português falado por três comunidades do interior da Bahia”. Instituto de Estudos da Linguagem, Universidade Estadual de Campinas,

14 de dezembro de 2005.

2. Suplente de Comissão Julgadora de Defesa de Doutorado em Lingüística Candidata: Silvia Regina Cavalcante.

Título da Tese: “O Uso de SE com Infinitivas na História do Português: Do Português Clássico ao Português

Europeu e Brasileiro Modernos”.

Instituto de Estudos da Linguagem, Universidade Estadual de Campinas, 27 de janeiro de 2006.

2.2.4 Indicação a Prêmios

Tese de Doutoramento (“Língua Barroca: Sintaxe e História do Português nos 1600”) indicada pelo Instituto de Estudos da Linguagem, Universidade Estadual de Campinas para o prêmio da ANPOLL 2006

(19)

3 . P r e p a r a ç ã o d o S e m i n á r i o “ M e m ó r i a s d o

T e x t o ”

Conforme já esboçado no Projeto de Pesquisa, pretendo organizar um Seminário (com o título provisório “Memórias do Texto”), aberto à comunidade acadêmica. No Projeto, previa-se que o foco do encontro seria a reflexão sobre o texto, a partir de diferentes áreas: linguística computacional, linguística histórica, linguística textual, filologia, teoria literária. Um dos objetivos dessa realização seria pôr à prova a multiplicidade de usos do Corpus Histórico, e fomentar as diversas perspectivas de reflexão que ele pode propiciar.

O decorrer da pesquisa neste ano (em especial, graças à participação em alguns encontros científicos, cf. 3.2), permitiu que que os objetivos do Seminário fossem melhor conceituados, como se expõe a seguir.

3 .1 Esboço Conceit ual do Sem inário

A idéia central deste seminário era, de início, abordar a multiplicidade de perspectivas que podem se abrir para o estudo dos textos do Corpus. O objetivo, agora, se tornou mais específico – abordar a multiplicidade de perspectivas que podem se abrir para o estudo de um dos textos. Escolhi, inicialmente, a obra oratória de Antonio Vieira, reunida em subseqüentes edições de Sermões. Esta escolha preliminar tem duas motivações: primeiro, trata-se de uma obra com fortuna crítica considerável (e uma das vertentes de reflexão é o estudo desta fortuna). Segundo, trata-se de textos em que sabidamente há uma relação extremamente importante entre as construções sintáticas e o estilo de escrita, como eu mesma já discuti em Paixão de Sousa, 20041; e como mostrou Galves, 20022 (e uma das vertentes de reflexão é a relação entre a linguagem e o estilo).

O Seminário seria organizado em torno da obra de Vieira, convidando-se os estudiosos que a examinaram dos pontos de vista histórico, literário, e lingüístico. A questão que unificaria estas perspectivas seria, justamente, quais as relações possíveis que se abrem entre os diferentes estudos. Como o estudo da sintaxe desses textos pode se enriquecer pelo contato com o estudo da história editorial e o estudo literário crítico desta obra? Inversamente, como estudo literário crítico desta obra pode se enriquecer pelo contato com o estudo da sintaxe desses textos ?

Como ponto aglutinador das discussões, estaria colocada a contribuição do projeto Memórias do

Texto: uma versão dos Sermões sob forma de Hipertexto Crítico, em que se reuniriam diferentes

edições da obra, com os comentários de seus editores. Todas as versões estariam integradas por uma análise sintático-textual (nos moldes da que estou realizando para o texto de Magalhães de Gandavo,

1 PAIXÃO DE SOUSA, M. C. (2004) – Língua Barroca: sintaxe e história do português nos 1600. Tese de Doutoramento, Instituto de Estudos da Linguagem, Universidade Estadual de Campinas.

2 GALVES, C. (2002) – Syntax and Style: clitic placement in Padre Antonio Vieira. Santa Barbara Portuguese Studies, v. VI, no prelo.

(20)

cf. 3.2.3 abaixo). Com base nesta edição eletrônica, os participantes seriam convidados a dar suas contribuições em suas áreas. A seguir, um esboço estrutural desta idéia.

Seminário Memórias do Texto – Esboço Estrutural

1. Tema central: Os Sermões de António Vieira – Fortuna Crítica e Lingüística.

2. Objetivos: Reunir estudos sobre os Sermões sob diferentes óticas, buscando as fronteiras de sua discussão integrada.

3. Linhas Temáticas: História Editorial; Fortuna Crítica; Linguagem.

4. Modo de Trabalho: Simpósio, com Mesas Redondas Temáticas (sem seções paralelas).

Os participantes receberão o Hipertexto Crítico da Obra, contendo: - O fac-simile da edição de Miguel Deslandes de 1662 (a partir de

<http://purl.pt/292>)

- uma transcrição conservadora deste fac-simile

- uma edição crítica com o cotejo das seguintes versões (nos Sermões selecionados coincidentes):

VIEIRA, António. Sermões (prefaciado e revisto pelo Rev. Padre Gonçalo Alves). Porto: Livraria Chardron - Lello & Irmão Editores, 1907

PÉCORA, Alcir (ed.), Sermões – Padre Antonio Vieira. São Paulo: Hedra, 2000

- a anotação lingüística do texto

3 .2 Ativ idades Preparat órias Realizadas

3.2.1 Encontro com o projeto Memórias de Leitura, e II Simpósio de

Literatura e Informática

Como preparação para o Seminário, o Primeiro Relatório previa a organização de uma oficina conjunta com a equipe do Projeto Memórias da Leitura (cf. <http://www.unicamp.br/iel/memoria/>), na qual as idéias do projeto Memórias do Texto seriam apresentadas, contando com a colaboração e a experiência daqueles pesquisadores. Esta oficina foi realizada, com grande proveito, em Agosto de 2005. Discutimos ali as possibilidades da reflexão conjunta entre a crítica literária e o trabalho deste projeto, com vistas a um prosseguimento de colaboração (por exemplo, com um trabalho de transcrição do corpus de obras literárias do Projeto Memórias de Leitura, atualmente em formato de fac-similes digitais).

(21)

“Bibliotecas Digitais”, ao lado de pesquisadores dedicados ao estudo genético de obras literárias. Apontou-se, ali, o potencial da técnica desenvolvida para a edição eletrônica do Corpus no sentido de se elaborarem edições críticas (comparando mais de uma versão editorial de uma obra) e edições genéticas (comparando os diversos estados de autoria de uma obra).

Naquela oportunidade, surgiu para mim a idéia inicial do Hipertexto Crítico, uma edição eletrônica em múltiplas camadas que permitisse o acesso a um mesmo texto sob distintas perspectivas de análise.

3.2.2 Encontro na I Oficina de Anotação

Na I Oficina de Anotação, em Salvador, debatemos as possibilidades de trabalho que unisse a experiência filológica do grupo da UFBa com a experiência da lingüística computacional do nosso grupo na Unicamp (cf. <http://www.ime.usp.br/~tycho/corpora/>). A colaboração entre os

dois grupos vem se concretizando na elaboração de um corpus conjunto, com base na edição semi-diplomática das Atas da Irmandade do Rosário, de Klebson Oliveira.

Esta experiência trouxe a abertura de uma perspectiva importante, a de que o sistema de edições eletrônicas desenvolvido neste projeto possa interagir com grupos de pesquisa dedicados aos estudos filológicos e de crítica textual.

3.2.3 Experiência de Anotação Sintática no Seminário Temático de

Lingüística Histórica

No âmbito do curso Seminário Temático em Lingüística Histórica, na pós-graduação do IEL, venho trabalhando com os alunos o texto piloto do meu sistema de edição (História da Província de Santa Cruz), como base para um trabalho de análise sintática intensiva.

Esta experiência revelou dois aspectos que considero importantes. O primeiro é que a análise lingüística de um texto pode se beneficiar imensamente da forma de edição proposta neste trabalho, por dois motivos. De um lado, pela fidedignidade da transcrição e qualidade da interpretação do texto – como ocorreria com edições especializadas em geral, em qualquer técnica. Mas além disso, a edição eletrônica traz o benefício adicional da praticidade. Como o trabalho de análise lingüística pode ser realizado diretamente no arquivo eletrônico que contém o texto interpretado, e dali transportado para programas de planilhas para contagem, etc., a tarefa de lidar com o texto se torna muito ágil.

O segundo aspecto revelado foi a potencialidade de se integrar a análise lingüística como mais um nível de edição, no sistema eletrônico aqui concebido. Sejam os resultados da análise automática previstos no Projeto Temático, sejam os resultados de uma análise humana, as sentenças classificadas segundo critérios sintáticos (por exemplo, com a codificação da ordem de constituintes) podem ser re-integradas ao texto originalmente transcrito, graças à correspondência numérica entre as estruturas anotadas. Desenvolverei uma técnica para esta reintegração, como coroamento da experiência do Hipertexto Crítico.

(22)

4 . P r e p a r a ç ã o d o A r t i g o “ M e m ó r i a s d o T e x t o ”

Como mencionei anteriormente, no decorrer do estudo bibliográfico e das primeiras tentativas de sistematização do artigo sobre os aspectos históricos dos textos, percebi a necessidade de modificar os objetivos gerais da reflexão teórica. De início, propunha um artigo de reflexão historiográfica sobre os textos do Corpus. Neste momento, proponho uma reflexão melhor caracterizada no âmbito da crítica textual, e que seria melhor organizada na forma de um livro. Nesta seção, justifico e explicito esta modificação.

4 .1 Esboço Conceit ual do T raba lho

Os desenvolvimentos recentes das minhas atividades acadêmicas possibilitaram uma delimitação conceitual mais precisa para o artigo Memórias do Texto – e, de fato, uma delimitação mais precisa do objeto de reflexão desta pesquisa como um todo.

O objeto da minha reflexão central nesta pesquisa é o texto escrito e sua modificação ao longo dos processos de edição – portanto, o objeto de estudo próprio da crítica textual moderna, tal como delimitado por obras de referência como Blecua (1987)3 e Cambraia (2005)4. E, de modo específico, a pesquisa se ocupa dos processos de transformação do texto trabalhado no ambiente eletrônico, ou seja, do texto digital. Ao procurar apresentar este trabalho para outros pesquisadores de áreas afins (em especial, filólogos e estudiosos da genética literária), pude perceber que esta é uma linha de reflexão pouco explorada, no âmbito da qual resta ainda muito a ser trabalhado, dos pontos de vista conceitual e metodológico. A consulta criteriosa a obras de referência na área da crítica textual confirmou esta constatação – são poucos os trabalhos dedicados centralmente ao texto digital, do ponto de vista da crítica textual hoje. Ainda mais escassos, senão inexistentes, são os trabalhos sobre o meio eletrônico como ferramenta para o trabalho filológico e crítico5. Parece, portanto, que o texto digital, embora se tenha constituido como tecnologia de amplo uso, ainda não se constituiu integralmente como objeto de reflexão do ponto de vista da crítica. Suas potencialidades como ferramenta da crítica, de outro lado, também têm sido pouco exploradas.

Tomo este estado de coisas como indicador da relevância e atualidade do tema da minha pesquisa, em seu sentido mais metodológico e teórico. Parece ser mais interessante explorar esta vertente de reflexão, que a vertente historiográfica inicialmente pretendida.

3 BLECUA, Alberto. Manual de crítica textual. Madrid: Castalia, 1987.

4 CAMBRAIA, César Nardelli. Introdução à Crítica textual. São Paulo: Martins Fontes, 2005. .

5 Em Crítica Textual e Informática, capítulo da “Introdução à Crítica Textual” de C. Nardelli Cambraia, o autor aborda esse ponto afirmando que “(...) não se pode negar que a difusão da informática – relativamente recente, se se considerar que sua

popularização através de computadores pessoais só se deu em princípios dos anos noventa – tem tido impacto notável sobre o processo de transmissão dos textos” (Cambraia 2005:175); e que “A informática pode ser empregada em todas as etapas da elaboração de uma edição crítica, com maior ou menor proveito, seja no estabelecimento do texto crítico, seja na sua apresentação.” (Cambraia 2005:181).

Entretanto, “Apesar de a informática ter-se infiltrado definitivamente no processo de edição de textos, não seria exagero dizer que seus

(23)

Penso, portanto, que a contribuição mais interessante que esta pesquisa poderá oferecer, no sentido de um resultado final de reflexão, será um trabalho sobre o meio eletrônico como ferramenta para os estudos filológicos e críticos, enquadrado em uma reflexão conceitual sobre o texto digital.

O trabalho irá partir de uma exploração conceitual do texto digital, para em seguida detalhar uma experiência metodológica a que se denominará o “Hipertexto Crítico”.

Este trabalho se diferenciaria do outro resultado final da pesquisa, o artigo sobre os aspectos técnicos da construção do Corpus – este, já bem encaminhado, em parceria com T. Trippel. No artigo com Trippel, focalizo questões eminentemente técnicas, como a natureza da linguagem de anotação escolhida para o Corpus; os mecanismos de catalogação e buscas; as tecnologias de servidor, etc. - é, portanto, um artigo dirigido ao âmbito de interesses das tecnologias de processamento de textos.

Este outro, aqui delineado, será dirigido ao âmbito de interesses da crítica textual, da filologia, e da lingüística histórica (na sua vertente de ligüística de corpus). Esboça-se a seguir uma estrutura inicial para o trabalho.

Esboço Estrutural

I. O texto digital: exploração conceitual

Propõe-se a pergunta: qual a constituição conceitual do texto digital?

Conceito de trabalho: o texto digital se diferencia do texto impresso ou manuscrito fundamentalmente pela mediação da codificação da informação. Esta diferença é central e constitutiva, e indica que o texto digital deve ser considerado sob uma perspectiva conceitual e metodológica própria.

• Discussão sobre o impacto do texto digital na filologia moderna.

• Dimensão instrumental e dimensão teórica do texto digital.

• O problema da fixação do texto no meio digital.

• Texto digital e linguagem

II. O processamento digital: ferramenta de análise textual

Aqui se explora a dimensão do texto digital como ferramenta para a análise lingüística e como ferramenta para a crítica textual.

II.1 Impactos nos estudos filológico e da crítica textual

• O texto digital como instrumento da crítica.

• Desenvolvimento de ferramentas de anotação filológica.

• O Hipertexto Crítico.

II.2 Impactos nos estudos lingüísticos

• O texto digital como instrumento da análise lingüística.

• Formação de corpora para estudos lingüísticos.

• O desenvolvimento de ferramentas de anotação lingüística.

• Corpora eletrônicos da língua portuguesa.

• O debate sobre a normatização da anotação lingüística.

(24)

4 .2 Ativ idades Preparat órias Realizadas

4.2.1 Elaboração do volume “Edições Críticas Eletrônicas: Fundamentos e

Diretrizes”

Ao longo do processo de preparação da I Oficina de Anotação, percebi que seria interessante apresentar o sistema de preparação de textos do Corpus em duas partes – fundamentalmente, fazendo com que a explicação sobre os procedimentos técnicos específicos do Corpus fosse precedida de uma pequena explanação sobre o que é o processamento de textos no meio eletrônico. Preparei, com este objetivo, um pequeno artigo, sob o título “O texto digital”. O artigo foi apresentado na seção inicial do encontro, e obteve grande receptividade. O perfil dos pesquisadores ali presentes era de especialistas da área filológica, dedicados à edição de textos históricos, alguns deles responsáveis por edições de grande renome. Sua receptividade foi, portanto, muito gratificante. E de fato, pude perceber que a partir da apresentação de alguns conceitos básicos sobre o processamento digital, o curso intensivo sobre o sistema de anotação XML e de transformações XLST teve um nível muito elevado de aproveitamento da parte dos participantes.

Diante deste resultado muito positivo, pareceu interessante modificar o sistema anterior do Manual

de Preparação de Textos do Corpus, acrescentando uma parte preliminar de introdução conceitual. Por

sugestão de membros da minha equipe técnica, separei a documentação em dois volumes; de um lado, o Manual de Procedimentos contém informações técnicas de referência (e pode ser consultado de modo ágil pela equipe sempre que necessário); de outro lado, o volume com os fundamentos conceituais e as diretrizes das edições eletrônicas, que funcionaria como introdução ao Manual de Procedimentos.

Neste volume, com o título “Edições Críticas Eletrônicas: Fundamentos e Diretrizes”, foram aproveitados os principais pontos explorados no pequeno artigo “O texto digital”. Absorveu-se, ainda, a parte introdutória do Manual anterior, quando se expunha uma visão geral do sistema de versões do Corpus. Além disso, acrescentaram-se seções mais detalhadas e específias sobre as normas de transcrição e de edição seguidas no Corpus.

Trata-se, ainda, de um trabalho em progresso. Para seu desenvolvimento, venho contando com a colaboração da aluna Gilcéclia de Menezes, bolsista de Capacitação Técnica; o objetivo de seu trabalho de capacitação é o auxílio ao desenvolvimento das diretrizes de edição dos textos – que ficarão a seu cargo a partir deste ponto. Ainda na parte das diretrizes de edição, em breve poderei contar também com a colaboração dos pesquisadores do PHPB da Bahia. Como resultado da Oficina de Anotação, o grupo está preparando uma edição modernizada do corpus “Atas da

Irmandade do Rosário”. É nossa perspectiva que os dois grupos trabalhem conjuntamente no sentido

(25)

4.2.2 Elaboração do Artigo: “Critical Hipereditions: New Challenges for

Text-Critique”

O artigo “Critical Hipereditions: New Challenges for Text-Critique” será apresentado durante o seminário internacional Literaturas: del Texto al hipertexto, organizado pelo “Grupo de Investigación Literaturas Españolas y Europeas del Texto al Hipertexto (LEETHI) de la Universidad Complutense de Madrid”, e pelo “Comité sobre Literatura Comparada en la Era Digital (LCDA) de la Asociación Internacional de Literatura Comparada”. Os objetivos do seminário são assim estabelecidos:

1. Valorar el impacto del hipertexto y el hipermedia en el ámbito literario.

2. Evaluar prospectivamente la presencia de las literaturas en Internet, analizando la estructuración institucional de portales.

3. Estudiar las relaciones de transferencia entre las diferentes literaturas a través de la nueva cultura cibernética.

4. Analizar el alcance de la nueva tecnología sobre la cultura de los individuos en la formación de identidades plurales.

(cf. http://www.ucm.es/info/leethi/seminario/cfp-esp.htm)

Minha comunicação, aceita para a mesa Teorias del Hipertexto, seguirá o seguinte resumo:

“The upsurge of text production and circulation in digital environments has brought renewed

relevance to some of the tasks traditionally carried out in the field of text-critique – in particular, the tasks of establishing the original form of texts, tracing back their subsequent cycles of transformations/alterations, and certifying the autenticity or authorship of texts. Yet “hipertext” is an object still to be fully explored, conceptually and methodologically, in this field. This exploration can start with a basic question: what makes digital texts singular in relation to other forms of writing as regards the material process of their production; the conditions for their reception; the potential cycles of alteration they may endure along the chain of transmission; and the implications of this processing cycle, as a whole, in the nature of the texts? This presentation will explore some lines for this conceptual debate, arguing that digital text production is a breaking point in the history of texts as cultural objects, rather than an incremental point in the evolution of text-production techniques. Digital processing is not a new instrument, but a new process of information codification. With manuscript or printed texts, information codification is processed directly by producers-receivers, given their command of a writing system (albeit with the support of mechanical instruments, such as pens or presses). With digital texts, information codification processing is mediated by artificial intelligence (apart from the support of an instrument, the computer). This mediation poses methodological challenges for text-critique. The field´s scope of action must expand to include this intermediate cycle of procedures (ie.: artificial codification) when considering endogenous or exogenous text alterations. I will present here an experience towards approaching this challenge: the “Critical Hiperedition”, which allows us to control processing marks in digital texts, via hipertext markup languages (more precisely, XML).”

Como se nota, no resumo toco algumas das questões desde o início consideradas centrais nesta pesquisa – como a questão dos ciclos potenciais de alteração dos textos no processo de sua digitalização, e a questão da possibilidade de se “rastrear” tais alterações.

Espero, com a elaboração do artigo completo e sua apresentação, chegar a uma sistematização adequada dessas idéias até aqui esboçadas.

(26)

4.2.3 Bibliografia Estudada

1. ABREU, Márcia (org). Leitura, história, e história da leitura. São Paulo: Fapesp/Mercado de Letras, 2002. 2. ACIOLI, Vera Lúcia Costa. A Escrita no Brasil colônia: um guia para leitura de documentos manuscritos.

Recife: UFPe/Massangana, 1994.

3. ANSELMO, Artur. História da Edição em Portugal. Vol 1: Das origens até 1536. Porto: Lello & Irmão, 1991. 4. BARBOSA, Gerônimo Soares. Grammatica philosophica da lingua portugueza ou Princípios da grammatica

geral applicados á nossa linguagem, 1822. Biblioteca Nacional de Lisboa: edição fac-similar, <http://bdn.bn.pt/memorias>, 20/08/2003.

5. BARRETO, Joam Francisco. Ortografia da lingua portugueza, 1671. Biblioteca Nacional de Lisboa: edição fac-similar, <http://bdn.bn.pt>, 20/03/2003.

6. BARRETO, Luis Felipe. Caminhos do saber no renascimento português. Lisboa: Imprensa Nacional, 1986. 7. BLECUA, Alberto. Manual de crítica textual. Madrid: Castalia, 1987.

8. BRITO, Gomes de: Noticia de livreiros e impressores de Lisbôa na 2ª metade do seculo XVI. Lisboa: Imp. Libanio da Silva, 1911.

9. BUESCO, Maria Leonor Carvalhão. Gramáticos portugueses do século XVI. Lisboa: MEC, 1978.

10. BUESCO, Maria Leonor Carvalhão. Historiografia da língua portuguesa (século XVI). Lisboa: Sá da Costa, 1984.

11. CAFEZEIRO, Edwaldo Machado. O Texto e a Crítica Textual Hoje. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 5, n. 14. <http://www.filologia.org.br/revista/artigo/5(14)77-81.html>

12. CÂMARA JÚNIOR, Joaquim Mattoso. Dicionário de Filologia e Gramática Referente à Língua Portuguesa. Rio de Janeiro: Jose Olympio, s/d.

13. CAMBRAIA, César Nardelli. Introdução à Crítica textual. São Paulo: Martins Fontes, 2005 (Coleção Leitura e Crítica).

14. CARVALHO, Rosa Borges Santos. A Filologia e seu Objeto: Diferentes perspectivas de estudo. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 9, n. 26, Rio de Janeiro. <http://www.filologia.org.br/revista/artigo/9(26)03.htm>

15. CASTRO, Ivo (org). História da Crítica Textual - Materiais de Estudo. Apostila preparada para o Seminário de Lingüística Portuguesa Histórica, Faculdade de Letras de Lisboa. Lisboa: mimeo, 1989.

16. CASTRO, Ivo. Curso de história da língua portuguesa. Lisboa: Universidade Aberta, 1991.

17. CATÁLOGO: Caminhos do Português: exposição comemorativa do ano europeu das línguas. Biblioteca Nacional (org). Lisboa: Biblioteca Nacional, 2001.

18. CHARTIER, Roger. Cultura escrita, literatura e história. Tradução de Ernani Rosa. Porto Alegre: Artmed, 2001.

19. CRUZ, Maria Augusta Lima. Diogo do Couto e a Década 8a da Ásia: Edição crítica e comentada de uma versão inédita. Vols I e II. Lisboa: Imprensa Nacional - Casa da Moeda, 1993.

20. CUESTA, Pilar Vasquez. A Língua e a cultura portuguesas no tempo dos Filipes. Lisboa: Coleção Saber/Publicações Europa-América, 1986.

21. CUNHA, Antônio Geraldo da. Índice do vocabulário português medieval. Vols 1 e 2. Rio de Janeiro: Fundação Casa de Rui Barbosa, 1988.

22. DESLANDES, Venâncio: Documentos para a história da tipografia portuguesa nos séculos XVI e XVII. Lisboa: Imp. Nac.-Casa da Moeda, 1988.

23. DIAS, João José Alves; MARQUES, A.H. de Oliveira & RODRIGUES, Teresa F. Álbum de Paleografia. Lisboa: Estampa, 1987.

(27)

25. EMILIANO, António H. A. Sobre a questão d´'os mais antigos textos escritos em português'. Em CASTRO, Ivo & DUARTE, Inês (orgs.): Razões e Emoção - Miscelânea de estudos em homenagem a Maria Helena Mira Mateus. Vol. 1. Lisboa: Imprensa Nacional - Casa da Moeda, 2003.

26. FÁVERO, Leonor Lopes. As Concepções lingüísticas no século XVIII. Campinas: Editora da Unicamp, 1996. 27. HIGOUNET, Charles. História Concisa da Escrita. Tradução de "L´Écriture", 10a edição, Presses

Universitaires de France, 1997. São Paulo: Parábola, 2003.

28. LAPA, Rodrigues.Historiadores quinhentistas. Lisboa: Seara Nova, 1972.

29. MACHADO FILHO, Américo Venâncio Lopes. A Pontuação em manuscritos medievais portugueses. Salvador: Edufba, 2004.

30. MACHADO, Andréa Abrate Coimbra; Gomes, Nataniel dos Santos. Hipertexto: Uma possibilidade de crítica textual. Philologus - Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 11, n. 31, Rio de Janeiro. <http://www.filologia.org.br/revista/artigo/11(31)05.htm>, 15.03.2006.

31. MARQUILHAS, Rita. A faculdade das letras: Leitura e escrita em Portugal no século XVII. Tese de Doutoramento, Universidade de Lisboa, 1996.

32. MARQUILHAS, Rita. Norma gráfica setecentista: Do autógrafo ao impresso. Coimbra: Instituto Nacional de Investigação Científica (INIC), 1991.

33. MARTINS, Ana Maria. Emergência e generalização do português escrito: de D. Afonso Henriques a D. Diniz. Em Caminhos do Português: exposição comemorativa do ano europeu das línguas - Catálogo. Biblioteca Nacional (org). Lisboa: Biblioteca Nacional, 2001.

34. MATTOS E SILVA, Rosa Virgínia e MACHADO FILHO, Américo Venâncio Lopes (orgs). O Português quinhentista: Estudos lingüísticos. Salvador: Edufba, 2002.

35. MEGALE, Heitor & CAMBRAIA, César Nardelli. Filologia Portuguesa no Brasil. Delta, vol. 15, número especial:1:22. São Paulo, 1999.

36. MEGALE, Heitor. A Demanda do Santo Graal: Das origens ao códice português. São Paulo: Fapesp/Ateliê Editorial, 2001.

37. MELO, Gladstone Chaves de. Iniciação à Filologia e à Lingüística Portuguesa. 6a Edição. Rio de Janeiro: Ao Livro Técnico, Coleção Lingüística e Filologia, 1981.

38. NORONHA, Tito de: A imprensa portuguesa durante o seculo XVI. Porto: Imprensa Portuguesa, 1874.

39. SAID ALI, Manuel. Gramática Histórica da Língua Portuguesa, 2.ª ed. melhorada e aumentada de Lexicologia e Formação das palavras e Sintaxe do Português Histórico, São Paulo, Companhia Melhoramentos de São Paulo, s/d; 3.ª ed. Rio de Janeiro: Livraria Acadêmica, 1964.

40. SANTOS, Antonio Ribeiro dos: Memoria para a história da typografia portugueza do seculo XVI. Lisboa, 1814. 41. SARAIVA, António José & LOPES, Oscar. História da literatura portuguesa. Lisboa: Porto Editora, 17a

edição corrigida e atualizada, 1996.

42. SARAIVA, António José. O Crepúsculo da Idade Média em Portugal. Lisboa: Gradiva, 1988. 43. SARAIVA, António José. Para a história da cultura em Portugal. Vol. II. Lisboa: Gradiva, 1985.

44. SERRÃO, Joaquim Veríssimo. Cronistas do século XV posteriores a Fernão Lopes. Lisboa: Biblioteca Breve, 2a edição, 1989.

45. SILVA NETO, Serafim. Manual de Filologia Portuguesa. 3a Edição. Rio de Janeiro: Presença/MEC, 1977. 46. SILVA, José Pereira da. A Metodologia da Crítica Textual: Análise de algumas edições críticas. Philologus -

Revista do Círculo Fluminense de Estudos Filológicos e Lingüísticos, ano 3, n.8, Rio de Janeiro. <http://www.filologia.org.br/revista/artigo/3(8)16-27.html>, 15.03.2006.

47. TAVANI, Giuseppe. Antecedentes históricos. In: I. Castro, I. Duarte & I. Leiria (orgs.), A Demanda da ortografia portuguesa. Lisboa: Sá da Costa, 1987.

48. VITERBO, Sousa: O movimento tipográfico em Portugal no século XVI : apontamentos para a sua história . Coimbra: Imp. da Universidade, 1924 .

(28)

V. P e r s p e c t i v a s

1 . O b j e t i v o s G e r a i s

Lembro aqui a idéia que constitui a motivação principal desta pesquisa, conforme exposta no projeto do trabalho:

“Um corpus histórico eletrônico pode ser concebido como um conjunto de textos escritos em épocas passadas e reunidos em torno de uma determinada concepção de língua, com o objetivo fundamental de constituir um corpo robusto e tecnologicamente trabalhável de informações que possibilitem análises aprofundadas sobre os diferentes estágios da língua. Os elementos que compõem este corpo de informações percorrem um longo caminho até sua transformação em arquivos computacionalmente estruturados. Neste percurso, os diferentes estágios de processamento imprimem modificações que podem constituir informações importantes para a compreensão do significado histórico e linguístico dos textos. Os rastros deixados nos documentos no caminho entre o momento em que são escritos (à pena de ganso, em pergaminhos...) e sua instrumentação computacional constituem o que chamarei aqui de memórias do texto. Tais memórias podem ser capturadas e codificadas tecnologicamente, e contribuir para a construção do conhecimento que buscamos no legado desses textos”.

No Primeiro Relatório desta pesquisa, lembrei também este trecho do Projeto de pesquisa, para afirmar que “O início de uma reflexão teórica neste sentido será o objetivo central do segundo ano da pesquisa”.

Estando próximo o final deste segundo ano, penso que este objetivo central se concretizou sobretudo na forma dos primeiros passos da reflexão sobre o Texto Digital, e no desenho da idéia do Hipertexto Crítico. Esta reflexão e esta idéia se formaram a partir da preparação de alguns dos trabalhos realizados neste ano e apresentados em encontros científicos. Mais recentemente, a preparação do volume Edições Críticas Eletrônicas: Fundamentos e Diretrizes trouxe uma maior clareza na sistematização dessas idéias – e sobretudo, revelou uma vertente de união entre os trabalhos mais técnicos e a reflexão teórica proposta neste projeto.

Avalio, de fato, que o presente estágio da pesquisa representa seu momento de amadurecimento. Sobre o fundamento dos avanços técnicos obtidos nos primeiros dois anos, e graças ao aprofundamento da reflexão teórica iniciado neste segundo ano em especial, será possível construir resultados profícuos, que justifiquem o percurso percorrido até este momento.

Nesta perspectiva, parece-me relevante prosseguir a pesquisa por mais um ano, período no qual esses resultados poderão ser apresentados de modo concreto – sob a forma da elaboração do livro Memórias do Texto, e da realização do Seminário.

Estes produtos se aliariam ao produto primeiro desta pesquisa – o Corpus Histórico reestruturado – de forma a fazer cumprir a meta primordial deste projeto: mostrar que a construção de um corpus eletrônico pode servir a múltiplos propósitos. Ou, como se mencionou no projeto de pesquisa, mostrar que o destino dessa reunião

Referências

Documentos relacionados

The Anti-de Sitter/Conformal field theory (AdS/CFT) correspondence is a relation between a conformal field theory (CFT) in a d dimensional flat spacetime and a gravity theory in d +

Na apropriação do PROEB em três anos consecutivos na Escola Estadual JF, foi possível notar que o trabalho ora realizado naquele local foi mais voltado à

Here, we aim to understand how expression of RA degradation enzymes (Cyp26) can be correlated with RA distribution and functions during amphioxus (B. lanceolatum)

Além dos fatores conhecidamente associados, o presente estudo revelou que a associação entre a hipertensão arterial crônica e a estratificação do baixo peso ao nascimento

Appendix 1 – Water Supply, Wastewater Management and Municipal Waste systems. Source: ERSAR

Then, taking both primary and secondary data into account a quantitative analysis with multiple alternatives and different weighted criteria was conducted to first determine

No final, os EUA viram a maioria das questões que tinham de ser resolvidas no sentido da criação de um tribunal que lhe fosse aceitável serem estabelecidas em sentido oposto, pelo

Afinal de contas, tanto uma quanto a outra são ferramentas essenciais para a compreensão da realidade, além de ser o principal motivo da re- pulsa pela matemática, uma vez que é