CAPÍTULO 2: Metodologia e Apresentação dos Resultados
2.2 Desenho do corpus de estudo
Partindo dos quatro pré-requisitos para formação de um corpus computadorizado: ―naturalidade, autenticidade, escolha criteriosa dos textos e representatividade‖ (BERBER SARDINHA, 2004, p. 19), o corpus de estudo (assim denominado por ser dele que serão extraídos os termos) possui o seguinte perfil:
escrito, composto de textos on-line e impressos que foram submetidos à digitalização por meio de scanner;
sincrônico, compreende a década de 1998 a 200827;
de amostragem, planejado para ser uma amostra finita da linguagem especializada em questão.
diversificado, abrange discursos e gêneros discursivos28 variados — científico (artigos, dissertações, laudos29 e teses), divulgação científica (artigos, entrevistas, fôlder e notícias) e instrucional30 (resumo, livros e manual para estudantes de medicina) e com conteúdo especializado, o que implica afirmar que todos os textos integram um (sub)domínio específico, o da (Onco)mastologia.
As tabelas 1, 2 e 3, a seguir, discriminam mais detalhadamente a procedência e quantidade de ocorrências (palavras) de cada gênero que compõe o corpus de estudo.
DISCURSO CIENTÍFICO
ARTIGOS OCORRÊNCIAS
Associação Médica Brasileira e Conselho Federal de Medicina/ Sociedade Brasileira de Mastologia e Federação Brasileira das Sociedades de Ginecologia e Obstetrícia
1.471
Congresso Brasileiro de Conselhos de Enfermagem 1.688
―continua‖ __________________
27 Sendo 2008 o ano em que iniciei minha pesquisa, parti dele a fim de obter dados atuais; não retrocedi para
aquém de 1998 para evitar que o oposto acontecesse: investigação de uma terminologia defasada, já que as pesquisas e descobertas sobre o câncer parecem ter se intensificado, de acordo com o que pude depreender da leitura dos textos do corpus de estudo.
28Vide capítulo 1, seção 1.2.
29 Protocolo aprovado pelo Comitê de Ética em Pesquisa da PUC-SP sob o processo de n.º 173/2009 (vide
Anexos).
30Os discursos e gêneros eleitos para compor o corpus atenderam às recomendações de representatividade
DISCURSO CIENTÍFICO
ARTIGOS OCORRÊNCIAS
Grupo de Estudos de Tumores Hereditários, do Hospital A. C. Camargo
5.310
Portal Clube da Mama 21.202
Portal Mamainfo31 8.690
Portal do Instituto Nacional do Câncer (INCA) 11.739
Revista Brasileira de Cancerologia (INCA) 4.858
Revista Brasileira de Ginecologia e Obstetrícia 2.602
Revista Brasileira de Mastologia 49.945
Revista da Associação Médica Brasileira 1.271
Revista da Sociedade Brasileira de Cancerologia 42.964
Revista da Universidade Federal de Goiás 1.500
Revista de Ciências Médicas e Biológicas, da Universidade Federal da Bahia (UFBA)
1.844 Serviço de Ginecologia do Hospital Universitário Clementino Fraga
Filho, da Universidade Federal do Rio de Janeiro (HUCFF/UFRJ)
729
Total de ocorrências do gênero artigo 155.813
NOTÍCIAS OCORRÊNCIAS
Jornal do Clube da Mama32 25.941
DISSERTAÇÕES DE MESTRADO33 OCORRÊNCIAS
Universidade de Brasília (UnB), Universidade Federal de Ouro Preto (UFOP), Universidade Federal de Pernambuco (UFPE), Pontifícia Universidade Católica de São Paulo (PUC-SP), Universidade Federal do Rio Grande do Norte (UFRN)
63.593
TESES DE DOUTORADO OCORRÊNCIAS
―continua‖ ______________
31 A Associação Nacional de Informação sobre Câncer de Mama é um espaço virtual de apoio e
informação sobre câncer de mama associado a várias instituições voltadas à divulgação da doença, entre elas o International Cancer Information Service Group (ICISG), dos Estados Unidos.
32
Publicação trimestral do portal Clube da Mama (www.clubedamama.org.br), organização civil, sem fins lucrativos, que tem por objetivo promover interncâmbio científico entre profissionais de saúde.
33 Duas, das seis dissertações coletadas, foram parcialmente integradas ao corpus, pois não tinham o
DISCURSO CIENTÍFICO
Universidade Federal do Ceará (UFC), Convênio Rede Centro-Oeste: Universidade de Brasília (UnB)/Universidade Federal de Goiás (UFG)/Universidade Federal de Mato Grosso do Sul (UFMS) e Universidade de São Paulo (USP)
181.120
LAUDOS OCORRÊNCIAS
Mamografia (digital e convencional) e de ultrassonografia 3.953
TOTAL DE OCORRÊNCIAS DO DISCURSO CIENTÍFICO 430.420
Tabela 1: instituições ligadas à área da saúde, das quais foram extraídos artigos, laudos, dissertações e teses que compõem o discurso científico do corpus de estudo. O número de ocorrências, conforme o programa WordSmith Tools 3.0 (SCOTT, 1999)34, totaliza a quantidade de palavras por cada gênero.
DISCURSO DA DIVULGAÇÃO CIENTÍFICA
ARTIGOS OCORRÊNCIAS
Portal ABC da Saúde 2.127
Portal da Associação Brasileira do Câncer 3.112
Portal Consumidor Brasil 1.129
Portal da Federação Brasileira de Instituições Filantrópicas de Apoio
à Saúde da Mama (FEMAMA) 5.539
Portal da Universidade Federal de São Paulo (Unifesp) 1.904
Portal do Hospital Israelita Albert Einstein 871
Portal do Instituto Nacional do Câncer (INCA) 11.883
Portal Farmacêutico Virtual 830
Portal Mamainfo 27.141
―continua‖
______________
DISCURSO DA DIVULGAÇÃO CIENTÍFICA
ARTIGOS OCORRÊNCIAS
Portal Oncoguia 2.622
Portal Medicina e Saúde 765
Revista ABCâncer 2.306
Revista Brasileira de Mastologia 5.317
Revista Carta Capital 3.612
Revista da Associação Médica Brasileira 3.382
Revista Em Foco, do Hospital A. C. Camargo 2.877
Site da ―Clínica de Ginecologia, Mastologia e Cirurgia Plástica
(GINORTE)‖ 5.631
Site ―O que é?‖ 2.604
Total de ocorrências do gênero artigo 83.652
NOTÍCIAS OCORRÊNCIAS
Agência BBC Brasil 391
Portal Mamainfo 17.270
Total de ocorrências do gênero notícia 17.661
FÔLDER OCORRÊNCIAS
Instituto Nacional do Câncer (INCA) 1.082
ENTREVISTAS OCORRÊNCIAS
Portal Mamainfo 1.025
Revista ABCâncer 850
TOTAL DE OCORRÊNCIAS DO DISCURSO DA DIVULGAÇÃO CIENTÍFICA
104.270 Tabela 2: instituições ligadas à área da saúde, das quais foram extraídos artigos, entrevistas, fôlder e notícias que compõem o discurso da divulgação científica do corpus de estudo. O número de ocorrências, conforme o programa WordSmith Tools 3.0 (SCOTT, 1999), totaliza a quantidade de palavras por cada gênero.
DISCURSO INSTRUCIONAL
RESUMO OCORRÊNCIAS
Portal de Mastologia, sob a responsabilidade do Dr. Jorge V. Biazús 5.755
MANUAL OCORRÊNCIAS
Mastologia Prática: guia de orientação, de Luiz Carlos Lins e Michela Carolina Neves Bernz, Blumenau: Ed. da FURB, 1999.
12.807
LIVROS OCORRÊNCIAS
Oncologia para a Graduação, de Ademar Lopes [et al.], 2.ª edição,
São Paulo, SP: Tecmedd, 200835. 3.749
Complicações em Cirurgia: prevenção e tratamento, de Accyoli M. Maia [et al.], Rio de Janeiro: Guanabara Koogan, 200536.
6.481
TOTAL DE OCORRÊNCIAS DO DISCURSO INSTRUCIONAL 28.792
Tabela 3: instituição e obras, respectivamente, ligadas à área da saúde, das quais foram extraídos um resumo e textos de um manual e de dois livros, compondo assim o discurso instrucional do corpus de estudo. O número de ocorrências, conforme o programa WordSmith Tools 3.0 (SCOTT, 1999), totaliza a quantidade de palavras por cada gênero.
Finalizando a soma de ocorrências de cada discurso, o corpus de estudo abrange 563.48237 palavras (tokens), das quais 25.977 correspondem a vocábulos (types), ou seja, são palavras diferentes. A razão entre o número de ocorrências e o número de vocábulos (índice de riqueza vocabular) é de 4,61%, de acordo com o programa WordSmith Tools 3.0.
Trata-se, portanto, de um corpus de dimensão média, conforme a classificação proposta por Berber Sardinha (2004, p. 26).