CAPÍTULO 2: CIÊNCIA DA INFORMAÇÃO E INTELIGÊNCIA COMPUTACIONAL –

2.1. A Ciência da Informação

2.1.5. Categorização e classificação

Os processos de categorização e de classificação são processos de ordenamento das informações disponíveis para que, associadas a grupos, possam ser mais facilmente identificadas, nomeadas e recuperadas.

2.1.5.1. A Categorização

Historicamente, a noção de categoria tem sido abordada de modos diversos. Segundo Xavier (2008), o conceito de categorias, como discutido nos dias de hoje, nasceu com Aristóteles, que viveu entre os anos de 384 e 322 a.C.. Categorias é o primeiro dos cinco tratados que compõem Organon, a obra que expõe a lógica aristotélica. Admite-se que este seja o tratado que introduz o conteúdo de todos os outros quatro, Sobre a Interpretação, Analíticos Anteriores, Analíticos Posteriores e Tópicos.

De acordo com Xavier (2008), Aristóteles determinou dez gêneros supremos que constituem as Categorias: substância, quantidade, qualidade, relação, lugar, tempo, posição, posse, ação e paixão. Há quem afirme que Aristóteles não se limitou a esta tabela de categorias. Alguns dos seus discípulos defenderam a ideia de que o número de categorias

proposto pelo filósofo era indeterminado. Estas categorias, segundo Xavier (2008), possibilitavam a ordenação do pensamento, fornecendo elementos para a perfeita caracterização do objeto a ser estudado.

As categorias aristotélicas são, segundo Padre Leme e Lopes, citados por Piedade (1983), a base das categorias gramaticais. A associação entre algumas das categorias pode ser observada no Quadro 1.

Quadro 1 - Relação entre as categorias aristotélicas e as categorias gramaticais CATEGORIAS

ARISTOTÉLICAS

CATEGORIAS GRAMATICAIS EXEMPLOS

Quantidade Adjetivo quantitativo O grande

Substância Substantivo Cavalo

Qualidade Adjetivo qualitativo Castanho

Relação Pronome relativo, adjunto adnominal do cavaleiro

Ação Verbo na voz ativa Está

Maneira de ser Advérbio de modo Arreiado

Duração (Tempo) Advérbio de tempo de manhã

Lugar Advérbio de lugar no pátio

Fonte: adaptado de PIEDADE, 1983

Como destaca Barite (2000), Shiyali Ramamrita Ranganathan levou o conceito da filosofia para a classificação do conhecimento e, para provar que as categorias são o fundamento de qualquer sistema de organização do conhecimento, ele construiu um sistema de classificação, a Colon Cassification (Sistema de Classificação de Dois Pontos), a partir de seus postulados teóricos. Ranganathan (1892-1972), matemático indiano que se tornou bibliotecário, foi um dos estudiosos, segundo Lima (2004), que mais contribuiu para a teoria da biblioteconomia no século XX. Apesar de o sistema de Classificação de Dois Pontos não ter sido aceito por unanimidade, o referencial teórico sobre a análise e síntese de facetas, que relacionava os termos, aplicando um princípio básico de divisão, transformou-se em uma base teórica importante para a análise de assunto. Seu sistema de Classificação de Dois Pontos, publicado em 1933 e republicado em 1957 e em 1967, surgiu de sua insatisfação com os sistemas de Classificação Decimal de Deãey (CDD) e Classificação Decimal Universal (CDU).

Piedade (1983) esclarece que Ranganathan estabeleceu cinco categorias fundamentais com as quais dividia todo e qualquer assunto: Personalidade, Matéria, Energia, Espaço e Tempo, conhecidas pela sigla PMEST, criando um referencial teórico importante no século XX. A categoria “Personalidade” é constituída dos objetos de estudo de uma determinada disciplina. A “Matéria” abrange os tipos de materiais e de substâncias de que são feitas as coisas. “Energia” está associada às ações, às reações, às atividades, aos processos e às técnicas. “Espaço” corresponde às divisões geográficas e o “Tempo”, às divisões cronológicas.

Segundo Lima (2010), foi Eleanor Rosch quem transformou a categorização em uma questão de pesquisa. Rosch desenvolveu seus trabalhos na década de 70 e criou o modelo de protótipo. Baseada na tese de que, no modelo clássico, as categorias são definidas somente pelas propriedades que todos os membros do grupo apresentam, Rosch concluiu que nenhum membro do grupo poderia exemplificar a categoria melhor do que o outro. O princípio fundamental do modelo de protótipo afirma, assim, que as categorias são organizadas em torno de protótipos centrais. De acordo com este modelo, conceitos são representados por um grupo de características e não por suas definições. O agrupamento de conceitos em uma dada categoria se daria pela semelhança com os protótipos, ou seja, aqueles membros da categoria que mais refletem a redundância da estrutura de uma categoria como um todo.

Rosch (1978) propôs dois princípios básicos para a geração de categorias. O primeiro princípio afirma que a função de um sistema de categorias é fornecer o máximo de informação com o menor esforço cognitivo possível. O segundo princípio caracteriza a estrutura da informação gerada e afirma que ela será tanto melhor e mais organizada quanto mais próxima estiver da estrutura que um observador percebe do mundo.

Outros pesquisadores discutiram os conceitos associados aos processos de categorização e classificação. Segundo Jacob (2004), categorização é o processo de dividir o mundo em grupos de entidades cujos membros têm similaridades entre eles dentro de um determinado contexto. Agregar as entidades em categorias leva o indivíduo a perceber ordem no mundo que o circunda. Segundo Barite (2000), as categorias são usadas como ferramentas para se descobrir certas regularidades do mundo material, concluindo-se que todos os objetos, pelo menos os que pertencem ao mundo material, possuem certas propriedades. Barite afirma, ainda, que as categorias são abstrações simplificadas usadas pelos classificacionistas para investigar regularidades de objetos do mundo físico e ideal e para representar noções.

2.1.5.2. A Classificação

A classificação é uma capacidade conceitual humana, que utiliza as categorias como ferramentas. Para Jacob (2004), o processo de classificação envolve a associação ordenada e sistemática de cada entidade a uma única classe dentro de um conjunto de classes mutuamente exclusivas e que não se sobrepõem. É um processo que estabelece ordem ao demonstrar relações entre entidades, tanto explicitamente por meio das definições utilizadas para associar os objetos às classes, quanto implicitamente ao se construir uma estrutura com um relacionamento hierárquico entre as classes.

O processo de classificar é realizado de acordo com um conjunto de princípios estabelecidos que governa a estrutura e o relacionamento das classes. Estes princípios são aplicados sistematicamente na busca de uma reprodução ordenada do mundo real. Segundo Jacob (2004), o processo é artificial, porque é criado com o propósito de estabelecer uma organização significativa, e é arbitrário, porque seleciona uma perspectiva única de domínio, excluindo as demais.

Segundo Alvarenga (2009), há similaridades entre o processo cognitivo de categorização e o processo formal da classificação lógica e, apesar de serem conceitos distintos, se confundem pelo fato de representarem mecanismos utilizados para se estabelecer ordem. A distinção fundamental entre os dois processos reside no modo pelo qual se utiliza o processo na busca do ordenamento.

Alvarenga (2009) ressalta que a classificação tradicional é rigorosa ao ordenar que uma entidade seja ou não membro de uma classe particular. O processo de categorização, no entanto, é flexível e criativo e cria associações não rígidas entre as entidades, baseadas em similaridades observadas dentro de um determinado contexto. A flexibilidade do processo se caracteriza pelo fato de que o contexto pode variar, alterando, assim, as percepções cognitivas do observador.

A classificação é, portanto, um processo posterior ao da categorização e caracteriza uma tentativa do ser humano de associar os objetos que o cercam a objetos já identificados como pertencentes a um grupo específico. Deste modo, os novos objetos são integrados às estruturas já definidas, para que estas estruturas sejam reorganizadas, facilitando a interação do ser humano com os objetos que o cercam e aperfeiçoando o entendimento das estruturas que compõem o mundo em que vive o observador.

No documento Categorização de documentos a partir de suas citações: um método baseado em redes neurais artificiais (páginas 38-42)