• Nenhum resultado encontrado

Foto: Olhares

6.4.3 TEMATIZAÇÃO E INDEXAÇÃO

Embora para alguns possa parecer que tematização e indexação sejam a mesma coisa, há uma diferença de objetivos entre as duas técnicas, ainda que ambas utilizem-se dos resultados de uma mesma análise feita para determinada imagem fotográfica. Num processo DAM de organização de fotografias, a tematização é a primeira “consequência” da análise interpretativa, precedendo a indexação e delimitando e direcionando a polissemia da imagem. Além disso, permite que temas aparentemente fora do contexto da fotografia possam ser reunidos a outros temas semelhantes e sejam indexados no banco de imagens. De acordo com Manini (2002a, p. 4)

A fotografia é uma manifestação visual. Nela sempre há um foco central, uma razão de ser que motivou aquela tomada fotográfica. Há que se considerar, contudo, que este motivo central está cercado de informações que a ele se entrelaçam de diversas maneiras.

59

Um “ponto de informação”, na concepção do autor desta pesquisa, é todo e qualquer elemento que oriente a auxilie na análise de uma foto. Vários autores fazem menção a alguns tipos de “pontos de informação”, entre os quais: LEUNG (1992), MANINI (2007), MAIMONE (2007), SMIT (1989), SHATFORD (1994) e KOSSOY (2001).

A tematização inclui determinar, além do foco central, quais outros referentes ou unidades60 dentro do referente terão seus discursos escolhidos para serem indexados e fazerem parte do banco de imagens.

Manini (op. cit., p. 5) tece um comentário interessante sobre a elaboração de resumos para a indexação, o qual pode ser utilizado, por analogia, com a idéia desta pesquisa a respeito do papel da tematização. Substituindo o início da frase pelo texto em negrito entre parênteses pode-se determinar que

O processo de elaboração de resumos (o processo de tematização como técnica de análise) de imagens fotográficas e de levantamento de termos para indexação (esta forma de expressar o conteúdo de um documento e que será, para nós, mais importante que a primeira) estão na base de nossas preocupações, pois é neste momento que o profissional da informação realiza a tarefa mais importante em termos de análise de conteúdo: é a hora de reunir as palavras que farão com que o usuário se interesse – ou não – pelo documento. Como escolher estes conceitos que serão, de fato, uma ponte entre o usuário e a fotografia? (grifo nosso)

Continuando com o texto de Manini, “a polissemia da imagem aponta em várias direções e o profissional da informação deve fazer uma escolha”. Ao fazer a escolha, determinará (tematizará) quais discursos da imagem fotográfica serão ou não considerados na indexação.

É possível escolher o que há de mais importante em termos informacionais como resultado desta leitura da fotografia? Sim, pelo menos sob a ótica da Ciência da Informação; é possível selecionar o que há de mais importante no conteúdo, ainda que para isto seja necessário saber algo mais sobre o conjunto documental do qual faz parte a fotografia (para ratificar informações), a instituição a que pertence e a sua política. Por exemplo, se a imagem do prédio da Hospedaria dos Imigrantes pertencer a um acervo arquitetônico, o termo que designa seu estilo será mais pertinente à Hospedaria do que se a imagem pertencesse ao Museu da Imigração (MANINI, op. cit., p. 11).

Entre os vários fatores61 que irão influenciar os profissionais na determinação de discursos da fotografia e na sua posterior tematização, dois são de grande importância e referem-se: 1) às características do banco de imagens que armazena as fotos; e, 2) às

60

Unidades são partes da fotografia obtidas pelo processo de segregação da imagem, ou seja, pela identificação e separação das partes constitutivas de uma imagem. Podem ser segregadas uma ou mais partes, dependendo da forma como a imagem é percebida ou das suas necessidades de análise. Para que se possa segregar uma figura dentro da imagem, é preciso que esta se destaque em relação às outras que a circundam ou que tenha um conteúdo significativo na foto.

61

funções que a fotografia pode vir a desempenhar quando de seu uso. Para Manini (2002b), além desses fatores,

A representação do conteúdo dos documentos deve ser feita de modo absolutamente comprometido com a área de conhecimento na qual eles serão utilizados e com o público-alvo do serviço de documentação. Este processo de análise do conteúdo do documento é importantíssimo para a recuperação da informação, pois é dela que resultarão a indexação e o resumo (ou a tematização) (negrito nosso)

Utilizando-se de conceitos de Lancaster (2004), verifica-se que a tematização pode levar à “indexação seletiva, que implica o emprego de uma quantidade muito menor de termos, a fim de abranger o conteúdo temático principal do documento”. A indexação de fotografias, quando puder contar com o auxílio inicial da tematização – a partir das características do banco de imagens e das funções a serem desempenhadas pelas fotos –, situa-se, portanto, na categoria de “indexação seletiva” que traz um menor número de termos, ou palavras-chave, ou descritores, mas com uma maior objetividade para a recuperação das fotos. Ainda de acordo com Lancaster (op. cit.)

Para qualquer necessidade específica de informação haverá muito mais itens negativos (não pertinentes ao que se quer) que positivos na hora da busca. Itens positivos estariam acompanhados de uma muralha de itens negativos. (grifo nosso)

A tematização, ao delimitar e direcionar os discursos das fotografias, pode recuperar tantas imagens quantas forem possíveis, com um menor número de itens negativos circundando as imagens pertinentes às necessidades dos usuários. A indexação pode ser, portanto, influenciada pelas ações de tematização feitas anteriormente a ela.

De acordo com Cunha e Cavalcanti (2008) a indexação é

A representação do conteúdo temático de um documento por meio dos elementos de uma linguagem documentária ou de termos extraídos do próprio documento [...] é a descrição do conteúdo de um documento por meio de uma linguagem documentária a fim de facilitar a memorização da informação em arquivos, fichários, bases e bancos de dados [...] indexar é indicar os temas tratados em um texto por meio de palavras-chave, cabeçalhos de assunto, índices de classificação.

De acordo com definição do Wikipedia (2010)

Indexação é atribuir termos ou resumos a um determinado item que facilite a recuperação da informação desejada. Antes de se fazer uma indexação é necessário fazer uma análise do documento. O indexador, depois de fazer a análise do assunto, deverá atribuir termos ou palavras-chave que representem o conteúdo como um todo.

Por indexação da imagem fotográfica entendem-se as atividades desenvolvidas – no âmbito de um sistema DAM – com o intuito de determinar identificadores (palavras-chave, descritores etc.) para os assuntos ou temas de fotos previamente selecionadas e analisadas. A qualidade da recuperação de fotos numa base de imagens está diretamente relacionada à qualidade da indexação. De acordo com Souza (2009, p. 2), “o objetivo de um sistema de recuperação de imagem é operar sobre uma coleção de imagens (indexadas) e, em resposta a uma solicitação (query), apresentar „imagens relevantes‟ segundo os critérios estabelecidos”. Assim sendo, quanto melhor for a qualidade da indexação, maiores serão as chances de se encontrar as fotos desejadas.

Numa imagem fotográfica, após a análise, pode-se verificar a existência de vários discursos com temáticas diferenciadas que se devem à polissemia natural desse tipo de documento. A indexação pode ser feita de maneira ampla na qual cada um desses discursos será indexado com palavras-chave diversas – ou outros tipos de indexadores. Nesse caso, haverá um universo grande de temas indexados, muitos dos quais podem não estar diretamente relacionados aos objetivos e características do banco de imagens, às funções a serem desempenhadas pela fotografia e à área de conhecimento na qual será utilizada ou ao público-alvo do banco de imagens. Configura-se, no caso, uma “supervalorização de termos de indexação”, pois muitos deles serão “supérfluos” em relação ao uso, aumentando os esforços gastos nos trabalhos de indexação e gerando a criação e o armazenamento de descritores e palavras-chave que provavelmente nunca serão utilizadas num determinado banco de imagens.

O uso da tematização como técnica anterior à escolha dos termos de indexação permitirá, por sua vez, que sejam delimitados os temas de interesse, escolhidos assuntos aparentemente não pertinentes à fotografia em questão, os quais serão agrupados com outros assuntos semelhantes e, finalmente, direcionará a foto somente para os temas pertinentes. Isso permitirá um menor esforço de indexação, além de um conjunto de descritores e palavras-chave mais focado com as características do banco de imagens.

Basicamente existem dois tipos de indexação para imagens: indexação por conteúdo, que explora características físicas da imagem e é realizada de maneira automatizada; e indexação por conceitos, que representa as imagens por meio de palavras e pode ser feita manualmente ou automatizada.

As instituições visitadas e os sites de imagens analisados para a elaboração desta pesquisa adotam, sem exceção, a indexação por conceitos. Da mesma forma, os principais softwares para administração e organização de imagens estudados também usam esta sistemática, existindo poucos deles dedicados à indexação por conteúdo. Estes últimos são, todavia, utilizados por alguns sistemas de imagens bem específicos. Na etapa de entrevista para a coleta de dados, apenas um dos profissionais entrevistados tinha conhecimento mais detalhado da indexação por conteúdo, não achando-a, porém, adequada para a indexação de fotos, a não ser no que diz respeito ao uso de similaridade de cores como parâmetro para a busca de imagens de um mesmo tom e, mesmo assim, de forma híbrida com a indexação por conceitos. Os demais entrevistados foram unânimes em reconhecer a incapacidade desse sistema de permitir uma correta e adequada indexação de fotos.

Por indexação por conteúdo entendem-se as tarefas de representar (indexar) uma imagem fazendo uso individual de suas próprias características visuais primárias – entre as quais incluem-se cores, texturas e formas (figuras obtidas a partir da identificação de demarcação de seus contornos) – ou pela combinação dessas características. A recuperação das imagens dá-se por meio de comparações dessas características indexadas com as características propostas pelos usuários em suas queries de pesquisa. Assim, se o usuário busca a foto de um pássaro com determinadas cores, texturas e formas, o sistema fará uma comparação com as imagens existentes no banco selecionando aquelas que possuem as características desejadas. “A ideia básica na recuperação de imagens baseada em conteúdo é que o sistema pode procurar e encontrar em um arquivo as imagens que melhor correspondem a uma dada descrição (das características visuais de uma imagem) fornecida pelo usuário”. (SOUZA 2009, p. 4)

A extração de dados para a indexação por conteúdo é feita de modo automatizado usando algoritmos e outras fórmulas matemáticas, sendo essa tecnologia conhecida pelo nome de Content-Based Image Retrieval – CBIR (Recuperação de Imagens Baseada em Conteúdo). Apesar da existência de pesquisas e experimentos desenvolvidos notadamente por pesquisadores americanos, a CBIR ainda é pouco utilizada devido às suas características e aos problemas a ela relacionados e,

principalmente, à sua incapacidade de analisar descritiva e interpretativamente uma imagem. Algumas pesquisas, entretanto, estão tentando criar sistemas híbridos que possam usar alguns atributos empregados pela CBIR de forma conjunta com a indexação por conceito.

Talvez o maior problema relacionado ao uso da CBIR na indexação seja a dificuldade em descrever e interpretar uma imagem, principalmente em grandes arquivos e em fotos de conteúdo mais complexo. A simples busca por cor, textura ou forma não recupera, por exemplo, uma foto de uma criança chorando sozinha numa praia. Apesar dessa deficiência, alguns usos podem ser feitos de maneira relativamente eficiente em áreas científicas e técnicas, de modo especial naquelas que necessitam de comparações entre imagens.

Indexação por conceitos consiste em atribuir termos62 que possam representar as informações visuais denotativas e conotativas contidas numa imagem fotográfica, permitindo a sua recuperação num banco de imagens. Os termos atribuídos devem representar, com a máxima precisão possível, o conteúdo informacional da imagem, devendo ser tomados cuidados especiais para que se garanta a homogeneidade do banco de dados e para que imagens similares recebam conceitos iguais.

Na maioria dos bancos de imagens, a indexação por conceitos é feita manualmente por uma equipe de analistas/indexadores, de acordo com políticas pré- estabelecidas e segundo os objetivos do banco.

Enquanto a indexação por conteúdo – ainda que possa haver algumas partes textuais – permite a representação apenas do conteúdo visual da imagem (cor, textura e forma), a indexação por conceitos representa por meio de palavras todas as informações contidas na fotografia, sejam elas de cunho identificatório ou representativo de seu conteúdo denotativo e conotativo. A indexação por conteúdo liga-se somente ao DE, e a indexação por conceitos liga-se ao DE e ao SOBRE da fotografia. Assim, por ser a maneira que melhor permite a representação descritiva e interpretativa, a indexação por conceitos é a que deve ser usada para fotografias tematizadas.

A tematização de uma imagem é uma tarefa bastante subjetiva e poderá variar conforme circunstâncias que envolvem não só as características relacionadas à própria foto, mas também, e principalmente, o analista e o indexador. Em vista disso, o banco de imagens deve criar regras e parâmetros que permitam aproximar o máximo possível

62

as visões do pessoal técnico diminuindo as divergências de visão. A centralização das atividades num único local é, normalmente, adotada pelos bancos de imagens que têm representações em vários países. Nas visitas técnicas de coleta de dados para a pesquisa, a Getty Images, por exemplo, informou que as atividades de análise e indexação de suas fotos são feitas todas na Índia para que não haja muitas divergências entre os diversos analistas e indexadores e se possa manter o máximo de coerência possível.

Portanto, quer se adotem mecanismos centralizados ou descentralizados para a tematização, é importante, todavia, a observância padronizada de determinados mecanismos, os quais deverão ser adotados para todas as fotografias incorporadas ao banco de imagens. Entre esses mecanismos está a utilização dos “pontos de informação”, mencionados anteriormente, e a escolha dos discursos existentes na fotografia que serão tematizados, levando-se em conta as características do banco de imagens e as funções a serem desempenhadas pelas fotos.

6.4.4 FATORES QUE INTERFEREM NA TEMATIZAÇÃO DA IMAGEM