• Nenhum resultado encontrado

5 TRATAMENTO DE DADOS

5.1 Definições

O que é um Arquivo (File) ou Conjunto de dados (Data Set)

Um arquivo VantagePoint (.vpt) contém todos os requisitos para um dado conjunto de documentos. A criação e uso de um arquivo VantagePoint é ilustrado no diagrama a seguir (Fig. 37):

Fig. 37. Diagrama da criação e uso de um arquivo VP

O usuário consulta uma base de dados bibliográficos e recebe dados bibliográficos brutos, sem tratamento. Quando um arquivo de dados bibliográficos brutos é importado para o VantagePoint, o pré-processador analisa o texto da seguinte maneira:

a. Primeiro, o texto é dividido em registros individuais. Um registro é o maior segmento individual de informações no arquivo. Um arquivo de dados brutos é composto por vários (dezenas, centenas, ou talvez milhares) registros, cada um dos quais tem uma estrutura similar.

b. Então, o pré-processador divide cada registro em campos. Para a maior parte, cada registro contém a mesma estrutura de campo (por exemplo, título, autores, palavras- chave, resumo, etc.). Em raras ocasiões, um registro pode estar sem algum campo específico.

c. Em seguida, o pré-processador divide os campos de texto (por exemplo, o resumo e o título) em palavras ou frases, e cria um novo campo para cada um deles (por exemplo, palavras do título, palavras do resumo e frases do resumo).

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 31

d. Finalmente, o pré-processador cria uma base de dados sobre todos os conteúdos dos campos para todos os registos. Por exemplo, se a palavra "química" é encontrada em pelo menos um registro, então a palavra "química" é inserida no banco de dados, ligando essa palavra a todos os registros que contém "química".

O que são registros ou campos?

A forma mais básica de dados brutos no VantagePoint é um registro bibliográfico. Em bases de dados bibliográficos, um registro consiste em um único resumo de um artigo científico ou documento técnico, juntamente com a informação associada (por exemplo, o título, os nomes dos autores, a afiliação do autor principal, a data de publicação, etc.). Cada tipo de informação no registro é um campo. A Figura 38 mostra uma ilustração de um único registro bibliográfico, onde os campos são: autores [Arthor(s) AU], afiliação institucional [Affiliation AF], título [Title TI], revista [Journal JN], data [Date DA], etc. Em muitos casos, os campos entregues pelo motor de busca bibliográfica contêm mais do que um "pedaço" de dados. Na figura abaixo, as áreas destacadas no texto ilustram como o VantagePoint analisa alguns dos campos do registro para um maior nível de detalhe:

Fig. 38. Destaques em um texto mostrando como o VP analisa os campos do registro

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 32

A seguir são mostradas algumas funcionalidades do VP relacionadas ao gerenciamento dos Arquivos (Files), bem como seu desdobramento em Listas (Lists) e Grupos (Groups)

Arquivos (Files)

Importando campos adicionais

1. Na guia do menu principal, selecione Campos (Fields) e no menu dropdown, selecione Importar Mais Campos (Import More Fields)

2. Na janela do lado direito da caixa de diálogo Choose Database and Fields (Escolha Banco de Dados e Campos), selecione os campos que deseja importar e clique em OK (Se nenhum campo for mostrado, marque a caixa "Show All Fields").

Fig. 39. Escolha de conjunto de registros e campos

Nota: O software VantagePoint (versão 3.0 e posteriores) contêm as definições prévias

de bases de dados, aplicando-as quando um arquivo de dados brutos é originalmente importado através do filtro para uma base de dados específica (ex: WoS, PubMed). Cada registro no arquivo .vpt é associado a uma dessas definições originais da base de

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 33

dados, elencando seus campos e mostrado-os na janela do lado esquerdo – que é desativada durante a função Importação (Import). O VP usa o arquivo de definições internas do banco de dados associado a cada registro, a fim de analisar os campos desse registro.

Caixas de verificação (checkboxes) da importação de campos adicionais de uma determinada base de dados:

- Importação de nota editável (Import from Editable Note): Use o texto das "Notas sobre este registro" - Notes about this Record (ver em Exibição de Registro – Record

Display) como entrada para a importação de um campo adicional (ao invés da

importação do registro bruto).

- Importação de campo existente (Import from Existing Camp): Use o texto de um campo existente como entrada para importação como campo adicional (ao invés da importação do registro bruto).

Nota: Tanto para Importação de nota editável (Import from Editable Note) e

Importação de um campo existente (Import from Existing Camp), o filtro de importação incorporado no VantagePoint deve conter os comandos de análise para o novo campo.

Propriedades do Conjunto de dados (Dataset Properties)

As Propriedades do Conjunto de Dados (Dataset Properties) são acessadas a partir do menu principal: Arquivo (File) e Propriedades do Conjunto de Dados (Dataset

Properties)

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 34

Há duas guias nessa caixa de diálogo: Propriedades do Conjunto de Dados (Dataset

Properties), que descreve as características do conjunto de dados, e as Dependências

Externas (External Dependencies), que lista os arquivos externos que o conjunto de dados utiliza nas planilhas de browser do VP.

Na guia Propriedades do Conjunto de Dados (Dataset Properties) é possível:

- Definir o Idioma da Base de Dados (Database Language), selecionando o idioma de escolha na caixa Linguagem da Base de Dados (Database Language)

- Visualizar o Título de Campo (Title View Field): Selecionando o campo a ser usado para preencher a janela de Visualização do Título (Title View). Este atributo é normalmente definido no momento da importação. Pode-se selecionar qualquer campo como o título Ver Campo (View Field); no entanto é recomendado usar apenas os campos com valor único (ou seja, campos para o qual cada registro tem um e somente um valor).

- Caminho para dados do tipo "Link": Os campos com dados do tipo "Links" contém os nomes de arquivos associados a um registro. Os dados do campo são links para páginas da web (URL) ou nomes de arquivos com o caminho do arquivo. Quando o usuário clica no item de dados na Visualização de Registro em Campo (Fielded Record

View), o VP lança a aplicação associada ao nome do arquivo no link. Exemplos desse

tipo de arquivo: links da Internet (por exemplo, .htm, .html), Imagens (por exemplo, .jpg, .bmp), Documentos (por exemplo, .pdf, .doc), Planilhas (por exemplo, .xls), e links de intranet (por exemplo, .ndl).

Alterar Filtro de Importação (Change Import Filter) - Clique nesse botão para:

- Alterar os filtros de importação (também conhecidos como configurações da base de dados - database configurations) que estão salvos nos arquivos .vpt importados pelo VantagePoint (versão 3.0 e posteriores).

Para saber mais, consulte Alterar as Configurações de Banco de Dados (Changing

Database Configurations in a VantagePoint file no guia do VantagePoint).

- Mudar a Visualização de um registro (Field Order for Record View ): Clique neste botão para mudar a forma como os registros são exibidos na Visualização de Registro em Campo (Fielded Record View). Isso leva à seguinte caixa de diálogo (dados mostrados apenas ilustrativos - qualquer nome de campo do conjunto de dados pode ser mostrado):

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 35 Fig. 41. Alterando a ordem dos campos nos registros

Para incluir um campo na Visualização de um registro (Field Order for Record View), clique em On na caixa de seleção ao lado do nome do campo, ou clique em Off para não mostrar o campo desejado. Para alterar a ordem em que os campos são apresentados em Field Order for Record View (Visualização de um registro), clique no nome do campo e use as setas para cima e para baixo para mover os nomes dos campos (ou clique e arraste o nome do campo). Clique em OK para salvar as alterações e retornar à caixa de diálogo Dataset Properties (Propriedades do Conjunto de Dados).

- Search Strategy (Estratégia de Pesquisa): Muitos provedores de dados colocam sua

estratégia de busca no início do conjunto de dados brutos. O VP salva a parte do conjunto de dados brutos que ocorre antes do primeiro registro na janela de Search

Strategy das Propriedades do Conjunto de Dados (Dataset Properties). É possível editar

o conteúdo da janela Search Strategy para manter outras anotações sobre o conjunto de dados brutos, como por exemplo a data da pesquisa.

- Comments: Dataset Properties (Comentários: Propriedades do Conjunto de Dados): é

uma seção de comentários onde pode-se digitar qualquer informação adicional que se deseje manter com o arquivo (por exemplo, história do processamento ou tesauro criado e utilizado a partir do conjunto de dados).

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 36 External Dependencies (Guia Dependências externas)

A partir da versão 6.0 do VP, os arquivos de dependência externa usados pelo browser do VP podem ser automaticamente incorporados ao arquivo de dados .vpt. Incorporar esses arquivos de dependência elimina a necessidade de agrupar o arquivo externo .jpg ou .png ao compartilhar o arquivo .vpt com outros usuários do VP ou no VantagePoint Reader.

Uma vez que os arquivos de dependência externa são incorporados no arquivo .vpt, o arquivo externo permanecerá no disco de origem até que seja apagado.

Na guia External Dependencies é possível:

- Verificar o status de arquivos selecionados (Check Status for Selected File) / de todos os arquivos (Check Status for All Files ): ao clicar estes botões o VP faz a verificação da presença dos arquivos externos que o conjunto de dados utiliza no browser do VP. - Localizar um arquivo selecionado (Localize Selected File): leva à caixa de diálogo Localizar arquivos (Localize Files) que permite reestabelecer a relação na planilha do browser do VP.

- Incorporar arquivos selecionados (Embed Selected Files): Incorpora o arquivo de dependência selecionado no arquivo de dados .vpt. Se a operação for bem sucedida, o "status" do arquivo mudará de "OK" para "incorporado".

- Copiar da lista de arquivos para a área de transferência (Copy File List to Clipboard): Copia a lista de arquivos de dependência para a área de transferência para que possa ser colado em outro aplicativo (por exemplo, no bloco de notas ou no Excel).

- Remover dependência selecionada (Remove Selected Dependency): Remove a dependência do browser no arquivo. Isso só deve ser usado se há certeza que o browser não precisa do arquivo. Uma caixa de diálogo de confirmação aparece antes de remover a dependência.

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 37 Fig. 42. Guia de dependências externas nas propriedades do conjunto de dados

Criando um subconjunto de dados (Sub-dataset):

Pode-se extrair uma parte de um conjunto de dados aberto para um novo conjunto de dados, menor. O novo conjunto de dados pode ser extraído usando grupos ou itens selecionados de uma lista, e irá conter todos os registros com qualquer um dos itens selecionados de uma lista (ou qualquer um do grupo selecionado).

1. Na tela principal de trabalho (Main Workspace), selecione a guia da planilha para a lista ou matriz a ser usada para criar o novo conjunto de dados. Se um grupo estiver definido para a extração, vá para a etapa 2. Caso nenhum grupo esteja definido, crie uma seleção, destacando os itens da lista (linhas, colunas ou células) para ser usado para criar o novo conjunto de dados. Se os itens da lista são consecutivos, você pode "clicar e arrastar" para destacar todos os itens a serem usados. Caso contrário, use a tecla Ctrl e clique em vários itens.

2. No menu principal (Main Menu), selecione File e Create sub-Dataset (Criar Sub- conjunto de dados), ou pressione Ctrl + N no teclado.

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 38 Fig. 43. Criação de sub-conjunto de dados

3. A caixa de diálogo Create Sub-dataset é exibida.

4. Crie o novo conjunto de dados a partir de um Grupo (Group - se o conjunto de dados contém grupos), de uma Seleção (Selection), ou de todos os registros (All Records). 5. Se você selecionar Grupo, selecione o grupo que você deseja usar como base para

extrair o subconjunto de dados. Você pode navegar a estrutura hierárquica dos grupos clicando duas vezes sobre os tipos de lista para expandir ou recolher os nomes de grupo (Para mais informações sobre grupos, consulte a seção de Grupos no guia do VantagePoint).

Selecione Normal ou Complementar. Resultados "Normais" na criação de um subconjunto de dados são compostos pelos registros ou grupo selecionado. "Complemento" exclui o grupo ou registros selecionados e cria um subconjunto de dados usando todos os outros registros.

Se o conjunto de dados contém registros marcados por omissão (veja Gravar Display), eles serão omitidos do subconjunto de dados se esta caixa permanece marcada.

Manual de uso do VantagePoint – v.1 – Outubro 2014 Página 39

O número de registros que serão criados no subconjunto de dados é exibido acima da janela onde os nomes do grupo aparecem.

Clique em OK para iniciar o processo de extração.

Dependendo do tamanho do conjunto de dados, a extração pode demorar alguns instantes. Sabe-se que o processo está completo quando um Resume View (Ver Resumo) do novo conjunto de dados é exibido no Main Workspace (janela central de trabalho).

5.2 Tratamento de dados: organização (Listas, Grupos e Matrizes)

No documento MANUAL DE USO DO VANTAGEPOINT Versão 1 (páginas 31-40)

Documentos relacionados