• Nenhum resultado encontrado

Para testar o quanto os elementos ancestrais são equivalentes, a próxima atividade Ava- liar a similaridade possui três subatividades correspondentes às diferentes técnicas aplicadas. A primeira delas é a de Analisar os radicais, onde os radicais foram extraídos e analisados, gerando uma matriz de similaridade MSim que pode ser visualizada na Figura 20.

É importante notar que por ser uma matriz simétrica, os elementos abaixo da diagonal principal não são considerados, assim como a diagonal principal, pois é a similaridade do ele- mento com ele mesmo. Os elementos em destaque são os que possuem equivalências, ou seja, adquiriram valor 1 (um).

Figura 20 – Matriz de similaridade MSim da análise dos radicais nos elementos ancestrais

Fonte: Autor

de conhecimento, aplicadas nos elementos ancestrais. Em todas as técnicas é possível observar que os elementos são testados todos com todos, atribuindo valores aos pares em análise.

As matrizes apresentadas são levadas em consideração para a próxima atividade que realiza o cálculo de equivalência. Uma única matriz de equivalência MEqu é gerada a partir dos cálculos aplicados (descritas na Seção 3.4). A Figura 23 ilustra a matriz MEqu gerada para os elementos ancestrais.

Os elementos considerados equivalentes estão em destaque (valor 1.0). Para demonstrar como a atividade Aplicar o cálculo de equivalência funciona, os casos previstos na Tabela 4 (Seção 3.4) são explicados em detalhes.

O primeiro caso gera como resultado o valor 1 se qualquer uma das três técnicas obtiver valor 1. O par de elementos ancestrais que pode ser observado é Author e Author (pertencentes ao Documento 0 e 1, respectivamente) que obteve total equivalência na análise dos radicais, sendo assim, na matriz de equivalência, o valor gerado foi 1 para este par de elementos.

No segundo caso se todas as técnicas obtiver valor 0 (zero) o resultado gerado na matriz de equivalência é 0 (zero), ou seja, não equivalente. Observando o par de elementos NameList e Journal (pertencentes ao Documento 0 e 1, respectivamente) é possível visualizar que nas três

Figura 21 – Matriz de similaridade MSim da análise dos caracteres nos elementos ancestrais

Fonte: Autor

Figura 22 – Matriz de similaridade MSim da análise do conhecimento nos elementos ancestrais

Figura 23 – Matriz de equivalência MEqu das análises dos elementos ancestrais

Fonte: Autor

técnicas aplicadas, todos obtiveram valor 0 (zero).

O próximo caso previsto diz respeito aos valores gerados no intervalo de 0 a 1. Se uma (apenas uma) das técnicas obtiver valor no intervalo de 0 a 1, é testado se o mesmo é maior ou menor igual a 0,6. Dependendo do resultado, a matriz de equivalência considera equivalente ou não equivalente. Os pares de elementos que se pode observar é Person e ArticleId, onde a única técnica que obteve valor no intervalo (0,42) foi a análise de caracteres. O valor gerado foi 0 (zero), pois 0,42 é menor que 0,6. Já o par Source e ArticleId obteve 0,61 em apenas uma técnica, gerando equivalência na matriz MEqu, ou seja, valor 1 (um).

O último caso previsto não se encaixa em nenhuma das condições descritas anterior- mente, ou seja, quando mais de uma técnica obtiver valores no intervalo de 0 a 1 é aplicado a média ponderada com os pesos de cada técnica. Dependendo do valor gerado, é verificado se maior ou menor igual a 0,5. Um exemplo é o par de elementos Person e Author (pertencente ao Documento 0 e 1, respectivamente) que obtiveram os valores: Radical= 0; Jaro= 0,44; e WuP= 0,88. Realizando a média ponderada o valor resultante é 0,51, gerando o valor 1 (equivalente) na matriz MEqu, pois 0,51 é maior que o ponto de corte de 0,5.

Depois de gerado a matriz MEqu, a extração dos nomes dos elementos considerados equivalentes é realizada. Isto é necessário tendo em vista que a matrizes carregam apenas os valores e não os nomes. Nas figuras anteriores os nomes dos elementos foram colocados para melhorar a visualização dos pares de ancestrais em análise.

A atividade Extrair os elementos é realizada por meio de implementação, e uma veri- ficação se são elementos ancestrais ou não é realizada manualmente. Assim, neste estágio do processo é gerado o documento DCan com os elementos ancestrais considerados equivalen- tes, ou seja, os pares que obtiveram valor 1 na matriz de equivalência MEqu da Figura 23. A Listagem 4.15 ilustra o documento DCan.

1 [

2 Sources - Source, Sources - Article, Sources - Journal, Sources -

JournalIssue, Sources - ArticleIdList,

3 Source - Article, Source - ArticleId,

4 Author - Author, Author - Person, Author - AuthorList, Author - Author,

Author - Person, Author - AuthorList, Author - Author,

5 NameList - DateRevised, NameList - AuthorList,

6 Person - Author,

7 PubmedArticleSet - PubmedArticle, PubmedArticleSet - Article,

PubmedArticleSet - PubDate, PubmedArticleSet - PublicationTypeList,

PubmedArticleSet - PubmedData, PubmedArticleSet - PubMedPubDate,

PubmedArticleSet - ArticleIdList, PubmedArticleSet - ArticleId,

8 PubmedArticle - PubDate, PubmedArticle - PublicationTypeList,

PubmedArticle - PubmedData, PubmedArticle - PubMedPubDate,

9 MedlineCitation - Pagination, MedlineCitation - AffiliationInfo,

MedlineCitation - PublicationTypeList, MedlineCitation -

MedlineJournalInfo,

10 DateCompleted - DateRevised, DateCompleted - PubDate,

11 DateRevised - PubDate,

12 Article - ArticleIdList, Article - ArticleId,

13 Journal - JournalIssue, Journal - MedlineJournalInfo,

14 PubDate - PublicationTypeList, PubDate - PublicationType, PubDate -

PubmedData, PubDate - PubMedPubDate,

15 Pagination - AffiliationInfo,

16 AuthorList - Author, AuthorList - ArticleIdList,

17 AffiliationInfo - MedlineJournalInfo,

18 PublicationTypeList - PublicationType, PublicationTypeList -

ArticleIdList,

19 PublicationType - PubmedData, PublicationType - History, PublicationType

- PubMedPubDate,

20 CommentsCorrectionsList - CommentsCorrections,

21 PubmedData - PubMedPubDate,

22 ArticleIdList - ArticleId]

Listagem 4.15 – Documento DCan

A partir destes elementos ancestrais, a atividade Extrair os elementos descendentes é processada para cada par de ancestrais. Para isto o documento com a estrutura (DEst) é uti- lizado manualmente. A Listagem 4.16 ilustra um dos documentos DDes com os elementos descendentes do par de elementos ancestrais equivalentes Person - Author.

1 Last; First; Middle; @ValidYN; LastName; ForeName; Initials;

AffiliationInfo;

Listagem 4.16 – Documento DDes contendo os elementos descendentes do par de ancestrais Person - Author

Conforme o andamento do processo, a próxima atividade a ser realizada é Avaliar a similaridade. Assim como foi realizado para os elementos ancestrais, esta atividade se aplica, neste estágio, aos elementos descendentes. As três técnicas são aplicadas a todos os descen- dentes e geradas as matrizes de equivalência. Como já foi exemplificado como as técnicas são geradas, assim como a explicação da atividade Aplicar o cálculo de equivalência, apenas a ma- triz de equivalência é ilustrada. Para os elementos da Listagem 4.16 é ilustrado a matriz MEqu na Figura 24.

Figura 24 – Matriz de equivalência MEqu das análises dos elementos descendentes

Fonte: Autor

Diferente do que foi realizado para os elementos ancestrais, a atividade Extrair os ele- mentosobtém não apenas os pares de elementos equivalentes, mas também os não equivalentes. É importante notar que os documentos DDes (com os elementos descendentes de cada par de ancestrais) são examinados e unificados em um único documento. Os que são equivalentes fi- cam em (DDesC) e os não equivalentes em (DDesN). Para exemplificar, as Listagens 4.17 e 4.18 ilustram trechos dos documentos com os elementos candidatos ao casamento de esquemas (DDesC) e os não candidatos (DDesN), sendo direcionados aos exemplos dos pares obtidos na Figura 24. 1 [ 2 ... 3 Last - LastName, 4 LastName - ForeName, 5 ...]

Documentos relacionados