• Nenhum resultado encontrado

Diagramas e Exemplos do SUPeRB

N/A
N/A
Protected

Academic year: 2021

Share "Diagramas e Exemplos do SUPeRB"

Copied!
9
0
0

Texto

(1)

1

SUPeRB

Especificação e exemplos

Luís Miguel Cabral

Linguateca

Ultima versão: 15 de Dezembro de 2006

2

WEB WEB Catálogo da Linguateca SUPeRB referência incompleta expressão URL Google/Yahoo API SRU/RW Web DocumentsDocumentsWebWeb

DocumentsDocumentos Web

Interface Web informação bibliográfica

SUPeRB numa figura só

Validação pelo gestor CiteSeer

Interacção com o gestor

Interacção com o utilizador

(2)

3

Validação

Validação Proposta de adição

Validação pelo gestor para incorporar no catálogo Validação

Validação

Classificação

Classificação pelos utilizadores Extracção de

Elementos bibliográficos Candidatos a elementos

bibliográficos Extracção de Referências a partir de texto

Candidatos a referências

SUPeRB

Pesquisa Web URL Referência incompleta Expressão Candidatos a URLs Obter Dados da Web

Texto Referências Fusão de dados Informação bibliográfica Informação bibliográfica (referências e elementos)

4

API serviço Web

Google/Yahoo

Candidatos a URL Referência incompleta Expressão

Extractor de elementos bibliográficos Invocador de serviços Gerador de consultas

Pesquisa na Web

Documentos relevantes Web DocumentsDocumentsWebWeb

Documents

Documentos Web Consultas a

serviços de pesquisa

Resposta dos serviços Elementos chave

(3)

5

Exemplos:

Expressão ou referência bibliográfica incompleta

Parâmetros de entrada:

Saída:

Lista de URL com possível informação relevante

dizer automatic discourse analyser

dizer analyser automatic académico discourse dizer automatic documents discourse analyser dizer references discourse dizer automatic academic

Parâmetro dado: Dizer automatic discourse analyser

Pesquisa na Web

Expressões geradas:

http://wotan.liu.edu/docis/dbl/sbiasb/index.html http://www.portalpsicologia.org/busqueda.jsp?idProfesion=1 http://citeseer.ist.psu.edu/machadorino96discourse.html http://br.groups.yahoo.com/group/lta-l/messages/30?xm=1&m=e http://www.shakespeare.uk.net/journal/1_3/cardoso-desousa1_3.html http://citeseer.ist.psu.edu/salgueiropardo04dizer.html http://www.inesc-id.pt/pt/indicadores/Ficheiros/2167.pdf http://csdl.tamu.edu/~crln/1986bib.html http://www.csdl.tamu.edu/~crln/1991set.html

URL devolvidos:

6

SRU/RW Obtém dados estruturados Buscador de texto Texto Referências URL

Acesso à Web para obter texto e

informação bibliográfica

Repositorios bibliográficos Informação bibliográfica Cache Filtra URL

URL a ignorar repositórios

URL ignorados Pedido URL pertence a repositório Obtém documento original CiteSeer Obtém texto

(4)

7

Extracção de referências de texto

Extrai candidatos de texto académico Texto Candidatos a referências Filtra candidatos Extrai candidatos de texto em geral Extrai cabeçalho (Artigos e docs científicos

(estrutura académica) apresentação(ppt), outros) REB Texto ignorado (listas de palavras,... ) Texto académico (artigo) Uso de heurísticas para circunscrever

potenciais candidatos Candidatos excluídos(Ausência de data ou nomes próprios, candidatos demasiado simples, ou demasiado extensos) Aumentar importância

dada a existência prévia de elementos bibliográficos

Análise da estrutura do texto

8

Texto extraído de um documento

164

Data Driven Ontology Evaluation

Christopher Brewster., Harith Alani†, Srinandan Dasmahapatra†, Yorick Wilks.

.Department of Computer Science, University of Shef.eld,

211 Portebello Street, Shef.eld, S1 4DP, U.K. {C.Brewster|Y.Wilks}@dcs.shef.ac.uk † School of Electronics and Computer Science, University of Southampton, SO17 1BJ, United Kingdom {ha|sd}@ecs.soton.ac.uk

Abstract

The evaluation of ontologies is vital for the growth of the Semantic Web. We consider a number of problems in evaluating a knowledge artifact like an ontology. We propose in this paper that one approach to ontology evaluation should be corpus or data driven. A corpus is the most accessible form of knowledge and its use allows a measure to be derived of the ‘.t’ between an ontology and a domain of ...

8. References

AKT, 2003. AKT reference ontology. Available at www.aktors.org/publications/ontology. An ontology of the academic domain. Alani, Harith, Sanghee Kim, David E. Millard, Mark J. Weal, Wendy Hall, Paul H. Lewis, and Nigel R. Shadbolt, 2003. Automatic ontology-based knowledge extraction and tailored biography generation from the web. IEEE Intelligent Systems, 18(1). Brewster, Christopher, Fabio Ciravegna, and Yorick Wilks, 2001. Knowledge acquisition for knowledge management: Position paper.

In Proceeding of the IJCAI-2001Workshop on Ontology Learning. Seattle, WA: IJCAI.CIDOC, 2003. The CIDOC conceptual reference model.

...

Exemplo:

Parâmetros de entrada:

(5)

9

Tttulo=Data Driven Ontology Evaluation autor=Christopher Brewster autor=Harith Alani autor=Srinandan autor=Dasmahapatra autor=Yorick Wilks

resumo=The evaluation of ontologies is …

lingua=en

Extracção de referências de texto

1. A informacão recolhida do cabeçalho está já semi-estruturada e, se a

informação estiver disponível (fornecida pelas tarefas anteriores), com

URL

2. Lista de referências candidatas, obtidas do texto.

Dois tipos de saída:

Exemplo:

AKT, 2003. AKT reference ontology. Available at www.aktors.org/publications/ontology. An ontology of the academic domain. Alani, Harith, Sanghee Kim, David E. Millard, Mark J. Weal, Wendy Hall, Paul H. Lewis, and Nigel R. Shadbolt, 2003. Automatic ontology-based knowledge extraction and tailored biography generation from the web. IEEE Intelligent Systems, 18(1). Brewster, Christopher, Fabio Ciravegna, and Yorick Wilks, 2001. Knowledge acquisition for knowledge management: Position paper.

In Proceeding of the IJCAI-2001Workshop on Ontology Learning. Seattle, WA: IJCAI.CIDOC, 2003. The CIDOC conceptual reference model.

1.

2.

10

Extracção de elementos bibliográficos

Candidatos a referências

Análise sintáctica dos elementos obtidos

ParaTools ??? separador REB Candidatos a elementos bibliográficos REPENTINO

(6)

11

Exemplos (1)

Extracção de elementos bibliográficos

Referências em texto

Parâmetros de entrada:

Saída:

Informação estruturada, mantendo o texto fonte

autor=Luís Sarmento

titulo=O SIEMÊS e a sua participação no HAREM e no Mini-HAREM editor=Diana Santos

editor=Nuno Cardoso

colecao=HAREM, a primeira avaliação conjunta de sistemas de reconhecimento de entidades mencionadas para português: documentação e actas do encontro

ano=2006.

texto=Luís Sarmento. "O SIEMÊS e a sua participação no HAREM e no Mini-HAREM". In Diana Santos & Nuno Cardoso (eds.), HAREM, a primeira avaliação conjunta de sistemas de reconhecimento de entidades mencionadas para português: documentação e actas do encontro. Linguateca:, 2006.

Luís Sarmento. "O SIEMÊS e a sua participação no HAREM e no Mini-HAREM". In Diana Santos & Nuno Cardoso (eds.), HAREM, a primeira avaliação conjunta de sistemas de reconhecimento de entidades mencionadas para português: documentação e actas do encontro. Linguateca:, 2006.

12

Exemplos (2)

Extracção de elementos bibliográficos

Diana Santos & Paulo Rocha. "CHAVE: topics and questions on the Portuguese participation in CLEF". In Carol Peters & Francesca Borri (eds.), Cross Language Evaluation Forum: Working Notes for the CLEF 2004 Workshop (CLEF 2004) (Bath, UK, 15-17 September 2004), Pisa, Italy: IST-CNR, pp. 639-648. Revised as Santos &

Rocha (2005) http://www.linguateca.pt/documentos/SantosRochaCLEF2004WN.pdf

autor=Diana Santos autor=Paulo Rocha

titulo=CHAVE: topics and questions on the Portuguese participation in CLEF editor=Carol Peters

editor=Francesca Borri

colecao=Cross Language Evaluation Forum: Working Notes for the CLEF 2004 Workshop (CLEF 2004) local=Bath, UK data= 15-17 September 2004 morada=Pisa, Italy editora=IST-CNR pagina=639-648 url= http://www.linguateca.pt/documentos/SantosRochaCLEF2004.pdf

texto=Diana Santos & Paulo Rocha. "CHAVE: topics and questions on the Portuguese participation in CLEF". In Carol Peters & Francesca Borri (eds.), Cross Language Evaluation Forum: Working Notes for the CLEF 2004 Workshop (CLEF 2004) (Bath, UK, 15-17 September 2004), Pisa, Italy: IST-CNR, pp. 639-648. Revised

(7)

13

Alani, Harith, Sanghee Kim, David E. Millard, Mark J. Weal, Wendy Hall, Paul H. Lewis, and Nigel R. Shadbolt, 2003. Automatic ontology-based knowledge extraction and tailored biography generation from the web. IEEE Intelligent Systems, 18(1).

autor= Harith Alani autor=Sanghee Kim autor=David E. Millard autor=Mark J. Weal author= Wendy Hall autor=Paul H. Lewis autor=Nigel R. Shadbolt ano=2003

titulo=Automatic ontology-based knowledge extraction and tailored biography generation from the web coleccao=IEEE Intelligent Systems

volume=18 numero=1

texto=Alani, Harith, Sanghee Kim, David E. Millard, Mark J. Weal, Wendy Hall, Paul H. Lewis, and Nigel R. Shadbolt, 2003. Automatic ontology-based knowledge extraction and tailored biography generation from the web. IEEE Intelligent Systems, 18(1).

Exemplos (3)

Extracção de elementos bibliográficos

14

Fusão da informação bibliográfica

Fusão de referências Informação bibliográfica refinada Elementos bibliográficos Elementos bibliográficos Elementos bibliográficos Elementos bibliográficos REB Referências bibliográficas Referências bibliográficas

(8)

15

tipo=artigo

titulo=Applying a Lexical Similarity Measure to Compare Portuguese Term Collections autor=Chaves, M.S.

autor=Lima, V.L.S.

revista=LECTURE NOTES IN COMPUTER SCIENCE ano=2004

editora=Springer

Fusão da informação bibliográfica

tipo=livro

revista=Lecture Notes in Computer Science : Advances in Artificial Intelligence – SBIA 2004 titulo=Applying a Lexical Similarity Measure to Compare Portuguese Term Collections páginas=194 - 203

ano=2004

autor=Marcirio Silveira Chaves autor=Vera Lúcia Strube de Lima

tipo=artigo

titulo=Applying a Lexical Similarity Measure to Compare Portuguese Term Collections autor=Marcirio Silveira Chaves

autor=Vera Lúcia Strube de Lima

revista=Lecture Notes in Computer Science : Advances in Artificial Intelligence – SBIA 2004 páginas=194-203 ano=2004 editora=Springer

Exemplo:

16

Classificação Correcção classificação Informação bibliográfica classificada (com tags) Referências bibliográficas

regras

Informação bibliográfica Validada

(9)

17

(elemento, classe, relevância)

Elemento Bibliográfico

REB- Repositório de

Elementos Bibliográficos

(Elemento,Classe)

Parâmetro: “M. Chaves”

Saída: [(“Marcirio Silveira Chaves”, “pessoa”, 21.0),

(“Marcirio Chaves”, pessoa, 7.3) ]

Exemplo:

Avalia Relevância

18

Referência parcial Expressão Extractor de elementos bibliográficos Invocador de consultas Pesquisa local Extractor de elementos bibliográficos URL Obtém referencias Obtém texto web2txt Obtém cache Extrai info de documentos académicos filtra candidatos Extrai elementos blibliográficos REB ParaTools REPENTINO Informação bibliográfica Funde referencias Pesquisa Acesso ao conteúdo dos documentos Extracção de referências Extracção de elementos bibliográficos Fusão de informação bibliográfica Repositórios Ignorar Extrai referências de documentos académicos Extrai cabeçalho Expressão Referencia Referência Identifica a estrutura do texto

Referências

Documentos relacionados

O Departamento de Controle de Qualidade é o responsável pela revisão dos resultados de testes e da documentação pertinente ao produto (determinação de componentes / materiais,

A Organização estará a cargo do Município de Fornos de Algodres, assim como todos os membros do STAFF que estarão disponíveis para vos auxiliar no que for preciso.. Ao

1 - para hinos com um bemol na armadura de clave original, a nova armadura de clave será formada com dois sustenidos. 2 - para hinos com dois bemóis na armadura de clave original, a

O objetivo deste trabalho é desenvolver um sistema de biofeedback para auxiliar na reabilitação dos movimentos da mão em pacientes que sofreram um acidente vascular

http://www.ipea.gov.br/portal/images/stories/PDFs/relatoriopesquisa/150611_relatorio_reincidencia_c riminal.pdf >.. Sistema Penal Brasileiro não presta devidamente e de

rendimento de carcaça de frangos de corte e observaram que a energia metabolizável, tanto do milho como do farelo de soja, foi aumentada em 2 e 9%, respectivamente; e

CONCLUSÃO: De acordo com os estudos analisados o Nintendo Wii demonstrou que pode ser efetivo na melhora do controle postural e mobilidade em crianças com