• Nenhum resultado encontrado

Ferramentas para aprendizagem de ontologias a partir de textos.

N/A
N/A
Protected

Academic year: 2017

Share "Ferramentas para aprendizagem de ontologias a partir de textos."

Copied!
19
0
0

Texto

(1)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

! " # $ %

& #% '!( ) &

" # $ %

&

*)+), ) - .

/

)

0 1 1 2

% 1

# $ 1# !(

1 1 2 3 & 3

# $ &

# '!, "

# $ % & #% '!(

3 & 3 !

) ' 4

0 1 1 2 3 &

3 # $

& # '!, %

/ 3 & &

3 &

%2 )

0 3 & # $ 2

% 5 ( , )

1

1 2 3 & 3

% ) # ' 6 % 4

! "

(2)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

$ !

! ! "

% # &

$ ! !

! '

!

% %

$ $ 7 ( )

* )

+ ,

! , , - . !

/ !

, With the goal of

reducing such efforts, ontology learning methods have been developed. Therefore, it is necessary to automate the process of acquiring knowledge and different approaches have been suggested. The use of texts as a source of knowledge acquisition appears to be a correct path, since language is the first manner of knowledge transferring among human beings. Besides, there are a lot of digital documents available. To support semi-automatic construction of ontologies from texts, several tools have been developed, each one using different techniques and methods.

0 !

!

1 ! !

8 9: 7 2 , ) * 1)

* 1

(3)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

4 $ # 5$ 6 #

" " 4

7 ' # '

7 8 ( 9 #

%& 7 : ( %&

"

; %& ' ' ' ( !

' ,

, & 4

' & ' '

4 7 %8

7 ' ,

5 $ $ <=' -0026(

< '

7 4 & ' "

4 " 7

5 9$ > > ?@A ' -00*6(

%& ' '

4 B %& 7 %& C

5D @E9 ' )**+' ( -6( 9 %& > '

E . 5)**F' ( )F16' G B %&

7 %& 7

C( < %& ' 4

" , 4

" " ' 7" "

4 (

! %8 ' ' 4 "#

; %8 '

4 ! , ' "

# " %8 5<=H @>9<' -00-6(

" %& " "

" %8 7 (

? %& ' '

" " %& (

8 & '

" " ( ! %& 4

7

' 4 (

' "

' %&

" " " '

" ' " 5 $ $ <=' -0026( ! 8 '

"

(4)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

' %& " 5DI 9 ,

!J 9 ' < <=, ?=' -00+6(

< 4 %& ' /

' '

' '

" 4 ( K ' " '

7 '

# " " . "

% 4 %& (

= 5 1 3

. %&

" 4 .

5DI 9 ,!J 9 < <=, ?=' -00+6(

! ' '

%& 4 %& '

' " 5 9K ?9 > E'

-0016( 9

( A ' %&

' ' ' 4

(

4

7" 4 %8 ' ,

L 4 %& %&

( > E 5-00M6' %&

4 %& '

" 4 #

(

! 4 %&

%& ' "

" " '

( K " ; N ' ,

#, ' 4 4

7 ' 4 &

7" (

9 " &

%& ' '

4

' 7" 4 & 7"

' 4 &

%& ( < , 4

7 ' # " 7"

, # 7 '

" 7" , ( '

4 " 7" (

< ' 7" " 4 N

(5)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

( ! # %&

7" %8 4

& . " " 7

4 . 7" (

= 5* 1 5 3'

D %& = 5* 1

6 6 9 %& = 5* 1 '$ 6'

. %&

4 . 5DI 9 ,!J 9

< <=, ?=' -00+6' , "

%& ' ' (

> > 5-0016'

4 G

6 G 7

4

6 G %8

%8 5 ( 7 6

6 G

6 4 G

,

4 " 7 8 - 5 5O A6

6 G %8

"

(

! ' 7

( %&

5 )6G %&

' P ' %& ' %&

5 & 4 6 %& 5E@$ 9A

D<$<$' -00M6( " ' 4

(6)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 !

) Q 9 %&

G E@$ 9A D<$<$ 5-00M6(

$ , 4

5 $ $ <='

-0026( @ " . "

7 ( =

" %& %&

5 ! 6' '

5!A<6(

< ' 9 &

" %8 N (

7" 4 : 5 $AA9 ' )**0 $AA9 '

)**M6 P # 9 R < 5S=>>9<'

)**F6' P 7 (

%&

P (

5 P 6 # . " " 4

(

! $ "

%8 , '

5 6 4 (

5?9 > ' )**-6' %8 ,

' . " %8 7 5 %& B , C6

( 9 T 4 5-0016'

? 5)**-6' , ' '

7 7 " # # (

< '

, " '

' ' 4 '

P ( = 4

" " E 5-00M6 U 5-0026

E 5-0036(

= 4 %&

P 4

( < 5)**F6 8 4

& " 4

" : %& ( , ' & '

(7)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 "

' " ( 9

L 4 &

(

! & 4 '

" %& 5 $ 6'

7 7 '

5 $ $

(' -00M6( '

4 ( !

: ' , > ' 9

5-00)6(

> 5-0026' ' ' ;

. %& ; 4 " # ( K . %&

& N ( @

. %& 5? >9 SVAW9 ' -00M6

8 8 4 " " . %&

5 ( B " & C6(

; %8 ( ! ' 5A$< ! < 9A'

-00)6 %8 " G BO HC

& BH OC(

#

E , 4

( K 7

' # " 7" , %& '

4 ' , )M

7 ' 7 (

K # 7 '

" 7" , %& (

= X ) "

7 ( 9

# " 7" G =< =A! 5 $E9$ =

T@<$= ' -00F6 != =< = 5 ? ' -00* ? S A?=

(8)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 $

X ) Q "

7

Nome Objetivo e

Escopo Fonte de dados

Intervençã o do usuário Idioma do corpus Fonte

Baségio Extração semiautomátic a de estruturas ontológicas, extração de

termos e

relações taxonômicas.

Texto analisado morfologicamente, o processo é manual.

Seleção de termos extraídos Portuguê s (Baségio , 2007)

ONTOLP Extração semiautomátic a de estruturas ontológicas, extração de

termos e

relações taxonômicas.

Texto analisado morfossintaticamente , no padrão XCES,

utilizando a

ferramenta VISL.

Seleção de termos extraídos e de grupos semânticos Portuguê s (Ribeiro Junior, 2008) PORONT O Extração semiautomátic a de estruturas ontológicas, extração de

termos e

relações taxonômicas.

Texto analisado morfologicamente,

utilizando o

TreeTagger.

Seleção de termos válidos extraídos Portuguê s (Zahra, 2009)

G K 4 (

= X -' D: ,! ' , 5-00+6'

"

7 ( K

7 ' " 7"

, ; W9 52 1 '$ 6 5T=<9> ! H< 9 '

-00-6' 9 $< 9 5E$JE=R > @A < AJ 9< ' )***6 + $ .+ .*

(9)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

X - Q "

7

Nome Objetivo e Escopo Intervenção do

usuário

Idioma do

corpus

Fonte

ASIUM

Objetivo do ASIUM é encontrar relacionamentos taxonômicos entre textos em linguagem natural na língua

francesa. Todo o processo Francês (FAURE; POIBEAU, 2000)

Text-To-Onto

Text-To-Onto tem como objetivo encontrar relacionamentos taxonômicos e não taxonômicos, utilizando técnicas como analise estatística, podas e regras de associação.

Avaliação do resultado final

Inglês

(MAEDCHE; STAAB, 2003)

TextStorm and Clouds

O objetivo TextStorm and Clouds é a criação semiautomática de uma rede semântica, onde contem apenas conceitos e seus relacionamentos, utilizando textos de um domínio

especifico. Todo o processo Inglês

(NOVAK; GOWIN, 1984)

Welkin

Welkin é uma ferramenta que tem como objetivo gerar automaticamente material para um e-learning, utilizando técnicas como TFIDF e qui-quadrado.

Não é necessário Inglês

(ALFONSECA; RODRÍGUEZ, 2002)

WOLFIE (Word Learning From Interpreted Examples)

O objetivo do Wolfie é a aprendizagem léxico-semântica de um corpus de frases com representações de seus significados.

Avaliação do resultado final

Inglês

(THOMPSON; MOONEY, 1997) Inglês Francês Inglês e Francês Inglês Inglês Inglês Inglês Francês e Inglês Alemão Francês Inglês Chinês Francês

Texto em linguagem natural, dicionários e ontologias

Texto em linguagem natural

Ontologia de domínio e WordNet

Corpus pré-processado com representações de seus

significados TERMINAE

TERMINAE tem como objetivo auxiliar o engenheiro de ontologias na

criação de uma ontologia, integrando Texto em linguagem natural

Avaliação do

resultado final (BIÉBOW; SZULMAN, 1999) SVETLAN’

SVETLAN’ é uma ferramenta que cria clusters de palavras que

aparecem dos textos fornecidos, Texto em linguagem natural

Avaliação do

resultado final (CHAELANDAR; GRAU, 2000)

TFIDF-based term classification system

TFIDF-based term classification system tem como objetivo extrair termos de domínio e relacionamentos

entre eles, utilizando como técnica Texto em linguagem natural

Avaliação do

resultado final (XU et al.,2002) SOAT: a Semi-Automatic Domain

Ontology Acquisition Tool

SOAT permite extrair de forma semiautomática ontologias de domínio usando como fonte corpus de

domínio, identificando palavras-chave Texto em linguagem natural

Informações não disponíveis no

artigo (WU et al.,2002)

SubWordNet Engineering Process tool

SubWordNet é uma ferramenta que tem como objetivo construir e manter

línguas alternativas para o WordNet, Texto em linguagem natural Todo o processo (GUPTA et al., 2002) OntoLearn Tool

OntoLearn é uma ferramenta que tem como objetivo extrair termos de domínio de um texto, relacioná-los com conceitos adequados para uma

ontologia e extrair relacionamentos Texto em linguagem natural

Avaliação do

resultado final (VELARDI et al., 2002)

Prométhée

Prométhée é uma ferramenta que tem como objetivo extrair e refinar

padrões léxico-sintáticos relativos a Texto em um padrão restrito Todo o processo (MORIN, 1999) LTG (Language Technology Group)

Text Processing Workbench

LTG é um conjunto de ferramentas que tem o objetivo de descobrir

estruturas internas de textos na língua Texto em linguagem natural Todo o processo (MIKHEEV; FINCH, 1997)

Mo’K Workbench

Mo’K é uma ferramenta que tem como objetivo extrair conceitos taxonômicos utilizando anotações

Texto analisado

morfossintaticamente Todo o processo (BISSON et al., 2000) DOE: Differential Ontology Editor

DOE é um editor de ontologias que permite o engenheiro criar ontologias

em três passos de acordo com a Texto em linguagem natural Todo o processo (BACHIMON, 1996)

KEA: Keyphrases Extraction Algorithm

KEA é uma ferramenta que extrai automaticamente palavras-chave dado

um conjunto de textos utilizando Texto em linguagem natural

Avaliação do

resultado final (JONES; PAYNTER, 2002)

(AUSSENAC-GILLES; SEGUELA, 2000)

CORPORUM-Ontobuilder

Objetivo do CORPORUM-Ontobuilder é encontrar

relacionamentos taxonômicos entre Texto em linguagem natural Não é necessário (ENGELS, 2001)

Fonte de dados

Texto analisado morfossintaticamente

Caméléon

Objetivo do Caméléon é identificar padrões léxico-sintático ou utilizar o padrão de Hearst para encontrar relacionamentos não hierárquicos e

Texto analisado morfossintaticamente Validação ou definição de novas regras léxicas sintáticas

(10)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

%

G W9 '

, ,= != =< =( 7"

, & ' " ; #

5 9 $< 9 Q # A9O9 , = A! Q #

7 6(

' & 7"

( W9 " , "

7 , ,

= " " #

!= =< = " " # ( =

& (

&

%'( ) %

9 7"

" 5 & . ' 4

T " 6( ! '

BT S Q. Y 4 " Z(. C' 4 " .

& . ( 8 %&

' ' 4

(

, ' %& %& (

7" # 5 -6'

4 & 7 ( ?

# %& ( ! 7" '

%&

' A9O 9 ( 9 ' L & 7"

, ' ' ' 9 $< 9(

- Q $ 9 $< 9

G @ =

&

*) *+,

=< =A! %&

! 1( J %& ' '

, : %& ! ( >

1

(11)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

(

4 & '

, =< =A!(

=

& O 9> 57 ' / 6' &

O A ( ! %&

' T 5-00F6 G

6 %& N 5 6

6 N "

5 6

6 %& 4

6 & "

6 %&

4 4 7 "

4 %

6 & " '

(

! "N '

G <( 5 <<$<D > ?[ 9' )***6' !. !

5 <<$<D > ?[ 9' )***6' : .= 5 < $ < <$ K=@ >@T$$'

)**F6 "N '

<( !. ! .= : .= 5 < $

< <$ K=@ >@T$$' )**F6

! %& %8 P ' &

7 " (

& # G %&

%8 P ' %&

%8 P " 8 5?9 > ' )**-3

%& %8 P " 8 5 = $<

T X@9 $<' -0016(

, %& ! ( J

. & O 9> '

&

' %& (

= %&

( : %& ' 7

)(-3-M+) ( <& 7"

' & L " =

5 +6' & 7" " '

& 4 7 ' \ $9< $ \ 4 "

(12)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

+ Q =< =A!

G @ =

&

-% . -

/

%

#

/

9 7" . $K9 9 '

' , , $K9 , ( 8

%& %&

( ! %&

' .

7

# ! ! %&

, ' %&

W9 9 ( > .

4 " %& '

( : '

4 . ; (

: ' W9 4 "

( = X + %&

4 " ' 4

'

(13)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

X + Q 7 W9

Extraídas Automaticamente Selecionadas Manualmente

Bangladesh Bangladesh

Cooperative farming Development aid

Family planning Famine

Famine Food supply

First aid Poverty

Food aid Rural environment

Jute Rural population

Landlessness Social structure

Landowners Tenure

Merchants Villages

G @ =

' %&

" G

"

7 ' (

&

%0 1 *1*)

, '

%& ( %& ' & 7"

%& 4 " " ' & 5

A 6 & 5 R ] 6(

8 %&

'

'

5 & 4 6 %& 7 (

< ' )M

7 7 %&

4 G 4 # ' !. !'

. (

: ' '

%8 P & , 4 (

7 5 16' ,

+ $ >

(

1 Q 7 , ,=

(14)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

' < . . ' 4

& 8 7 ( %&

< . ' ' & '

%& . 4 ' &

7" " %& %8 P (

= /

( %&

/ K ( ! '

! (

" ' '

' #

( 4 , ,= 4

" ( 9

' %8 P & P ( ! '

& '

" (

&

,*'*) *

R ' "

" R9E T S %& ( J

%& # '

" " : ( =

! ;

(

" G

)6 " 4 .

!K

-6 & 4 " 5

8 4 " !K

+6 , '

" %

%& 7

+ +

16 , & "

M6 & + + (

7 '

' 4 " 5 M6G

(15)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

G ? 5-00*6

)6

& 7

4 # ' ! ! & 7

X 1 ,

4 # ' ! !

X 1 Q %& != =< =

Regras de sequência morfológica Substantivo + Adjetivo Substantivo + Preposição + Substantivo Substantivo + Preposição + Adjetivo + Substantivo Substantivo + Preposição + Substantivo + Preposição

+ Substantivo

G ? 5-00*6

)6 P

* + #+ 5=!9< ?9> @ @>! ' -0)06'

%&

-6 4 "

7 # K

# > L 5K >6' "

%&

+6 ' 7

' P

& 7 ' &

' 4 . %&

" 4 "

16 : " '

%&

M6 OA>

(16)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 !

< ' -1

7 7 N %&

(

" ' %& ' &

%8 & P (

2

#

3

' ' L

%& 4 .

' ( < ' . "

% (

? "

( #

& 7" , (

' & & %& '

4 4 & &

%& (

4 '

: 7 & %&

7 ' L '

5 & 4 & 7 6(

= " 4 7"

" " '

& '

" " (

,

7 (

4 %&

7 " ' '

( <& 4 "

& ( " %&

: :

4 . 4 8 4

" (

4 " % '

" "

%& / 4 '

" " %& (

! ' " " '

&

(

'

4 #

E >JD$=' ( @ %&

(17)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 "

0M/0)/)**3( )-1 ( K %& 5 # %& 6 ,

! 7 @ " : D > , !@ >' !

' 0M/0))**3(

E$JE=R' E > @A < >( AJ 9< ' "( T( E( 9 $< 9G ,

U( $ G 9W R, $

W ] 9 W ] ' )) '

)***' K ' ! )) 9 R

W ] 4 ' ' E ' > '

)***' ( 1*,22(

E@$ 9A ' !( D<$<$' E( = U G " " ]( $

E@$ 9A ' !( $ $ <=' !( D<$<$' E( 59 (6' ! ?

/ ( < G $=> ! ' "()-+' -00M( ( +,

)-(

$ $ <=' !( = U G '

" ( < ] H G > ' -002( +13 (

$ $ ' ( D <D9 $' ( > ?' 9( > $ ' T( =T >' $

@ " ]

U U( $ G $ T

$ ' )* ' -00M' E ' ! )* $

T $ ' > ' ' @> '

W ! ' -00M( ( ),2(

@ 9' K( <9K9AA9 ' ( ,

"

U 4 ( $ G S ' !( 59 (6' ! A 9

R

' ) ' )**F' D ' 9 ' !

R

' )**F' ( MQ)-(

< $' W( ( < <$ K=@' >( >@T$$' T( ," / ,"

,] ( $ G 9

" U K A ' - ' )**F'

? ' ' D ' ! > 9

" U K A ' A ' @W'

> ' )**F( ( MFM,201(

9$ >' > ?@A >( = ' R ( (' ??/ (

' ? ! ? / @ ( T ' "( +' ( )' ( 1,3' (

-00*(

DI 9 ,!J 9 ' ( < <=, ?= K( 1 ! 1

+ 9 G @ " ! '

-00+(

D @E9 ' ( ( U (

(18)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 $

? >9' !( SVAW9 ' T( = U , ]

U U( $ G R @ U

> R ' D ] U' $ ' ! R

@ U > R ' E ' > ' -00M' (

1M,MM(

?9 > ' ( ( 4 U U

( $ G ' )1 ' )**-' < '

% ' ! )1 '

] ' <T' @> ' A ' )**-' (

M+*,M1M(

T=<9>' >( ! H< 9 ' D( R( U

G " ( A !

/ 1 ! ? ! / + 1 BA /?/+3' "(M+'

(F' ( 2M+,233' -00-(

A$<' K( ! < 9A' !( K " U ( $ G

W ] K " U K ' 3 ' -00)' >& ' '

@> ' !

>$DWKK W ] K " U K '

< ] H ' @> ' ' -00)' ( +-+,+-F(

9K ?9' ( > E' >( = U ( $ G > E' >( > @K9 ' (

59 (6( - ( E G > ' -001( ( )3+,)F*(

<<$<D' ( K( > ?[ 9' ?( < !

' G $ ! ' )***( K 7"

G Y ( ( ( /2+M1--( Z( G -0/)0/-00F(

$W?99S' ( $< ?' >( ] ( $ G

< A ! ' M ' )**3'

R ' K ( ! <

A ! ' > ' ! ' @> '

A ' )**3' ( +3-,+3*

$AA9 ' D( ( $ R < G , (

?

A ! 5 $ 1 "( +' ( 1' ( -+M,-11' )**0(

$AA9 ' D( ( R < G 9 ( !

85 "( +F' ( ))' ( +*,1)' )**M(

= $<' 9( T X@9 $<' ( 4

U U ( ' "( +F' ( 1' ( +2+,+*2'

-001(

<=H' <( ( @>9<' ( ( ! G ,

U " ( $ G )F <

$ ' )F ' -00-' 9 ' ( ! )F

< $ ' ! ' ' $

(19)

! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1

=!9< ?9> @ @>! ( C * /

0 / 9 % K 7" G

Y G// ( ( Z( G -2 ( -0)0(

$E9$ = T@<$= ' A( ( = A!G %&

A7 ! ( -00F( )MF ( K %&

5 %& 6 , @ " S >

, @<$>$<=>' -00F(

H@' !( ( ?=$' W(>( U U

U( $ G R = U A ! ' - ' -002'

>U U' ' ! - R = U A

! ' > ' ! ' @> '

A ' -002' ( 1)Q1F(

> E' >( 9 K <<' ( K ?9' ( 9

( $ G $T $ R 9,E $ R '

) ' -00)' > ' R ' @> ' ! $T $ R

9,E $ R ' ! ' ' $ ! 9>>'

-00)' ( )31,)FM(

> @K9 ' ( E9<T $<>' ( 9<>9A' K( W ] G

( 0 2 , ' ' "( -M' ( )2),

)*3' )**F(

S9A K$' !( < S$DA$ ( $>>$W= ( ? ! 4

1 ( A ' G $999

> U ! ' -00-(

S=>>9<' !( ' 4 : ; , $

, - (

K ' < G W ] ! ' )**F(

? ' ( ( != =< =G %&

# ( *- ( )3/)-/-00*( K %& 5

# %& 6 , ! 7 @ " : ! Q

!@ ! ' ' )3/)-/-00*(

? ' ( ( S A?=' K( ( A@ 9AA$' ( != =< =G

%& # ( A !

? ! '( "( M' ( -' ,. ( -0)+( G//]]](. ,

( (] / . ,. / ( /. , / /" ]/-+-/)23(

Referências

Documentos relacionados

Ninguém quer essa vida assim não Zambi.. Eu não quero as crianças

Por último, temos o vídeo que está sendo exibido dentro do celular, que é segurado e comentado por alguém, e compartilhado e comentado no perfil de BolsoWoman no Twitter. No

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para

Apesar da longa distância dos grandes centros urbanos do país, Bonito destaca- se, regionalmente, como uma área promissora dentro do Estado de Mato Grosso do Sul. Bonito,

Ela tem como objetivo principal descrever o conhecimento sobre os elementos essenciais que devem ser considerados na aprendizagem cooperativa, envolvendo pessoas, atividades,

a) “Ao fundo da nossa rua, depois de todas as casas, depois de todas as árvores, depois do campo de ervas altas e do ribeiro de água gelada, há um muro”.. Depois, transforma as

Para esse fim, analisou, além do EVTEA, os Termos de Referência (TR) do EVTEA e do EIA da Ferrogrão, o manual para elaboração de EVTEA da empresa pública Valec –