! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
! " # $ %
& #% '!( ) &
" # $ %
&
*)+), ) - .
/
)
0 1 1 2
% 1
# $ 1# !(
1 1 2 3 & 3
# $ &
# '!, "
# $ % & #% '!(
3 & 3 !
) ' 4
0 1 1 2 3 &
3 # $
& # '!, %
/ 3 & &
3 &
%2 )
0 3 & # $ 2
% 5 ( , )
1
1 2 3 & 3
% ) # ' 6 % 4
! "
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
$ !
! ! "
% # &
$ ! !
! '
!
% %
$ $ 7 ( )
* )
+ ,
! , , - . !
/ !
, With the goal of
reducing such efforts, ontology learning methods have been developed. Therefore, it is necessary to automate the process of acquiring knowledge and different approaches have been suggested. The use of texts as a source of knowledge acquisition appears to be a correct path, since language is the first manner of knowledge transferring among human beings. Besides, there are a lot of digital documents available. To support semi-automatic construction of ontologies from texts, several tools have been developed, each one using different techniques and methods.
0 !
!
1 ! !
8 9: 7 2 , ) * 1)
* 1
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
4 $ # 5$ 6 #
" " 4
7 ' # '
7 8 ( 9 #
%& 7 : ( %&
"
; %& ' ' ' ( !
' ,
, & 4
' & ' '
4 7 %8
7 ' ,
5 $ $ <=' -0026(
< '
7 4 & ' "
4 " 7
5 9$ > > ?@A ' -00*6(
%& ' '
4 B %& 7 %& C
5D @E9 ' )**+' ( -6( 9 %& > '
E . 5)**F' ( )F16' G B %&
7 %& 7
C( < %& ' 4
" , 4
" " ' 7" "
4 (
! %8 ' ' 4 "#
; %8 '
4 ! , ' "
# " %8 5<=H @>9<' -00-6(
" %& " "
" %8 7 (
? %& ' '
" " %& (
8 & '
" " ( ! %& 4
7
' 4 (
' "
' %&
" " " '
" ' " 5 $ $ <=' -0026( ! 8 '
"
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
' %& " 5DI 9 ,
!J 9 ' < <=, ?=' -00+6(
< 4 %& ' /
' '
' '
" 4 ( K ' " '
7 '
# " " . "
% 4 %& (
= 5 1 3
. %&
" 4 .
5DI 9 ,!J 9 < <=, ?=' -00+6(
! ' '
%& 4 %& '
' " 5 9K ?9 > E'
-0016( 9
( A ' %&
' ' ' 4
(
4
7" 4 %8 ' ,
L 4 %& %&
( > E 5-00M6' %&
4 %& '
" 4 #
(
! 4 %&
%& ' "
" " '
( K " ; N ' ,
#, ' 4 4
7 ' 4 &
7" (
9 " &
%& ' '
4
' 7" 4 & 7"
' 4 &
%& ( < , 4
7 ' # " 7"
, # 7 '
" 7" , ( '
4 " 7" (
< ' 7" " 4 N
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
( ! # %&
7" %8 4
& . " " 7
4 . 7" (
= 5* 1 5 3'
D %& = 5* 1
6 6 9 %& = 5* 1 '$ 6'
. %&
4 . 5DI 9 ,!J 9
< <=, ?=' -00+6' , "
%& ' ' (
> > 5-0016'
4 G
6 G 7
4
6 G %8
%8 5 ( 7 6
6 G
6 4 G
,
4 " 7 8 - 5 5O A6
6 G %8
"
(
! ' 7
( %&
5 )6G %&
' P ' %& ' %&
5 & 4 6 %& 5E@$ 9A
D<$<$' -00M6( " ' 4
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 !
) Q 9 %&
G E@$ 9A D<$<$ 5-00M6(
$ , 4
5 $ $ <='
-0026( @ " . "
7 ( =
" %& %&
5 ! 6' '
5!A<6(
< ' 9 &
" %8 N (
7" 4 : 5 $AA9 ' )**0 $AA9 '
)**M6 P # 9 R < 5S=>>9<'
)**F6' P 7 (
%&
P (
5 P 6 # . " " 4
(
! $ "
%8 , '
5 6 4 (
5?9 > ' )**-6' %8 ,
' . " %8 7 5 %& B , C6
( 9 T 4 5-0016'
? 5)**-6' , ' '
7 7 " # # (
< '
, " '
' ' 4 '
P ( = 4
" " E 5-00M6 U 5-0026
E 5-0036(
= 4 %&
P 4
( < 5)**F6 8 4
& " 4
" : %& ( , ' & '
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 "
' " ( 9
L 4 &
(
! & 4 '
" %& 5 $ 6'
7 7 '
5 $ $
(' -00M6( '
4 ( !
: ' , > ' 9
5-00)6(
> 5-0026' ' ' ;
. %& ; 4 " # ( K . %&
& N ( @
. %& 5? >9 SVAW9 ' -00M6
8 8 4 " " . %&
5 ( B " & C6(
; %8 ( ! ' 5A$< ! < 9A'
-00)6 %8 " G BO HC
& BH OC(
#
E , 4
( K 7
' # " 7" , %& '
4 ' , )M
7 ' 7 (
K # 7 '
" 7" , %& (
= X ) "
7 ( 9
# " 7" G =< =A! 5 $E9$ =
T@<$= ' -00F6 != =< = 5 ? ' -00* ? S A?=
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 $
X ) Q "
7
Nome Objetivo e
Escopo Fonte de dados
Intervençã o do usuário Idioma do corpus Fonte
Baségio Extração semiautomátic a de estruturas ontológicas, extração de
termos e
relações taxonômicas.
Texto analisado morfologicamente, o processo é manual.
Seleção de termos extraídos Portuguê s (Baségio , 2007)
ONTOLP Extração semiautomátic a de estruturas ontológicas, extração de
termos e
relações taxonômicas.
Texto analisado morfossintaticamente , no padrão XCES,
utilizando a
ferramenta VISL.
Seleção de termos extraídos e de grupos semânticos Portuguê s (Ribeiro Junior, 2008) PORONT O Extração semiautomátic a de estruturas ontológicas, extração de
termos e
relações taxonômicas.
Texto analisado morfologicamente,
utilizando o
TreeTagger.
Seleção de termos válidos extraídos Portuguê s (Zahra, 2009)
G K 4 (
= X -' D: ,! ' , 5-00+6'
"
7 ( K
7 ' " 7"
, ; W9 52 1 '$ 6 5T=<9> ! H< 9 '
-00-6' 9 $< 9 5E$JE=R > @A < AJ 9< ' )***6 + $ .+ .*
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
X - Q "
7
Nome Objetivo e Escopo Intervenção do
usuário
Idioma do
corpus
Fonte
ASIUM
Objetivo do ASIUM é encontrar relacionamentos taxonômicos entre textos em linguagem natural na língua
francesa. Todo o processo Francês (FAURE; POIBEAU, 2000)
Text-To-Onto
Text-To-Onto tem como objetivo encontrar relacionamentos taxonômicos e não taxonômicos, utilizando técnicas como analise estatística, podas e regras de associação.
Avaliação do resultado final
Inglês
(MAEDCHE; STAAB, 2003)
TextStorm and Clouds
O objetivo TextStorm and Clouds é a criação semiautomática de uma rede semântica, onde contem apenas conceitos e seus relacionamentos, utilizando textos de um domínio
especifico. Todo o processo Inglês
(NOVAK; GOWIN, 1984)
Welkin
Welkin é uma ferramenta que tem como objetivo gerar automaticamente material para um e-learning, utilizando técnicas como TFIDF e qui-quadrado.
Não é necessário Inglês
(ALFONSECA; RODRÍGUEZ, 2002)
WOLFIE (Word Learning From Interpreted Examples)
O objetivo do Wolfie é a aprendizagem léxico-semântica de um corpus de frases com representações de seus significados.
Avaliação do resultado final
Inglês
(THOMPSON; MOONEY, 1997) Inglês Francês Inglês e Francês Inglês Inglês Inglês Inglês Francês e Inglês Alemão Francês Inglês Chinês Francês
Texto em linguagem natural, dicionários e ontologias
Texto em linguagem natural
Ontologia de domínio e WordNet
Corpus pré-processado com representações de seus
significados TERMINAE
TERMINAE tem como objetivo auxiliar o engenheiro de ontologias na
criação de uma ontologia, integrando Texto em linguagem natural
Avaliação do
resultado final (BIÉBOW; SZULMAN, 1999) SVETLAN’
SVETLAN’ é uma ferramenta que cria clusters de palavras que
aparecem dos textos fornecidos, Texto em linguagem natural
Avaliação do
resultado final (CHAELANDAR; GRAU, 2000)
TFIDF-based term classification system
TFIDF-based term classification system tem como objetivo extrair termos de domínio e relacionamentos
entre eles, utilizando como técnica Texto em linguagem natural
Avaliação do
resultado final (XU et al.,2002) SOAT: a Semi-Automatic Domain
Ontology Acquisition Tool
SOAT permite extrair de forma semiautomática ontologias de domínio usando como fonte corpus de
domínio, identificando palavras-chave Texto em linguagem natural
Informações não disponíveis no
artigo (WU et al.,2002)
SubWordNet Engineering Process tool
SubWordNet é uma ferramenta que tem como objetivo construir e manter
línguas alternativas para o WordNet, Texto em linguagem natural Todo o processo (GUPTA et al., 2002) OntoLearn Tool
OntoLearn é uma ferramenta que tem como objetivo extrair termos de domínio de um texto, relacioná-los com conceitos adequados para uma
ontologia e extrair relacionamentos Texto em linguagem natural
Avaliação do
resultado final (VELARDI et al., 2002)
Prométhée
Prométhée é uma ferramenta que tem como objetivo extrair e refinar
padrões léxico-sintáticos relativos a Texto em um padrão restrito Todo o processo (MORIN, 1999) LTG (Language Technology Group)
Text Processing Workbench
LTG é um conjunto de ferramentas que tem o objetivo de descobrir
estruturas internas de textos na língua Texto em linguagem natural Todo o processo (MIKHEEV; FINCH, 1997)
Mo’K Workbench
Mo’K é uma ferramenta que tem como objetivo extrair conceitos taxonômicos utilizando anotações
Texto analisado
morfossintaticamente Todo o processo (BISSON et al., 2000) DOE: Differential Ontology Editor
DOE é um editor de ontologias que permite o engenheiro criar ontologias
em três passos de acordo com a Texto em linguagem natural Todo o processo (BACHIMON, 1996)
KEA: Keyphrases Extraction Algorithm
KEA é uma ferramenta que extrai automaticamente palavras-chave dado
um conjunto de textos utilizando Texto em linguagem natural
Avaliação do
resultado final (JONES; PAYNTER, 2002)
(AUSSENAC-GILLES; SEGUELA, 2000)
CORPORUM-Ontobuilder
Objetivo do CORPORUM-Ontobuilder é encontrar
relacionamentos taxonômicos entre Texto em linguagem natural Não é necessário (ENGELS, 2001)
Fonte de dados
Texto analisado morfossintaticamente
Caméléon
Objetivo do Caméléon é identificar padrões léxico-sintático ou utilizar o padrão de Hearst para encontrar relacionamentos não hierárquicos e
Texto analisado morfossintaticamente Validação ou definição de novas regras léxicas sintáticas
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
%
G W9 '
, ,= != =< =( 7"
, & ' " ; #
5 9 $< 9 Q # A9O9 , = A! Q #
7 6(
' & 7"
( W9 " , "
7 , ,
= " " #
!= =< = " " # ( =
& (
&
%'( ) %
9 7"
" 5 & . ' 4
T " 6( ! '
BT S Q. Y 4 " Z(. C' 4 " .
& . ( 8 %&
' ' 4
(
, ' %& %& (
7" # 5 -6'
4 & 7 ( ?
# %& ( ! 7" '
%&
' A9O 9 ( 9 ' L & 7"
, ' ' ' 9 $< 9(
- Q $ 9 $< 9
G @ =
&
*) *+,
=< =A! %&
! 1( J %& ' '
, : %& ! ( >
1
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
(
4 & '
, =< =A!(
=
& O 9> 57 ' / 6' &
O A ( ! %&
' T 5-00F6 G
6 %& N 5 6
6 N "
5 6
6 %& 4
6 & "
6 %&
4 4 7 "
4 %
6 & " '
(
! "N '
G <( 5 <<$<D > ?[ 9' )***6' !. !
5 <<$<D > ?[ 9' )***6' : .= 5 < $ < <$ K=@ >@T$$'
)**F6 "N '
<( !. ! .= : .= 5 < $
< <$ K=@ >@T$$' )**F6
! %& %8 P ' &
7 " (
& # G %&
%8 P ' %&
%8 P " 8 5?9 > ' )**-3
%& %8 P " 8 5 = $<
T X@9 $<' -0016(
, %& ! ( J
. & O 9> '
&
' %& (
= %&
( : %& ' 7
)(-3-M+) ( <& 7"
' & L " =
5 +6' & 7" " '
& 4 7 ' \ $9< $ \ 4 "
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
+ Q =< =A!
G @ =
&
-% . -
/
%
#
/
9 7" . $K9 9 '
' , , $K9 , ( 8
%& %&
( ! %&
' .
7
# ! ! %&
, ' %&
W9 9 ( > .
4 " %& '
( : '
4 . ; (
: ' W9 4 "
( = X + %&
4 " ' 4
'
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
X + Q 7 W9
Extraídas Automaticamente Selecionadas Manualmente
Bangladesh Bangladesh
Cooperative farming Development aid
Family planning Famine
Famine Food supply
First aid Poverty
Food aid Rural environment
Jute Rural population
Landlessness Social structure
Landowners Tenure
Merchants Villages
G @ =
' %&
" G
"
7 ' (
&
%0 1 *1*)
, '
%& ( %& ' & 7"
%& 4 " " ' & 5
A 6 & 5 R ] 6(
8 %&
'
'
5 & 4 6 %& 7 (
< ' )M
7 7 %&
4 G 4 # ' !. !'
. (
: ' '
%8 P & , 4 (
7 5 16' ,
+ $ >
(
1 Q 7 , ,=
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
' < . . ' 4
& 8 7 ( %&
< . ' ' & '
%& . 4 ' &
7" " %& %8 P (
= /
( %&
/ K ( ! '
! (
" ' '
' #
( 4 , ,= 4
" ( 9
' %8 P & P ( ! '
& '
" (
&
,*'*) *
R ' "
" R9E T S %& ( J
%& # '
" " : ( =
! ;
(
" G
)6 " 4 .
!K
-6 & 4 " 5
8 4 " !K
+6 , '
" %
%& 7
+ +
16 , & "
M6 & + + (
7 '
' 4 " 5 M6G
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
G ? 5-00*6
)6
& 7
4 # ' ! ! & 7
X 1 ,
4 # ' ! !
X 1 Q %& != =< =
Regras de sequência morfológica Substantivo + Adjetivo Substantivo + Preposição + Substantivo Substantivo + Preposição + Adjetivo + Substantivo Substantivo + Preposição + Substantivo + Preposição
+ Substantivo
G ? 5-00*6
)6 P
* + #+ 5=!9< ?9> @ @>! ' -0)06'
%&
-6 4 "
7 # K
# > L 5K >6' "
%&
+6 ' 7
' P
& 7 ' &
' 4 . %&
" 4 "
16 : " '
%&
M6 OA>
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 !
< ' -1
7 7 N %&
(
" ' %& ' &
%8 & P (
2
#
3
' ' L
%& 4 .
' ( < ' . "
% (
? "
( #
& 7" , (
' & & %& '
4 4 & &
%& (
4 '
: 7 & %&
7 ' L '
5 & 4 & 7 6(
= " 4 7"
" " '
& '
" " (
,
7 (
4 %&
7 " ' '
( <& 4 "
& ( " %&
: :
4 . 4 8 4
" (
4 " % '
" "
%& / 4 '
" " %& (
! ' " " '
&
(
'
4 #
E >JD$=' ( @ %&
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 "
0M/0)/)**3( )-1 ( K %& 5 # %& 6 ,
! 7 @ " : D > , !@ >' !
' 0M/0))**3(
E$JE=R' E > @A < >( AJ 9< ' "( T( E( 9 $< 9G ,
U( $ G 9W R, $
W ] 9 W ] ' )) '
)***' K ' ! )) 9 R
W ] 4 ' ' E ' > '
)***' ( 1*,22(
E@$ 9A ' !( D<$<$' E( = U G " " ]( $
E@$ 9A ' !( $ $ <=' !( D<$<$' E( 59 (6' ! ?
/ ( < G $=> ! ' "()-+' -00M( ( +,
)-(
$ $ <=' !( = U G '
" ( < ] H G > ' -002( +13 (
$ $ ' ( D <D9 $' ( > ?' 9( > $ ' T( =T >' $
@ " ]
U U( $ G $ T
$ ' )* ' -00M' E ' ! )* $
T $ ' > ' ' @> '
W ! ' -00M( ( ),2(
@ 9' K( <9K9AA9 ' ( ,
"
U 4 ( $ G S ' !( 59 (6' ! A 9
R
' ) ' )**F' D ' 9 ' !
R
' )**F' ( MQ)-(
< $' W( ( < <$ K=@' >( >@T$$' T( ," / ,"
,] ( $ G 9
" U K A ' - ' )**F'
? ' ' D ' ! > 9
" U K A ' A ' @W'
> ' )**F( ( MFM,201(
9$ >' > ?@A >( = ' R ( (' ??/ (
' ? ! ? / @ ( T ' "( +' ( )' ( 1,3' (
-00*(
DI 9 ,!J 9 ' ( < <=, ?= K( 1 ! 1
+ 9 G @ " ! '
-00+(
D @E9 ' ( ( U (
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1 $
? >9' !( SVAW9 ' T( = U , ]
U U( $ G R @ U
> R ' D ] U' $ ' ! R
@ U > R ' E ' > ' -00M' (
1M,MM(
?9 > ' ( ( 4 U U
( $ G ' )1 ' )**-' < '
% ' ! )1 '
] ' <T' @> ' A ' )**-' (
M+*,M1M(
T=<9>' >( ! H< 9 ' D( R( U
G " ( A !
/ 1 ! ? ! / + 1 BA /?/+3' "(M+'
(F' ( 2M+,233' -00-(
A$<' K( ! < 9A' !( K " U ( $ G
W ] K " U K ' 3 ' -00)' >& ' '
@> ' !
>$DWKK W ] K " U K '
< ] H ' @> ' ' -00)' ( +-+,+-F(
9K ?9' ( > E' >( = U ( $ G > E' >( > @K9 ' (
59 (6( - ( E G > ' -001( ( )3+,)F*(
<<$<D' ( K( > ?[ 9' ?( < !
' G $ ! ' )***( K 7"
G Y ( ( ( /2+M1--( Z( G -0/)0/-00F(
$W?99S' ( $< ?' >( ] ( $ G
< A ! ' M ' )**3'
R ' K ( ! <
A ! ' > ' ! ' @> '
A ' )**3' ( +3-,+3*
$AA9 ' D( ( $ R < G , (
?
A ! 5 $ 1 "( +' ( 1' ( -+M,-11' )**0(
$AA9 ' D( ( R < G 9 ( !
85 "( +F' ( ))' ( +*,1)' )**M(
= $<' 9( T X@9 $<' ( 4
U U ( ' "( +F' ( 1' ( +2+,+*2'
-001(
<=H' <( ( @>9<' ( ( ! G ,
U " ( $ G )F <
$ ' )F ' -00-' 9 ' ( ! )F
< $ ' ! ' ' $
! " # $ %& ' "()*' ()' (+,-)' . (/ ( -0)1
=!9< ?9> @ @>! ( C * /
0 / 9 % K 7" G
Y G// ( ( Z( G -2 ( -0)0(
$E9$ = T@<$= ' A( ( = A!G %&
A7 ! ( -00F( )MF ( K %&
5 %& 6 , @ " S >
, @<$>$<=>' -00F(
H@' !( ( ?=$' W(>( U U
U( $ G R = U A ! ' - ' -002'
>U U' ' ! - R = U A
! ' > ' ! ' @> '
A ' -002' ( 1)Q1F(
> E' >( 9 K <<' ( K ?9' ( 9
( $ G $T $ R 9,E $ R '
) ' -00)' > ' R ' @> ' ! $T $ R
9,E $ R ' ! ' ' $ ! 9>>'
-00)' ( )31,)FM(
> @K9 ' ( E9<T $<>' ( 9<>9A' K( W ] G
( 0 2 , ' ' "( -M' ( )2),
)*3' )**F(
S9A K$' !( < S$DA$ ( $>>$W= ( ? ! 4
1 ( A ' G $999
> U ! ' -00-(
S=>>9<' !( ' 4 : ; , $
, - (
K ' < G W ] ! ' )**F(
? ' ( ( != =< =G %&
# ( *- ( )3/)-/-00*( K %& 5
# %& 6 , ! 7 @ " : ! Q
!@ ! ' ' )3/)-/-00*(
? ' ( ( S A?=' K( ( A@ 9AA$' ( != =< =G
%& # ( A !
? ! '( "( M' ( -' ,. ( -0)+( G//]]](. ,
( (] / . ,. / ( /. , / /" ]/-+-/)23(