• Nenhum resultado encontrado

WebPath - Uma Ferramenta para Mineração e Visualização de padrões de Navegação do Uso da Web

N/A
N/A
Protected

Academic year: 2023

Share "WebPath - Uma Ferramenta para Mineração e Visualização de padrões de Navegação do Uso da Web"

Copied!
5
0
0

Texto

(1)

WebPath - Uma Ferramenta para Mineração e Visualização de padrões de Navegação do Uso da Web

Cristian Tristão, Vantuir Pereira Teixeira, Karin Becker

Idade de Informática - Pontifícia Universidade do Rio Grande do Sul (PUCRS)

Facu

Av. lplranga

.

6681 - 9

O

619-900 - P0l10 Alegre - RS - Brazil

.

ctristaO@pop.co~.br, vantuir@terra.co~.br, kbecker@inf.pucrs.br

Resumo. A Mineração do Uso da Weh (MUW) visa descobrir padrões de navegação a partir da análise delogs deservidores Web. Este trabalho descreve as funcionalidades e a implemeniaçãa de WebPath, uma ferramenta voltada à descober/a e inlerpretação de padrões seqüenciais de navegação. As características principais desta ferramenta são a busca dirigida de padrões a par/ir de critérios e~pecificados por um usuário. bem como os recursos de visualização oferecidos para interpretação dos padrões. Testes preliminares revelam umótimo desempenho dos algoritmos implemeruados.

Abstract. Weh Usage Mining (WUM) aims 10disco ver navigaiion patterns from lheanalysis oflogs in Weh servers. Thepresent work describes thefunctionalities and implemenuuian of WebPath. a support /001 for lhe discovery of sequeruial navigation pauerns. The striking [eatures are lhe directed searcb jár pauerns

based on user-specijied criteria; as well as the visuaiization functionality for pauern inierpreuuion. Preliminary tests disclose a good perjormance o{ lhe implemerued algorithms.

1.Introdução

Ofluxo incessante de acessos àspáginas Web reflete os conteúdos mais diversos, bem como costumes e necessidades pessoais ainda mais distintos, resultando em padrões de utilização

~cos ediversificados. A Mineração do Uso da Web (MUW) [C0099, SRIOO, SPIOOjé a area depesquisa que visa extrair padrões de navegação na Web tendo como principal fonte de dados olog deum servidor Weh,que registra todos os acessos àspáginas de umsite feitos pelo~u~uários. A MUW tem sido aplicada aos mais diversos domínios, abrangendo desde o comercIOeletrônico até a educação à distância.

~ processo de MUW é dividido em três fases genérica, [C0099]: pré-processamento, i;scOberta depadrões e análise depadrões. Opré-processamento inclui a limpeza dos dados,

enuficação d ' . I d inh ., A

A f ' e usuanos e sessões, comp.emento e cami o e enriquecimento semântico.

d dase de descoberta de padrões restringe-se à aplicação de algotitmos de mineração de

~ál~s (e,g, seqüência, associação, classificação), visando adescoberta de padrões. A fase de int ise tem por objetivo identificar entre os padrões minerados, aqueles que são

eressantes. ,por meio. da.mterpretaçao- e validIaçao- destes nodorníormmo.. At' .

porecnlca dedescoberta de padrões seqüenciais éparticularmente interessante para a MUW, aceoexpressar como os usuários interagem com os sites Web, isto é, quais páginas são

"sada~e em qual ordem, Opadrão seqüencial X-7 Y,por exemplo, mostra que apágina

(2)

Y foiacessada após (imediatamente ou não) a página X. Uma medida de supon- éa\. . aeste tipo de padrão, neste caso indicando em quantas sessões este padrão de naveg:~1 observado. Contudo os algoritmos clássicos de seqüência (e.g. [AGR94, MAN95)) pçao limitações quando contextualizados na MUW [SPIOO). Considerando o exemplo aCimoss~

importante do que conhecer a seqüência X -7 Ye seu suporte, é saber que apenas IO~Illais que acessaram X conseguem convergir para Y. Isto poderia significar, por exemploc ~ somente 10%daqueles que colocaram produtos em umcarrinho virtual, efetuaram aco ' <Jue Este tipo de algoritmo também não captura eventuais desorientações do usuário, já qUIllPl\

distingue entre os vários acessos a uma mesma página no contexto de Uma see.~

Finalmente, a análise dos padrões éuma das etapas mais críticas no processo. Tipicam:São.

os usuários conseguem apenas especificar critérios estatísticos sobre os padrões procu:

(e.g. suporte), resultando em um enorme volume de regras a serem interpretadas. A reduÇi) do espaço de busca acaba sendo feita na fase de preparação de dados, no qual apem, u

subconjunto dos dados é submetido àetapa de mineração.

rn

Aferramenta WehPath, descrita neste trabalho, aux.ilia asfases de descoberta ede análisede padrões. WehPath permite dirigir abusca de padrões seqüenciais de navegação, por meioda especificação das propriedades dos padrões que devem ser minerados. As propriedades incluem o conteúdo (e.g. conter a página A), estatística (e.g. possuir pelo menos 5 acessos) ou estrutura (e.g. ser composto de até 5 páginas) dos padrões. Uma interface gráfica permite a formulação da consulta de forma amigável, sem necessidade de aprendizado de uma sintaxe específica. A tarefa de interpretação de padrões é facilitada tanto pelo número mais reduzido de padrões e pela restrição do foco de interesse, quanto pelos recursos oferecidos por WehPalh para a visualização gráfica dos padrões seqüenciais. Testes de desempenho revelam que os algoritmos que implementam estas funcionalidades apresentam um desempenho muito bom.

O restante deste texto está estruturado como segue. A Seção 2 apresenta os trabalhos relacionados. A Seção 3 apresenta as funcionalidades de WebPalh, discutindo brevemente sua implementação. Resultados de desempenho são resumidos na Seção 4. Conclusões

e

trabalho futuros são endereçados na Seção 5.

2. Trabalhos Relacionados

Os objetivos e aplicações da mineração do uso da Weh são discutidos por Srivastava et ai.

[SRTOO]e Spiliopoulou [SPlOO].Os problemas relacionados àbaixa confiabilidade dosloXs de servidores Web, bem como asprincipais técnicas utilizadas no pré-processamento desteS dados são discutidos por Cooley etal.[C0099].

AIgoritmos de padrões seqüenciais (e.g. [AGR94, MAN95]) foram propostos no contextode seqüências de transações. Um problema típico é encontrar seqüências de itens adquiridos par um cliente, analisando suas várias transações distribuídas notempo.

As limitações deste tipo de algoritmo para o contexto da Web são destacadas par Spiliopoulou et alo[SPI98, SPIOO], as principais, entre elas,já abordadas na introdução des~

trabalho. Estes autores propõem aferramenta WUM (Web Usage Miner), aqual oferec~

I,inguagem poderosa de consultas (MINT) erecursos para visualizaçã~ dos resul~d?~ .. ndo e uma Irnguagem textual que possibilita dirigir a busca dos padroes seqüenciais usa (11 parâmetros estatísticos, estruturais, e de conteúdo. Webl'ath, apresentada neste trabalhO.lede um forte embasamento nos conceitos e mecanismos apresentados na abordageJ11

J et al., diferenciando-se por oferecer uma interface gráfica mais intuitiva para SpiliOpou_oUde consultaS e visualização de resultados. Também, testes de desempenho não forJ11ulaçaotrados naliteratura para o sistema WUM.

foramencon

3. webpath

hé uma ferramenta para a mineração de padrões seqüenciais de uso da Web. Focada Webpatsdedescoberta depadrões e de análise de padrões, ela assume como entrada um lag

na:fase essado contendo sessões de navegação. Sobre este log, o usuário pode especificar pre-~:~ que dirijam a busca dos padrões de navegação e visualizar os resultados. A Figura

~~~~uilustraa interfaces de consulta, e a Figura I.(b) mostra ainterface para a visualização e . rpretaçãO de resultados.

lOte1M I II

!Jl;;;;'i@bifii:

tU.' I

êjíi;g';?l ••

f.rf •••••••••.••*«AIt'·t.~ ••

11M••••••• .,.",... •••••••

~ •. ,...• ~..w..~ ..•

•....

•.••••••

~

_~•••.

..•.

i*;jIj;..•••••.•.••

--

~ •. ,A..

f.'"

••••.11-"

p..,.••.•

c"llI'Itiod.

\"-,,~ Cu""~ou(lo

•... -.

•.•.•...

- -'

,,..-

..

,.-

L

.•...

•....

I.,., Ibt.,.

t"

llilV(,I;•• cJ..,p....:JI/MI,

~","*'-'-

,11(.,.- CrfU\ 110do

'" -- .••••••.•••• •••••• eacal'.UC.a

0..••,-...

CrH*,rtod.

Cnf't'J",dQ

,.",.

l •••• lK •••• UlI."-'- •••.•.• t.'HpO dI) .••u.u,,'h.ç..lO

,.- ....•. ..,. -

,...•.

,.-

1-

.. o.. -

~---

0.. •

.0. -~ --

,"uN ••'.,...r•• - .•.••. "r.,-".- Crlt.f1o o. ,.

~

'"

. ~

" ••••••••• ~"C .•••••••• ~ c •••t.Itt1"

•. -

(a)Consultas,I .f (b) Vlsuallzaçllo

-

~~1.e Interpretaçl!O de Padrões,.. •••__ l,aiJIN ~ ••I.-"

Figura 1 - Interfaces deWebPath

3.1.Árvore Agregada

A á/vare agregada, inspirada na abordagem de Spiliopoulou et al. [SPI98J, é uma representação interna criada por WehPalh para representar o log de entrada fornecido pelo usuário. Assume-se que o log Weh tenha passado por todas as tarefas típicas de pré- P~~essamento [C0099], resultando em um conjunto ordenado de registros de acessos a paginas, agrupados por sessão. O objetivo da árvore agregada é representar de forma

~~:pacta todas as trilhas de navegação perconidas no site pelo conjunto de todos os Cdanos. As tnlhas dos diferentes usuários são unificadas com base nos prefixos em comum.

reranado da árvore corresponde auma ocorrência de página em uma trilha. Cada nodo é o:re~en~ado por uma tripla <E; O; A>, na qual "E" representa a URL da página, "O" a núOrrencla da página na trilha (ordem em que a página "E" aparece na trilha) e o "A" o

mero deacesses aque a ocorrencia'I •. depagina,. tn'Iha.

Ap'(to19ura2 ilustra uma árvore agregada, considerando as 5 sessões contidas notog de entrada POda figura àesquerda). O nodo "ROOT' é a raiz da árvore enele étotalizado o número

(3)

I "0"1

de sessões contidas no log de entrada. Após este nodo, aparecem as trilhas dos

'fi d 'fi A' bifu . usu

um ica assempre que possuírem pre xos em comum. ssirn, as I rcações repre' parte não comum de trilhas, No exemplo, todas astrilhas iniciam por"X" ou "C". ~en~

possui duas visitas à página HC", sendo estas diferenciadas na árvores agregucttrilha

ocorrência 1e 2.O mesmo para a página "D". aPela

1.x·y-z 2. x-o-y 3.c-o

4. x·V 5. c-d-e-o

r

[págma.ocotrénae.nO acessos}

.rv

tnlhas

álVore agreoada /' IV,1.2}-IZ, 1.1]

IX,1,31,

,,/ "10.'·'I-IV 1.1]

IROOT1,51,---

IC.l,21-ID, 1.21-IC 21(-ID, 2;11

Figura 2.Unificação de trilhas para a geração da árvore agregada

3.2. Recursos de Consulta

Entende-se por consulta abusca de padrões seqüenciais dirigida por critérios especificados pelo usuário. Estes critérios podem ser divididos em 3 categorias: (a) conteúdo (lJRL 00 título que identifica a página), (b) estrutura (tamanho do padrão) e (c) estatística(a ocorrência de uma página na trilha, ou uma medida relativa àfreqüência de acessos feitosa uma página). No caso da medida estatística de freqüência de acesso, as opções são o

número

absoluto de acessos, o suporte (proporção de acessos sobre o total de sessões nolog),ouo grau de convergência (razão dos acessos entre apágina inicial e final de um padrão),este último somente disponível para página final.

A combinação destes diferentes tipos de critérios permite ao usuário realizar três categorias de consulta, as quais são descritas abaixo eilustradas considerando a árvore agregada exibida no topo da Figura 3.

Pesquisa Início: deseja-se conhecer os diferentes destinos a partir de uma dada página.

isto é, para onde se dirigem os usuários. Portanto, as restrições são definidas somenle sobre a página inicial, indicando opcionalmente otamanho do padrão. Na consultada Figura 3.(a), deseja-se saber todos padrões que iniciem pela primeira ocorrência da página X em uma trilha.

Pesquisa Fim: permite descobrir a origem dos caminhos que chegam a uma determinada página, e portanto são definidos critérios somente para a página fi~a1(e opcionalmente, critério de tamanho). A consulta da Figura 3.(b) procura todos camin/JOS que levaram àré-visita deuma página qualquer (ocorrência igual a 2).

Pesquisa Início-Fim: serve para encontrar os diferentes caminhos percorridOS ~~:

, . d . . d d ifi d d S coleo

usuanos entre OIS pontos com propne a es espec rca as, sen o o )

A

especificados sobre aspáginas inicial e final (e opcionalmente, critério de taJ~~O" e consulta da Figura 3.(c) procura todos os caminhos que iniciaram na pagina eOIS terminaram em uma página que possui no mínimo 2 acessos. A Figura l.(a) apres outro exemplo desta categoria de consulta.

IVL-IVI

I.tIV'O(C(l9(&9,,"!t

(V 121-II , 'I IX' 31

10I 1J IV' "

(ROOT 151

le '21 (O' 21 IC? 'I [O? 1J

I

--c-~~::~:~,;~-;n;~,~' ---'--.. :~~:I~~~~ C~'~:;8- -:J"(~;- I

:~I~~a= I

O

IX' 31-lv, 21-ll , "

Pá9"'. FIO'" QIX\ 31-10 , 'I-[Y , 1J

- 'c-'-"-'~'~; ;,;;q,~~.~~I· ..---_ - -_. -..-

(b)

j

Paçlna Inoal tesuitodo dacef)$.v~t'I

O

IC , 21-10 , 21-IC 2.'I

Qle , 21-10 121-IC 2 11-102 11

Pagln.ft Ftnal

ocorrêrv;r.a ;:.2'

.-;;";~ir~

P;~Q,,;,;~~n~~~:Ii;;;-. --..-- ----.. -... --. --- -- -.(~).

P;;)9U'\3 h'''1(:L31

uRl =X

'8SU,'f8dO (j8COll~ull:a

01)( I~I IV' 21 Ptlçln.aFII''Iêl!

3Ct)'UOS ;.~:2

... -_ ..-_ _---_ __ -_ ..

Figura 3. Tipos de Consultas

3.3.Recursos de Visualização

A atividade de interpretação de padrões é de natureza difícil. O volume de padrões a ser interpretado,e arelação destes com o domínio para determinação do grau de interesse estão entre as dificuldades a serem vencidas. Observa-se na Figura 3 que o resultado de cada consultaé um conjunto (possivelmente vazio) de padrões seqüenciais. Cada padrão éuma trilha de navegação encontrada em uma ou mais sessões de usuários. Note-se que há vários padrões que, ainda que representem trilhas diferentes, possuem prefixos comuns, como por exemplo, ospadrões da consulta ilustrada na Figura 3.(a). Também pode haver interseção entreos padrões retomados por uma mesma consulta, como no caso da consulta ilustrada na Figura 3.(b),no qual o padrão A está totalmente incluído no padrão B.

Visando reduzir o número de padrões, bem como simplificar a sua visualização e lI1terpretação, os padrões são visualizados na forma de árvore resultado, cujos nodos são representados pela mesma tripla <E; O; A> descrita na Seção 3.1. Contudo, a decisão de qualspadrões devem ser unificados depende do tipo de consulta feita:

• Pesquisa Início-Fim e Pesquisa Fim: o algoritmo de visualização unifica todos os Padrões que possuem a mesma ocorrência de página tanto no nodo inicial do padrão, quanto no nodo final. Assim, tomando-se o conjunto de padrões retomados por uma Consulta,para cada combinação de nodo inicial/final de padrão será gerada uma árvore :SUltado distinta. A Figura 4.(a) representa a árvore resultado gerada para um conjunto t eP~drões deste caso (i.e. todos os padrões iniciam pela primeir-a ocorrência de K e

errtunaIn pela primeira ocorrência de V).

• ~esq~isa Início: o único critério para unificar ospadrões épossuir a mesma ocorrência r~ pagina inicial. A Figura 4.(b) representa a árvore resultado para dois padrões

ornados por esta categoria de consulta.

(4)

(a) f'rPre'et'Itaç,jc gntfk.. da0I'V0re: ~wr.(jo

IX, l) (V, ~I

-. ..

(O,,, (V 1I)

-. - ·-e

•• ;0 I '] .•• te2 t) .IY 11) fl:.'I.swradO caconsufl'lt atI( ,SI

OI" 1 1] IX1 ~I IV,21 I

OIK1') IXI IJ 10 , 'I· IY, 'i -1

a

I" I2) IC' ~I 10, 1) jC"1 IV' '1 4

..

(e ,'I

(b) resuJtado du<:on:su.1'IJ rr.p~3er,tDç.:io gnJ/k"dadl"YOrere13ulflldo

IV, 'I Il 1 'I

â- ..•

10 , '1 IV1 tJ

--... ...

o

P;III IV' 1) -11' 'I

0!X ,'1-(0 , 'I-IV' 'I

'4

,:a:

1 'I 0-

Figura 4.Árvores Resultado

Note-se que em alguns casos os acessos dos nados unificados são acumulados (e.

Figura 4.(a), onado unificado K totalizou 5 acessos), eem outros não (e.g. nado Xda

l na

4.(b)). Neste último exemplo, supondo que os padrões sejam aqueles retomados ::

consulta 3.(a), trata-se exatamente do mesmo nado na árvore agregada, portanto a SOrna implicaria em erro. Tal situação é controlada pelo algoritrno de unificação.

Em termos de interface, o usuário visualiza os padrões de três formas (Figura I.(b)).

Na

janela superior (lista deárvores de padrões), são apresentados o nado inicial efinal detodas as árvores resultado geradas pelo algoritmo de unificação de padrões. Selecionando lIIlIa

árvore resultado, o usuário pode inspecionar sua estrutura (janela ao centro). Sob demanda esta visualização pode ser melhorada (janela inferior), como noexemplo, noqual se colocao nome das páginas, enão sua identificação interna.

3.4.Projeto da Ferramenta

WebPath foi implementada utilizando alinguagem lava. A Figura 5 apresenta odiagramade classes UML do projeto, o qual foi desenvolvido de acordo com o padrão arquitetural

MVC

- Model- View-Controller. Os algoritmos não são apresentados por limitações deespaço, podendo ser consultados em Tristão etal. [TRI04J. As classes estão

assim

divididas:

• Objetos de negócio (Model) - Page,Pathhlrmeru, TreeNode eStructõata (aqualreúne vãrias outras classes), utilizadas para representar emanipular aárvore agregada;

• Interface com o usuário ou outro sistema (View) - FullScreen e lnierfacescreen

para

informar os dados de consulta evisualizar ospadrões resultantes;

• Controle do fluxo da aplicação (Controller) - MinerController, Loader, Minere unifitr que realizam ocontrole dos processos existentes na ferramenta.

4. Análise de Desempenho

Para analisar odesempenho da implementação de WehPath, foram realizados testes,vi~

verificar a demanda de memória ede processamento de cada módulo da ferrame~tadWS

utilizado um Pentium III - l Ghz, com 256 MB de memória RAM, e plataforma W~~

2000. Para os testes, utilizou-se um log real de um site vinculado a PUCRS VIR. de departamento de educação a distância da PUCRS. Ele refere-se a um curso intenS~~

extensão com quinze alunos. A relação dos registros foi puramente quantitativa. VI~

testar um volume típico e expressivo de aplicações de Mineração do Uso da Web.Os foram pré-processados usando a ferramenta proposta porMarquardt etal. [MAR04J·

r) !tl~e StrUC1O.", ..

~ l

~ I

.tiaS"'" H&!>t~

I .

,:$PaQr0 n

?-

.)3'!'

I

I

•••.corttOl .•~

I

.•.•••'"s...»teUll tiA,_ uot$1..""

)"

MnetCOf«loI .ull!. Ve..:~U

r()

l

lOOlT'_~

,-~,ocJ~

~

••.v"

stt'.;ct 01

H._} ps·')lel loa<je •

l-

-àC~O'!rreeeooe1ft

fui$çredl I l -ldr'eeJ.IQOe nC

.--

-r~sCO(np AA8',1...t!t

POiROI

I]

.000~·L""",,-.n unlrt-r -:tr.,l;t b(l:m ..•~

1

pEithEleme-nt

.rtcP"''''••

-./

I.)r'IIIhor

1-

.E'SP.J.NI'IA.•.•

.E'SPççtUNA •• I...,"'••I.>'i'~ l~'" 1 PatnEiement

I

pos.uon1

.dP...,...

I

OCQtM:~ lf1

rrcoer 'iIrMct

r

Post)Q('l

I - ~

r

.rroFI'lt)1n

I

.. kt1aP.!Idroe.1:'Cons.oId8do! L~ctll"!t

.rt,*.->.fi ·1o$l/IPadtoe~",· l-ricdJ$1 1_ •••JI'~t>oc;jeo(l

Figura 5. Projeto de WebPath(Diagrama de Classes UML)

Testespreliminares mostraram resultados encorajadores. Em termos absolutos, aferramenta gastou6segundos para construir uma árvore agregada para 100.000 registros (42561 nados), um volume de dados expressivo em MUW. Este tempo élinear. AFigura 6 mostra otempo tomado para duas dentre as consultas realizadas, considerando árvores com diferentes númerosde nados agregados. Estas consultas foram propositadamente bastante genéricas:

todasas combinações envolvendo qualquer uma daspáginas dosite (Figura 6.(a)) equalquer caminhoiniciando por uma página com no mínimo 5 acessos (Figura 6.(b)). Apesar de retomaremum volume expressivo de padrões (53060 e21970, considerando a maior árvore testada para cada consulta), Otempo absoluto para realizar tais pesquisas foi muito bom. O tempo deprocessamento é em função do número de nados da árvore agregada ede padrões encontrados, não tendo, ainda, sua complexidade sido totalmente caracterizada. Este bom desempenho deve-se à arquitetura escolhida, a qual armazena todas suas estruturas em memória,evitando assim o acesso a disco, mais custoso. A unificação e visualização de padrõestambém apresentaram resultados animadores. O conjunto de testes considerando todasasfuncionalidades deWebPath pode serconsultado em Tristão etaI.[TRI04J.

Tempo piua tealizm uma pe equis a-huclo Comtiiteliosde conteúdo

Tempo I);}Ia1e.lliz,lIuma pesquisa-huclo com todos ostiitelío s iniciais

4 .-.- --

-7.

98

3,5

3 /'

s

25 »:

~ '2 ./

ij 1,5 .A17

••. 1 ..<.

0,5 ~ ,

O~~

4000

3 2.5

~ 2

~ 1.5

~ 1

0,5 O 4000

-

,74

12000 20000 28000 36000 44000 lIúmelo deTIeettodes

12000 20000 28000 36000 44000

(a) Húmer o de Treellodes

(b)

'fa·.. Figura 6- Pesquisa Início (tempo X n2de nados)

IS reSUltados. para uma quantidade. expressiva. de d da os, eVIidenciencra a eficacia,. dos

(5)

algoritmos desenvolvidos, salientando que devido o limite de memória foi exc d' somente 2 casos nos testes desenvolvidos, na qual as consultas eram altamente g I~O

Contudo, O uso de WebPalhéjustamente recomendado quando o analista deseja

u enerj

mais dirigida de padrões, para facilitar o processo de interpretação, sendo que

:a bu

1 - d ' . ttPo

consu ta nao eve ocorrer napratica.

s. Conclusões

Este trabalho descreveu WebPath, uma ferramenta de mineração de padrões de nav seqüenciais na Web. Por meio de uma interface gráfica amigável, o usuário tem

e?a

l disposição recursos poderosos para minerar de forma dirigida um log Weh,einterpre~

resultados. ~m comparação com a ferramenta WUM [SPI98]: a) o usuári~ nãoprecisasal nenhuma sintaxe para formular suas consultas; b) os recursos de vlsualização fi simplificados sem perda no poder de interpretação, facilitando esta tarefa, c)o desem~~

não pôde ser comparado, pois não foram encontrados testes dedesempenho de

WUM

. ,m

os resultados de WebPalhforam muno bons.

Trabalhos futuros incluem integração de WehPath com recursos de pré-processamen [MAR04], exploração dehierarquias degeneralização noalgoritmo, teste com maiorvolu de dados, bem como uma avaliação da complexidade dos algoritmos propostos.

References

[AGR94] AGRA WAL, R.; SRIKANT, R. "Mining Sequential Patterns". Researc.

Report RJ 9910, IBM Almaden Research Center, San Jose, California, Oct. 1994.

[C0099] COOLEY R., MOBASHER B. and SRIVASTA VA 1. "Data preparation fi mining world wide Web browsing patterns", Knowledge and Information System

vol. 1,n? 1,Feb. 1999, pp.5-32. 11

[MAN95] MANILLA, H., TOIVONEN, H. & VERKANO, A. "Discovering Frequen Episodes in Sequences". In Proceedings of the First International Conference o K.nowledge Discovery and Data Mining, 1995. pp. 210-215.

[MAR04] MARQUARDT,

c.

BECKER, K.; RUIZ, D. A pre-processing tool for we usage mining in the distance education domain. In: Proc. of the 8'" Intemation Symposium on Database Engineering Applications, Coimbra, July 2004. pp. 78-87.

[SPI98] SPILIOPOULOU, M. and FAULSTICH, L. C. "WUM: a Web Utilizatio Miner", In: Intemational Workshop on the Web and Databases, Valencia, SpaJO Mar. 1998, pp. 109-115.

[SPIOO] SPIUOPOULOU, M. "Web Usage Mining for SiteEvaluation. Making a site bettel

fit itsusers". Communications of the ACM, vo1.43,n°8,Aug. 2000, pp. 127-134.

" Web [SRIOO] SRIVASTAVA, 1.; COOLEY, R.; DESHPANDE, M.; TAN, P.N.

"To

Usage Mining: Discovery and Applications of Usage Patterns from Web Data , appear in SIGK.DD Explorations, vol. 1,n°2,2000, pp. 12-23.

- . açãOe

[TRI04] TRISTAO,

c.,

TEIXEIRA, V. P. "Uma Ferramenta para a Mllle:

rr ~

Visualização de Padrões de Navegação na Web". Trabalho de Conc1usao Faculdade de Informática, PUCRS, Porto Alegre, Junho de 2004.

Referências

Documentos relacionados

da quem praticasse tais assaltos às igrejas e mosteiros ou outros bens da Igreja, 29 medida que foi igualmente ineficaz, como decorre das deliberações tomadas por D. João I, quan-

é bastante restrita, visto que tanto suas duas entradas, quanto as galerias e condutos que interligam os pequenos salões são bastante estreitos, e a umidade na maioria dos salões

Para esse fim, analisou, além do EVTEA, os Termos de Referência (TR) do EVTEA e do EIA da Ferrogrão, o manual para elaboração de EVTEA da empresa pública Valec –

Requiring a realignment of the EVTEA with its ToR, fine-tuning it to include the most relevant socio-environmental components and robust methodologies for assessing Ferrogrão’s impact

O objetivo do curso foi oportunizar aos participantes, um contato direto com as plantas nativas do Cerrado para identificação de espécies com potencial

Os ativos não circulantes classificados como disponível para venda são mensurados pelo menor montante entre o seu custo contábil e o seu valor justo, líquido das despesas com a

A assistência da equipe de enfermagem para a pessoa portadora de Diabetes Mellitus deve ser desenvolvida para um processo de educação em saúde que contribua para que a

The main objectives of this data analysis are divided into two classes: i) General Statistics: give an overview of structured information on Wikipedia as a whole, showing raw numbers