• Nenhum resultado encontrado

HAREM e MiniHAREM: Uma análise comparativa

N/A
N/A
Protected

Academic year: 2021

Share "HAREM e MiniHAREM: Uma análise comparativa"

Copied!
56
0
0

Texto

(1)

HAREM e MiniHAREM:

Uma análise comparativa

Nuno Cardoso

Encontro HAREM

15 de Julho de 2006

FLUP, Porto

(2)

Participação no HAREM

HAREM (14-2-2005)

10 participantes

6 países

PT, BR, MX, DK, ES

e FR

18 saídas (3

não-oficiais)

MiniHAREM (3-4-2006)

5 participantes

2 países

PT e BR

20 saídas

- Só para os participantes

do primeiro HAREM

(3)

HAREM numa casca de noz

Eça de Queirós nasceu na

Póvoa de Varzim em 1845.

Colecção de textos HAREM

(4)

HAREM numa casca de noz

Eça de Queirós nasceu na

Póvoa de Varzim em 1845.

Participante

Sistema REM

participante

<

PESSOA

TIPO=”

INDIVIDUAL

” MORF=”

M

,

S

”>

Eça de Queirós</

PESSOA

> nasceu na

<

PESSOA

TIPO=”

INDIVIDUAL

MORF=”

M

,

S

”>

Póvoa</

PESSOA

>

de Varzim

em

1845

.

Etiquetagem

automática

Saída do Participante

(5)

HAREM numa casca de noz

Eça de Queirós nasceu na

Póvoa de Varzim em 1845.

<PESSOA TIPO=”INDIVIDUAL” MORF=”M,S”>

Eça de Queirós</PESSOA> nasceu na

<LOCAL TIPO=”ADMINISTRATIVO” MORF=”M,S”>

Póvoa de Varzim</LOCAL> em <TEMPO

TIPO=”DATA”>1845</TEMPO>.

Colecção Dourada

Avaliação

HAREM

Colecção de textos HAREM

Participante

Sistema REM

participante

<

PESSOA

TIPO=”

INDIVIDUAL

” MORF=”

M

,

S

”>

Eça de Queirós</

PESSOA

> nasceu na

<

PESSOA

TIPO=”

INDIVIDUAL

MORF=”

M

,

S

”>

Póvoa</

PESSOA

>

de Varzim

em

1845

.

Etiquetagem

automática

(6)

HAREM numa casca de noz

Eça de Queirós nasceu na

Póvoa de Varzim em 1845.

Identificação:

Eça de Queirós:

Correcto

Póvoa de Varzim:

Parcialmente Correcto

1845:

EmFalta

Classificação Morfológica:

Eça de Queirós:

Correcto

Póvoa de Varzim:

Errado

no Género

Classificação Semântica:

Eça de Queirós:

Correcto

Póvoa de Varzim:

EmFalta LOCAL

Espúrio PESSOA

1845:

EmFalta TEMPO

Pontuações

Colecção de textos HAREM

Participante

Sistema REM

participante

<

PESSOA

TIPO=”

INDIVIDUAL

” MORF=”

M

,

S

”>

Eça de Queirós</

PESSOA

> nasceu na

<

PESSOA

TIPO=”

INDIVIDUAL

MORF=”

M

,

S

”>

Póvoa</

PESSOA

>

de Varzim

em

1845

.

Etiquetagem

automática

Saída do Participante

<

PESSOA

TIPO=”

INDIVIDUAL

” MORF=”

M

,

S

”>

Eça de Queirós</

PESSOA

> nasceu na

<

PESSOA

TIPO=”

INDIVIDUAL

MORF=”

M

,

S

”>

Póvoa</

PESSOA

>

de Varzim

em

1845

.

Etiquetagem

automática

Saída do Participante

Colecção Dourada

<PESSOA TIPO=”INDIVIDUAL” MORF=”M,S”>

Eça de Queirós</PESSOA> nasceu na

<LOCAL TIPO=”ADMINISTRATIVO” MORF=”M,S”>

Póvoa de Varzim</LOCAL> em <TEMPO

TIPO=”DATA”>1845</TEMPO>.

Avaliação

HAREM

(7)

Cenários selectivos em 2005

HAREM

Sistema Saída

PESSOA ORGAN. LOCAL

TEMPO

VALOR

ACONT.

ABSTR.

COISA

OBRA

VARIADO

CaGE

1

 

 

 

 

 

 

 

2

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

Cortex

1

 

 

 

 

 

2

 

 

 

 

 

3

ELLE

Malinche

Nerua

1

2

3

RSN-NILC

PALAVRAS-NER

RENA

SIEMÊS

1

2

(8)

MiniHAREM

= alguns tipos

= todos os tipos

Sistema Saída PESSOA

ORGAN.

LOCAL

TEMPO

VALOR

ACONT.

ABSTR.

COISA

OBRA

VARIADO

CaGE

 

 

 

 

 

 

 

 

 

 

Siemês 2

Cortex

SMELL

1

2

Stencil-NooJ

Cenários selectivos em 2006

(9)
(10)

Incluir todas as EMs relevantes em texto

português, obtendo uma marcação “ideal” de EMs

no texto

Categorias das EMs criadas empiricamente a

partir de análise do texto. Categorização feita em

dois níveis, categorias e tipos.

Não representa o que os sistemas REM devem

obter hoje, mas permitem:

avaliar a dificuldade da tarefa REM

estabelecer um limite superior

Há muito mais em REM do que pessoas,

organizações, locais e números...

(11)

Colecções Douradas usadas

HAREM: Colecção Dourada de 2005 (CD 2005)

MiniHAREM: Colecção Dourada de 2006 (CD 2006)

Ambas as CDs foram retiradas da Colecção

HAREM

Tamanhos

Colecção HAREM CD 2005 CD 2006

Ambas

Palavras

600 086

92 830

62 461

155 291

Documentos

1 202

129

128

257

EMs

~ 40 000

5 270

3 858

9 128

EMs vagas (class.)

~ 1 000

133

142

275

(12)

Categorias e Tipos em 2005

ABSTRACCAO

DISCIPLINA

ESTADO

ESCOLA

OBRA

PLANO

IDEIA

NOME

PESSOA

INDIVIDUAL

GRUPOIND

CARGO

GRUPOCARGO

MEMBRO

GRUPOMEMBRO

ORGANIZACAO

INSTITUICAO

ADMINISTRACAO

EMPRESA

SUB

OBRA

ARTE

REPRODUZIDA

PRODUTO

PUBLICACAO

LOCAL

GEOGRAFICO

ADMINISTRATIVO

VIRTUAL

ALARGADO

CORREIO

VALOR

MOEDA

CLASSIFICACAO

QUANTIDADE

ACONTECIMENTO

EFEMERIDE

ORGANIZADO

EVENTO

TEMPO

DATA

HORA

PERIODO

CICLICO

COISA

OBJECTO

SUBSTANCIA

CLASSE

VARIADO

OUTRO

(13)

Categorias e Tipos em 2006

ABSTRACCAO

DISCIPLINA

ESTADO

ESCOLA

OBRA

PLANO

IDEIA

NOME

PESSOA

INDIVIDUAL

GRUPOIND

CARGO

GRUPOCARGO

MEMBRO

GRUPOMEMBRO

ORGANIZACAO

INSTITUICAO

ADMINISTRACAO

EMPRESA

SUB

TEMPO

DATA

HORA

PERIODO

CICLICO

OBRA

ARTE

REPRODUZIDA

PRODUTO

PUBLICACAO

LOCAL

GEOGRAFICO

ADMINISTRATIVO

VIRTUAL

ALARGADO

CORREIO

COISA

OBJECTO

SUBSTANCIA

CLASSE

MEMBROCLASSE

ACONTECIMENTO

EFEMERIDE

ORGANIZADO

EVENTO

VARIADO

OUTRO

VALOR

MOEDA

CLASSIFICACAO

QUANTIDADE

(14)

Principais alterações HAREM => MiniHAREM

OBRA TIPO=”PRODUTO” eliminado

COISA TIPO=”MEMBROCLASSE” criado

Emails e URLs deixam de ser marcados

Referências anafóricas mantêm

significado semântico

ex: Revolução de 1830 (...) e a de 1832...

PESSOA TIPO=”MEMBRO” para

referências a pessoas a partir de uma

organização

(15)

CD: Distribuição por Categorias

24,59%

21,10%

18,61%

9,18%

9,13%

8,48%

4,04%

2,49%

1,57% 0,80%

Colecção Dourada de 2005 (regras 2005)

23,54%

22,24%

16,80%

9,46%

8,76%

8,63%

5,08%

3,40%

1,74% 0,36%

Colecção Dourada de 2006 (regras 2006)

23,91%

21,64%

17,91%

8,98%

8,98%

8,96%

3,71% 3,12% 2,17% 0,62%

Ambas as Colecções Douradas

LOCAL

PESSOA

ORGANIZACAO

VALOR

ABSTRACCAO

TEMPO

COISA

OBRA

ACONTECIMENTO

VARIADO

(regras 2006)

(16)

CD: Distribuição por Género Textual

(nº de palavras)

15,23%

34,43%

5,40%

14,31%

6,65%

12,67%

3,03%

8,27%

Colecção Dourada de 2005

22,82%

27,56%

8,04%

9,95%

6,45%

10,07%

6,94%

8,17%

Colecção Dourada de 2006

18,28%

31,66%

6,46%

12,56%

6,57%

11,62%

4,60%

8,23%

Ambas as Colecções Douradas

Web

Entrevista

Email

Jornalístico

Político

Literário

Técnico

Expositivo

(17)

25,98%

19,64%

22,09%

9,09%

8,29%

6,26%

6,74%

1,92%

Colecção Dourada de 2005 (regras 2005)

CD: Distribuição por Género Textual

(nº de EMs)

28,88%

19,68%

17,58%

10,53%

10,38%

5,45%

5,34%

2,14%

Ambas as Colecções Douradas

Web

Entrevista

Jornalístico

Expositivo

Email

Literário

Político

Técnico

32,97%

19,57%

11,33%

12,44%

13,56%

4,30%

3,40%

2,44%

Colecção Dourada de 2006 (regras 2006)

(18)

Densidade de EMs, por Género Textual

Jor

nal

ístico

We

b

Exp

osit

ivo

Em

ail

Lite

rári

o

Ent

rev

ista

Pol

ítico

Téc

nico

0%

5%

10%

15%

20%

25%

30%

2005

2006

Densidade EM

G

=

Nº palavras que pertencem e EMs, para o género G

Nº total de palavras, para o género G

(19)

Nº de palavras das EMs, por Categoria

2005

2006

ACONTECIMENTO

3,34

3

2,94

3,76

3

3,16

OBRA

3,26

2

2,89

3,5

3

3,19

VARIADO

2,25

1

2,51

2,23

1

2,48

ABSTRACCAO

2,19

1

2,44

2,21

1

2,01

ORGANIZACAO

2,19

1

1,96

2,21

1

2,45

PESSOA

1,9

2

1,12

1,9

2

1,10

TEMPO

1,81

1

1,34

1,82

1

1,34

VALOR

1,75

2

0,90

1,75

2

0,91

LOCAL

1,65

1

1,43

1,66

1

1,46

COISA

1,45

1

0,83

1,54

1

0,88

TOTAL

1,97

1

1,73

1,98

1

1,76

(20)

Teor de Sobreposição de EMs

CD 2005

CD 2006

Número Total de EMs

5132

3712

Número de EMs Distintas

3060

2434

Rácio

59,63%

65,57%

Nº Total de EMs comuns

623

Nº EMs Distintas comums

380

Rácio de total EMs

12,14%

16,78%

Rácio de EMs distintas

12,42%

15,61%

(21)

Análise Estatística ao HAREM e MiniHAREM

(22)

Determinar o nível de confiança dos

resultados do HAREM e MiniHAREM

Distinguir os sistemas / estratégias

realmente diferentes

Verificar se o tamanho da CD é suficiente

Validar os eventos de avaliação

(23)

Não paramétrico -- distribuição de EMs

(quase) impossível de determinar

--●

Comparação directa entre pares de saídas

Simples e robusto

Nível de confiança calculado facilmente

(24)

Escolha: Testes de permutação

Approximate Randomization

Sinopse do teste de permutação:

Permutar aleatoriamente observações entre

duas saídas

Se a diferença inicial diminuir, é provável que

as duas saídas sejam diferentes

Se a diferença inicial se mantiver, é provável

que seja obra do acaso

(25)

Teste de Permutação - exemplo

Saída A

Saída B

P

A

= 16/20 = 80%

(26)

Teste de Permutação - exemplo

Saída A

Saída B

Saída A

Saída B

Fase 1: Permutação

- Troca de observações, com ½ de probabilidade

P

A

= 16/20 = 80%

(27)

Teste de Permutação - exemplo

Saída A

Saída B

Saída A

Saída B

Fase 1: Permutação

- Troca de observações, com ½ de probabilidade

Fase 2: Cálculo da nova diferença

P*

A

= 12/20 = 60%

P*

B

= 10/20 = 50%

P

A

= 16/20 = 80%

P

B

= 6/20 = 30%

Pseudo-Saída A

Pseudo-Saída B

(28)

Teste de Permutação - exemplo

Saída A

Saída B

Saída A

Saída B

Fase 1: Permutação

- Troca de observações, com ½ de probabilidade

Pseudo-Saída A

Pseudo-Saída B

Fase 2: Cálculo da nova diferença

P*

A

= 12/20 = 60%

P*

B

= 10/20 = 50%

P

A

= 16/20 = 80%

P

B

= 6/20 = 30%

50

%

(29)

Teste de Permutação - exemplo

Repetir para

n

iterações (ou seja, gerar

pseudo-saídas)

Contar o nº de vezes

m

que a diferença

aumentou em vez de diminuir

Valor de P: P

value

=

P

value

Erro tipo I

Frequência

Relativa

Diferença absoluta

m

+1

n

+1

Distribuição

empírica

(30)

Mas... como permutar no HAREM?

Observações das saídas são dependentes!

Como permutar “Costa”? E se “Silva” não

for permutado?

CD

A

B

1

2

3

1

1

2

2

3

4

5

Saídas

Texto / EMs

Segundo o presidente da Fundação para o Desenvolvimento da Produção, Costa e Silva, ...

Segundo o presidente da Fundação para o Desenvolvimento da Produção, Costa e Silva, ...

(31)

Permutação por blocos

Solução: agrupar EMs em blocos

independentes

Mantém pontuações

Resolve diferenças dadas pelo <ALT>

Ver a permutação como a troca de

desempenho entre saídas, para uma

determinada frase ou pedaço de texto

A

B

1

2

3

1

2

3

4

5

Saídas

Texto / EMs

Segundo o presidente da Fundação para o Desenvolvimento da Produção, Costa e Silva, ...

(32)

Tabelas de valores P

0,7977 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00050 0,00020 0,00090 0,00010 0,8700 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,8323 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7977 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00060 0,00010 0,00040 0,00010 0,8700 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,8323 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7284 0,00010 0,00010 1,00000 0,00640 0,00520 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00040 0,00010 0,6958 0,00010 0,00010 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7117 0,00010 0,00010 1,00000 0,00870 0,00930 0,00890 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7284 0,00010 0,00010 1,00000 0,00610 0,00560 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00040 0,00010 0,6958 0,00010 0,00010 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7117 0,00010 0,00010 1,00000 0,00900 0,00840 0,00900 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7320 0,00010 0,00010 0,0047 0,00610 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00080 0,00010 0,6852 0,00010 0,00010 0,00010 0,00010 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7078 0,00010 0,00010 0,00650 0,00810 1,00000 0,03210 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7320 0,00010 0,00010 0,00520 0,00540 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00100 0,00010 0,6852 0,00010 0,00010 0,00010 0,00010 1,00000 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7078 0,00010 0,00010 0,01 0,00750 1,00000 0,02980 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,8733 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00100 0,01160 0,5707 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00720 0,00010 0,00010 0,00010 0,00010 0,00010 0,6903 0,00010 0,00010 0,00960 0,00930 0,03430 0,03200 0,84950 0,00530 0,00010 0,00010 0,00010 0,00010 0,00010 0,7584 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,42330 0,00010 0,00010 0,00010 0,48480 0,00010 0,6310 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,6888 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,85220 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,7570 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,42050 0,00010 0,00010 0,00010 0,41450 0,00010 0,5969 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00710 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,6675 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00700 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,6835 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,5317 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00020 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,5982 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,8311 0,00060 0,00040 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,64320 0,00010 0,07550 0,4165 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,31040 0,10520 0,00010 0,5549 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,43020 0,00290 0,00010 0,8366 0,00010 0,00020 0,00010 0,00010 0,00010 0,00010 0,00020 0,00010 0,00010 0,00010 0,61220 0,00010 0,00030 0,4072 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,31530 0,49480 0,00010 0,5477 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,43520 0,01730 0,00010 0,7655 0,00080 0,00110 0,00010 0,00030 0,00080 0,00120 0,00010 0,46020 0,39540 0,00010 0,00010 0,00010 0,00010 0,4011 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,10620 0,49600 0,00010 0,5264 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00260 0,01770 0,05280 0,8511 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,01250 0,00010 0,00010 0,00010 0,06780 0,00030 0,00010 0,3617 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,5076 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,05060 0,8288 0,00140 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,3606 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,5026 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010 0,00010

(33)

Testes estatísticos com tamanho da CD

Saída A

Saída B

Diferença

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

(34)

Testes estatísticos com tamanho da CD

Saída A

Saída B

Diferença

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

0.728 0.696 0.712 0.798 0.870 0.832 0.069 0.174 0.121

n iterações = 9999

PSEUDO-SAÍDAS de A

PSEUDO-SAÍDAS de B

Valor de P

Média

Média

# Blocos

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Todos

0.0001

0.0001

0.0001

0.765

0.783

0.774

0.003

0.004

0.003

0.765

0.783

0.774

0.003

0.004

0.003

2000

0.0001

0.0001

0.0001

0.765

0.772

0.769

0.008

0.009

0.007

0.765

0.772

0.769

0.008

0.009

0.007

1000

0.0001

0.0001

0.0001

0.765

0.765

0.765

0.013

0.015

0.012

0.765

0.765

0.765

0.013

0.014

0.012

500

0.0004

0.0001

0.0001

0.766

0.761

0.763

0.019

0.022

0.017

0.765

0.761

0.763

0.018

0.021

0.017

250

0.0181

0.0001

0.0001

0.765

0.759

0.762

0.027

0.031

0.025

0.766

0.760

0.763

0.027

0.031

0.025

200

0.0351

0.0001

0.0001

0.765

0.759

0.762

0.030

0.034

0.028

0.765

0.759

0.762

0.030

0.035

0.028

100

0.1391

0.0009

0.0047

0.766

0.759

0.761

0.043

0.049

0.040

0.765

0.758

0.761

0.044

0.049

0.041

75

0.1912

0.0034

0.0123

0.767

0.759

0.762

0.050

0.057

0.047

0.767

0.759

0.762

0.050

0.057

0.047

50

0.2900

0.0181

0.0453

0.766

0.759

0.761

0.062

0.069

0.058

0.766

0.760

0.761

0.062

0.068

0.057

25

0.4488

0.0843

0.1505

0.767

0.762

0.762

0.087

0.093

0.079

0.766

0.760

0.760

0.086

0.093

0.079

Desvio Padrão

Desvio Padrão

Utilizando cada vez menos blocos no teste...

(35)

Testes estatísticos com tamanho da CD

Saída A

Saída B

Diferença

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

0.728 0.696 0.712 0.798 0.870 0.832 0.069 0.174 0.121

... e aumenta a média e desvio padrão das

diferenças entre pseudo-saídas!

PSEUDO-DIFERENÇAS

Valor de P

Média

# Blocos

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Todos

0.0001

0.0001

0.0001

0.006

0.006

0.005

0.004

0.005

0.004

2000

0.0001

0.0001

0.0001

0.008

0.009

0.008

0.006

0.007

0.006

1000

0.0001

0.0001

0.0001

0.012

0.013

0.011

0.009

0.010

0.008

500

0.0004

0.0001

0.0001

0.017

0.018

0.015

0.013

0.014

0.011

250

0.0181

0.0001

0.0001

0.024

0.026

0.021

0.018

0.020

0.016

200

0.0351

0.0001

0.0001

0.026

0.029

0.024

0.020

0.022

0.018

100

0.1391

0.0009

0.0047

0.037

0.041

0.034

0.028

0.031

0.026

75

0.1912

0.0034

0.0123

0.043

0.048

0.039

0.032

0.036

0.029

50

0.2900

0.0181

0.0453

0.053

0.058

0.048

0.040

0.045

0.036

25

0.4488

0.0843

0.1505

0.073

0.081

0.066

0.056

0.061

0.051

Desvio Padrão

(36)

Variação do nº de blocos vs valor de P

Frequência

Relativa

Diferença absoluta

PSEUDO-DIFERENÇAS

Valor de P

Média

# Blocos

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Todos

0.0001

0.0001

0.0001

0.006

0.006

0.005

0.004

0.005

0.004

2000

0.0001

0.0001

0.0001

0.008

0.009

0.008

0.006

0.007

0.006

1000

0.0001

0.0001

0.0001

0.012

0.013

0.011

0.009

0.010

0.008

500

0.0004

0.0001

0.0001

0.017

0.018

0.015

0.013

0.014

0.011

250

0.0181

0.0001

0.0001

0.024

0.026

0.021

0.018

0.020

0.016

200

0.0351

0.0001

0.0001

0.026

0.029

0.024

0.020

0.022

0.018

100

0.1391

0.0009

0.0047

0.037

0.041

0.034

0.028

0.031

0.026

75

0.1912

0.0034

0.0123

0.043

0.048

0.039

0.032

0.036

0.029

50

0.2900

0.0181

0.0453

0.053

0.058

0.048

0.040

0.045

0.036

25

0.4488

0.0843

0.1505

0.073

0.081

0.066

0.056

0.061

0.051

Desvio Padrão

2000 blocos

500 blocos

200 blocos

50 blocos

Diferença

inicial

(37)

Prova dos nove...

PSEUDO-DIFERENÇAS

Valor de P

Média

# Blocos

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Todos

0.0001

0.0001

0.0001

0.006

0.006

0.005

0.004

0.005

0.004

2000

0.0001

0.0001

0.0001

0.008

0.009

0.008

0.006

0.007

0.006

1000

0.0001

0.0001

0.0001

0.012

0.013

0.011

0.009

0.010

0.008

500

0.0004

0.0001

0.0001

0.017

0.018

0.015

0.013

0.014

0.011

250

0.0181

0.0001

0.0001

0.024

0.026

0.021

0.018

0.020

0.016

200

0.0351

0.0001

0.0001

0.026

0.029

0.024

0.020

0.022

0.018

100

0.1391

0.0009

0.0047

0.037

0.041

0.034

0.028

0.031

0.026

75

0.1912

0.0034

0.0123

0.043

0.048

0.039

0.032

0.036

0.029

50

0.2900

0.0181

0.0453

0.053

0.058

0.048

0.040

0.045

0.036

25

0.4488

0.0843

0.1505

0.073

0.081

0.066

0.056

0.061

0.051

Desvio Padrão

Teste T-Studentt (99%) = 2,58

Média - t * desvPad

Média + t * desvPad

-0.005

-0.006 -0.005

0.016

0.019

0.015

-0.008

-0.009 -0.007

0.024

0.028

0.022

-0.011

-0.013

-0.01

0.035

0.039

0.032

-0.016

-0.017 -0.014

0.050

0.054

0.044

-0.022

-0.025

-0.02 0.069

0.078

0.063

-0.025

-0.028 -0.023 0.078

0.086

0.070

-0.036

-0.039 -0.033 0.110

0.122

0.100

-0.041

-0.045 -0.037 0.126

0.140

0.114

-0.05

-0.057 -0.046 0.155

0.173

0.142

-0.072

-0.078 -0.065 0.218

0.239

0.198

Saída A

Saída B

Diferença

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

(38)

Influencia do nº de iterações no valor de P

n blocos = 2000

PSEUDO-SAÍDAS de A

PSEUDO-SAÍDAS de B

PSEUDO-DIFERENÇAS

Valor de P

Média

Média

Média

# Iter

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

9999

0.0001

0.0001

0.0001

0.765

0.772 0.769

0.008 0.009

0.007

0.765 0.772

0.769 0.008 0.009

0.007

0.00831

0.00937

0.00750

0.00626

0.00707

0.00570

999

0.0010

0.0010

0.0010

0.765

0.772 0.768

0.008 0.009

0.007

0.765 0.771

0.768 0.008 0.009

0.007

0.00836

0.00930

0.00744

0.00609

0.00692

0.00562

99

0.0100

0.0100

0.0100

0.764

0.771 0.768

0.009 0.009

0.007

0.766 0.772

0.769 0.009 0.009

0.008

0.00984

0.00952

0.00855

0.00750

0.00642

0.00609

n blocos = 200

Valor de P

Média

Média

Média

# Iter

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

9999

0.0351

0.0001

0.0001

0.765

0.759 0.762

0.030 0.034

0.028

0.765 0.759

0.762 0.030 0.035

0.028

0.02650

0.02904

0.02379

0.01991

0.02212

0.01804

999

0.0290

0.0010

0.0010

0.767

0.758 0.762

0.030 0.036

0.029

0.767 0.759

0.762 0.030 0.035

0.028

0.02516

0.02896

0.02360

0.01866

0.02212

0.01753

99

0.0500

0.0100

0.0100

0.772

0.760 0.766

0.032 0.035

0.029

0.767 0.760

0.763 0.032 0.039

0.032

0.02613

0.03271

0.02526

0.02005

0.02390

0.01957

n blocos = 25

Valor de P

Média

Média

Média

# Iter

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

9999

0.4488 0.0843

0.1505

0.767

0.762 0.762

0.087 0.093

0.079

0.766 0.760

0.760 0.086 0.093

0.079

0.07302

0.08053

0.06637

0.05618

0.06136

0.05085

999

0.4330 0.0930

0.1580

0.766

0.761 0.761

0.086 0.094

0.079

0.764 0.761

0.760 0.089 0.096

0.082

0.07373

0.08299

0.06646

0.05823

0.06107

0.05393

99

0.4800 0.0800

0.1200

0.762

0.764 0.760

0.090 0.088

0.077

0.765 0.763

0.762 0.088 0.096

0.082

0.07849

0.08180

0.06811

0.05604

0.06272

0.04987

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

(39)

Uma experiência com nº iterações

n blocos = 2000

PSEUDO-SAÍDAS de A

PSEUDO-SAÍDAS de B

PSEUDO-DIFERENÇAS

Valor de P

Média

Média

Média

# Iter

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

9999

0.0001

0.0001

0.0001

0.765

0.772 0.769

0.008 0.009

0.007

0.765 0.772

0.769 0.008 0.009

0.007

0.00831

0.00937

0.00750

0.00626

0.00707

0.00570

999

0.0010

0.0010

0.0010

0.765

0.772 0.768

0.008 0.009

0.007

0.765 0.771

0.768 0.008 0.009

0.007

0.00836

0.00930

0.00744

0.00609

0.00692

0.00562

99

0.0100

0.0100

0.0100

0.764

0.771 0.768

0.009 0.009

0.007

0.766 0.772

0.769 0.009 0.009

0.008

0.00984

0.00952

0.00855

0.00750

0.00642

0.00609

n blocos = 200

Valor de P

Média

Média

Média

# Iter

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

9999

0.0351

0.0001

0.0001

0.765

0.759 0.762

0.030 0.034

0.028

0.765 0.759

0.762 0.030 0.035

0.028

0.02650

0.02904

0.02379

0.01991

0.02212

0.01804

999

0.0290

0.0010

0.0010

0.767

0.758 0.762

0.030 0.036

0.029

0.767 0.759

0.762 0.030 0.035

0.028

0.02516

0.02896

0.02360

0.01866

0.02212

0.01753

99

0.0500

0.0100

0.0100

0.772

0.760 0.766

0.032 0.035

0.029

0.767 0.760

0.763 0.032 0.039

0.032

0.02613

0.03271

0.02526

0.02005

0.02390

0.01957

n blocos = 25

Valor de P

Média

Média

Média

# Iter

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

Prec

Abr

MedF

9999

0.4488 0.0843

0.1505

0.767

0.762 0.762

0.087 0.093

0.079

0.766 0.760

0.760 0.086 0.093

0.079

0.07302

0.08053

0.06637

0.05618

0.06136

0.05085

999

0.4330 0.0930

0.1580

0.766

0.761 0.761

0.086 0.094

0.079

0.764 0.761

0.760 0.089 0.096

0.082

0.07373

0.08299

0.06646

0.05823

0.06107

0.05393

99

0.4800 0.0800

0.1200

0.762

0.764 0.760

0.090 0.088

0.077

0.765 0.763

0.762 0.088 0.096

0.082

0.07849

0.08180

0.06811

0.05604

0.06272

0.04987

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Desvio Padrão

Frequência

Relativa

Diferença absoluta

iterações

iterações

Diferença

inicial

(40)
(41)

C

ag

e2

C

ag

e1

C

ag

e3

N

oo

j1

N

IL

C

C

or

te

x1

C

or

te

x2 Ell

e

M

al

in

ch

e

ne

ru

a_

ct

ne

ru

a_

em

ne

ru

a_

cp

N

oo

j2

no

R

en

a

C

or

te

x3

no

S

ie

m

es

2

S

ie

m

es

1

P

al

av

ra

s

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

CD 2005

CD 2006

2 CDs

M

ed

id

a

F

HAREM 2005

C

ag

e2

C

ag

e1

N

IL

C

M

al

in

ch

e

C

ag

e3

ne

rua

_e

m

ne

rua

_c

t

ne

ru

a_

cp

N

oo

j1

C

or

te

x1

C

or

te

x2

C

or

te

x3

no

S

ie

me

s2

S

ie

m

es

1

N

oo

j2

no Ell

e

R

en

a

P

al

av

ra

s

0

10

20

30

40

50

60

70

80

90

CD 2005 CD 2006 2 CDs

P

re

ci

o

(%

)

Tarefa de Identificação

C

ag

e2

C

ag

e1

C

ag

e3

N

oo

j1

E

lle

C

or

te

x1

C

or

te

x2

N

IL

C

N

oo

j2

no

ne

rua

_c

t

ne

ru

a_

cp

ne

ru

a_

em

R

en

a

Ma

lin

ch

e

S

ie

me

s2

S

ie

me

s1

Pa

la

vr

as

C

or

te

x3n

o

0

10

20

30

40

50

60

70

80

90

CD 2005 CD 2006 2 CDs

A

br

an

nc

ia

(

%

)

*

*

*

(42)

C

ag

e1

C

ag

e2

si

em

es

_s

im

pl

es

S

te

nc

il_

1

st

en

ci

l_

di

cp

ro

si

em

es

_p

os

te

rio

r

st

en

ci

l_

po

lc

or

S

m

el

l1

si

em

es

_e

xa

ct

st

en

ci

l_

po

lc

or

S

m

el

l2

si

em

es

_p

re

fix

o4

C

or

te

x2

ce

m

si

em

es

_p

re

fix

o2

si

em

es

_d

ifu

so

2

si

em

es

_d

ifu

so

1

si

em

es

_t

ot

al

2

si

em

es

_t

ot

al

1

C

or

te

x1

re

m

C

or

te

x3

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

CD 2005

CD 2006

2 CDs

M

ed

id

a

F

Cage 1 Cag e2 siem es_s impl es Ste ncil_ 1 sten cil_ dicp ro siem es_p oste rior sten cil_ polc or siem es_e xact sten cil_ polc or Sm ell1 Sm ell2 Cor tex2 cem siem es_p refix o4 siem es_p refix o2 siem es_d ifuso 1 siem es_d ifuso 2 siem es_t otal 1 siem es_t otal 2 Cor tex1 rem Cor tex3

0

10

20

30

40

50

60

70

80

90

CD 2005 CD 2006 2 CDs

A

br

an

nci

a

(%

)

Sm ell2 siem es_t otal 1 siem es_t otal 2 siem es_d ifuso 2 siem es_d ifuso 1 siem es_p refix o4 siem es_p refix o2 siem es_s impl es Cag e1 Sm ell1 Cag e2 Cor tex1 rem Cor tex3 sten cil_ dicp ro siem es_p oste rior siem es_e xact sten cil_ polc or Sten cil_ 1 sten cil_ polc or Corte x2ce m

0

10

20

30

40

50

60

70

80

90

CD 2005 CD 2006 2 CDs

P

re

ci

o

(%

)

MiniHAREM 2006

Tarefa de Identificação

(43)

nerua _ct Ren a nerua _cp Cag e3 Cag e2 Cag e1 Noo j2no Cor tex1 Sie mes 1 Cor tex2 Sie mes 2 Noo j1 Pal avra s Elle 0 10 20 30 40 50 60 70 CD 2005 CD 2006 2 CDs

P

re

ci

o

(%

)

Cag e2 Cag e1 Cag e3 Noo j1 Ren a nerua _cp nerua _ct Noo j2no Cor tex1 Cor tex2 Elle Sieme s1 Sieme s2 Pal avra s 0 10 20 30 40 50 60 70 CD 2005 CD 2006 2 CDs

A

br

an

nc

ia

(

%

)

C

ag

e2

C

ag

e1

C

ag

e3

N

oo

j1

R

en

a

ne

ru

a_

cp

ne

ru

a_

ct

N

oo

j2

no

C

or

te

x1

C

or

te

x2 Ell

e

S

ie

me

s1

S

ie

me

s2

P

al

av

ra

s

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

CD 2005

CD 2006

2 CDs

M

ed

id

a

F

HAREM 2005

Tarefa de Classificação Semântica (Combinada)

*

(44)

si

em

es

_d

ifu

so

1

si

em

es

_d

ifu

so

2

si

em

es

_t

ot

al

1

si

em

es

_t

ot

al

2

S

m

el

l2

C

or

te

x3

si

em

es

_p

re

fix

o2

si

em

es

_p

os

te

rio

r

si

em

es

_p

re

fix

o4

S

m

el

l1

si

em

es

_e

xa

ct

si

em

es

_s

im

pl

es

C

ag

e1

C

ag

e2

st

en

ci

l_

di

cp

ro

st

en

ci

l_

po

lc

or

S

te

nc

il_

1

st

en

ci

l_

po

l

C

or

te

x2

ce

m

0

10

20

30

40

50

60

70

80

CD 2005 CD 2006 2 CDs

P

re

ci

o

(%

)

C

ag

e1

C

ag

e2

si

em

es

_s

im

pl

es

S

te

nc

il_

1

si

em

es

_p

os

te

rio

r

st

en

ci

l_

di

cp

ro

si

em

es

_d

ifu

so

1

si

em

es

_e

xa

ct

st

en

ci

l_

po

l

S

m

el

l1

st

en

ci

l_

po

lc

or

si

em

es

_d

ifu

so

2

S

m

el

l2

si

em

es

_p

re

fix

o4

si

em

es

_p

re

fix

o2

C

or

te

x2

ce

m

C

or

te

x3

si

em

es

_t

ot

al

1

si

em

es

_t

ot

al

2

0

10

20

30

40

50

60

CD 2005 CD 2006 2 CDs

A

br

an

nci

a

(%

)

C

ag

e1

C

ag

e2

si

em

es

_s

im

pl

es

si

em

es

_d

ifu

so

1

si

em

es

_p

os

te

rio

r

S

te

nc

il_

1

st

en

ci

l_

di

cp

ro

si

em

es

_d

ifu

so

2

si

em

es

_e

xa

ct

S

m

el

l1

st

en

ci

l_

po

l

S

m

el

l2

st

en

ci

l_

po

lc

or

si

em

es

_p

re

fix

o2

si

em

es

_p

re

fix

o4

C

or

te

x3

si

em

es

_t

ot

al

1

si

em

es

_t

ot

al

2

C

or

te

x2

ce

m

0

0,1

0,2

0,3

0,4

0,5

0,6

CD 2005

CD 2006

2 CDs

M

ed

id

a

F

MiniHAREM 2006

(45)

Evolução dos Sistemas, em 1 ano?

Identificação

2005

2006

%

0,178

0,266

49,4%

0,523

0,624

19,2%

0,798

0,720

-9,7%

0,655

0,569

-13,0%

0,746

0,839

12,6%

Semântica (CSC)

2005

2006

%

0,101

0,141

39,8%

0,438

0,468

6,9%

0,501

0,508

1,4%

0,369

0,482

30,7%

0,395

0,582

47,5%

(46)

Estado da Arte em REM:

Categorias

(47)

Panorama de Identificação, por Categorias

Identificação por Categorias (HAREM)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

O

BR

A

C

O

IS

A

A

BS

TR

A

C

CA

O

A

CO

N

T

O

RG

PE

SS

O

A

LO

CA

L

TE

M

PO

V

AL

O

R

M

e

d

id

a

F

2cd

cd2005

cd2006

Identificação por Categorias (MiniHAREM)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

O

BR

A

C

O

IS

A

A

BS

TR

A

C

CA

O

A

CO

N

T

O

RG

LO

CA

L

PE

SS

O

A

V

AL

O

R

TE

M

PO

M

e

d

id

a

F

2cd

cd2005

cd2006

2005

2006

(48)

Panorama de Identificação, por Categorias

HAREM: Melhores Categorias (com ambas as CDs)

0

10

20

30

40

50

60

70

80

90

100

0

10

20

30

40

50

60

70

80

90

Abrangência (%)

P

re

ci

o

(

%

)

ABSTRACCAO

ACONTECIMENTO

COISA

VALOR

TEMPO

LOCAL

PESSOA

ORGANIZACAO

OBRA

(49)

Panorama de Identificação, por Categorias

HAREM e MiniHAREM: Melhores Categorias (com ambas as CDs)

0

10

20

30

40

50

60

70

80

90

100

0

10

20

30

40

50

60

70

80

90

Abrangência (%)

P

re

ci

o

(

%

)

ABSTRACCAO

ACONTECIMENTO

COISA

VALOR

TEMPO

LOCAL

PESSOA

ORGANIZACAO

OBRA

HAREM

2005

MiniHAREM 2006

(50)

Panorama de Identificação, por Género

Identificação por Género (HAREM)

0.4

0.5

0.6

0.7

0.8

0.9

1

Em

ai

l

cn

ic

o

W

eb

Ex

po

si

tiv

o

Po

lít

ic

o

En

tr

ev

is

ta

Jo

rn

al

ís

ti

co

Li

te

rio

M

e

d

id

a

F

2cd

cd2005

cd2006

Identificação por Género (HAREM)

0.4

0.5

0.6

0.7

0.8

0.9

1

cn

ic

o

Em

ai

l

W

eb

Ex

po

si

tiv

o

Li

te

rio

Po

lít

ic

o

Jo

rn

al

ís

ti

co

En

tr

ev

is

ta

M

e

d

id

a

F

2cd

cd2005

cd2006

2005

2006

(51)

Panorama de Identificação, por Género

HAREM: Melhores Géneros (com ambas as CDs)

0

10

20

30

40

50

60

70

80

90

20

30

40

50

60

70

80

Abrangência (%)

P

re

ci

o

(

%

)

Web

Email

Literário

Político

Expositivo

Técnico

Entrevista

Jornalístico

(52)

Panorama de Identificação, por Género

HAREM e MiniHAREM: Melhores Categorias (com ambas as CDs)

0

10

20

30

40

50

60

70

80

90

20

25

30

35

40

45

50

55

60

65

70

75

80

Abrangência (%)

P

re

ci

o

(

%

)

Web

Email

Literário

Político

Expositivo

Técnico

Entrevista

Jornalístico

(53)

Conclusões

HAREM e MiniHAREM: São comparáveis

CDs são semelhantes

Produzem desempenhos semelhantes

Tamanho da CD mais que adequado

A avaliação HAREM está validada.

As melhores estratégias para REM foram

aferidas e comparadas

Os sistemas REM melhoraram em 1 ano!

(54)

Fim

(55)

W

eb

E

nt

re

vi

st

a

Jo

rn

al

ís

tic

o

E

xp

os

iti

vo

E

m

ai

l

Li

te

rio

P

ol

íti

co

cn

ic

o

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Regras de 2006

Distribuição de Categorias, por Género Textual

W

eb

E

nt

re

vi

st

a

Jo

rn

al

E

m

ai

l

E

xp

os

iti

vo

Li

te

rio

P

ol

íti

co

cn

ic

o

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Regras de 2005

VARIADO

ACONTECIMENTO

COISA

OBRA

TEMPO

VALOR

ABSTRACCAO

ORGANIZACAO

PESSOA

LOCAL

(56)

LO

C

A

L

P

E

S

S

O

A

O

R

G

A

N

IZ

A

C

A

O

V

A

LO

R

A

B

S

T

R

A

C

C

A

O

T

E

M

P

O

C

O

IS

A

O

B

R

A

A

C

O

N

T

E

C

IM

E

N

T

O

V

A

R

IA

D

O

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Regras de 2006

Distribuição de Género Textual, por Categoria

LO

C

A

L

P

E

S

S

O

A

O

R

G

A

N

IZ

A

C

A

O

A

B

S

T

R

A

C

C

A

O

V

A

L

O

R

T

E

M

P

O

O

B

R

A

C

O

IS

A

A

C

O

N

T

E

C

IM

E

N

T

O

V

A

R

IA

D

O

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Regras de 2005

Técnico

Político

Literário

Expositivo

Email

Jornalístico

Entrevista

Web

Referências

Documentos relacionados

A versão Selection do Opel Insignia vem equipada com diversos componentes especiais, tais como o volante em couro com telecomandos para o programador de velocidade.. Obviamente,

Decorridos 60 dias após a semeadura, a porcentagem de germinação obtida neste experimen- to, para as sementes provenientes de frutos verdes, pirênios com endocarpos íntegros e

Os resultados indicam que o manejo no que se refere à quantidade de água aplicada está adequado, porém para melhorar a qualidade desta aplicação é interessante

Como segundo produto do estudo também foi possível verificar os efeitos destas diferentes intensidades sob as avaliações realizadas pelos consumidores quanto às variáveis

Denunciar a nova escravatura infantil foi o objectivo de Maria João Luís para a montagem da peça “150 milhões de escravos”.. Partindo dos números oficiais da Amnistia

Deste modo o nosso referencial teórico se sustenta na teoria histórico - cultural , defendida por Vygotsky, Luria e Leontiev, que tinham como ponto chave o

O trabalho de investigação científica sobre o bairro culminou com a confecção da “Exposição Ver o Guamá”, seguida da socialização da referida exposição junto a

Neste estudo, pacientes com artrite reumatoide receberam a administração adicional de tacrolimus caso o tratamento com agentes biológicos, como o infliximabe ou etanercepte