• Nenhum resultado encontrado

Métodos Quantitativos para Ciência da Computação Experimental

N/A
N/A
Protected

Academic year: 2021

Share "Métodos Quantitativos para Ciência da Computação Experimental"

Copied!
87
0
0

Texto

(1)

Métodos Quantitativos para Ciência da

Computação Experimental

Apresentação Gráfica de Resultados Experimentais

Jussara Almeida

DCC-UFMG

(2)

A Arte da Apresentação Gráfica

•  Tipos de Variáveis

•  “Regras Práticas” para Apresentação de Gráficos

•  Erros Comuns nos Gráficos

•  Mais Exemplos de Apresentação Gráfica

•  Ref: The Visual Display of Quantitative Information, E. Tufte

– 

www.edwardtufte.com/tufte/

(3)

Tipos de Variáveis

•  Qualitativa

–  Ordenada

•  Ex:. capacidade de transmissão em rede: linha telefônica,

TV-a-cabo, links T1, T3, etc

–  Não ordenada

•  Ex: áreas do conhecimento: biologia, matemática, computação,

física, etc

•  Quantitativa

–  Discreta

•  Ex.: número de usuários simultâneos

–  Contínua

(4)

Criando Gráficos Para Variáveis

Qualitativas e Quantitativas

•  De maneira geral, variáveis qualitativas são melhor

representadas por gráficos de barra ou gráficos do tipo Kiviat.

–  No caso de variáveis ordenadas, gráficos de barra mostram o

sentido de ordenação

.

•  Variáveis quantitativas podem ser bem representadas em

gráficos do tipo X-Y.

–  Variáveis discretas são adequadas a gráficos de pontos ou gráficos

de barras.

(5)

Exemplo de Gráfico de Kiviat:

objetivos de software

Processo de Desenvolvimento Alta qualidade Satisfação do Usuário Tecnologia Qualidade da equipe Métricas de Desenvolvimento Excelência Ambiente Alta Produtividade 100% 100%

(6)

“Regras Práticas” para Fazer

Bons Gráficos

•  Princípios da excelência gráfica

•  Princípios dos bons gráficos

•  Sugestões específicas para certas situações

•  Estética

(7)

Princípios da excelência gráfica (1)

•  Excelência Gráfica é uma apresentação bem

projetada de dados interessantes:

–  Substância

–  Estatística

–  Projeto

(8)

Princípios da excelência gráfica (2)

•  O leitor (observador) obtém do gráfico o seguinte:

–  Maior número de idéias

–  Em um tempo rápido

–  Com menos “tinta”

•  A excelência gráfica é quase sempre obtida com:

–  Com múltiplas variáveis

(9)

Princípios para Bons Gráficos

•  Antes de qualquer coisa, MOSTRE os dados

•  Maximize a relação dados/tinta

•  Diminua a tinta que não representa dados

•  Elimine a tinta de dados redundantes

•  Revise, edite, revise, edite....

(10)

Antes de qualquer coisa,

mostre os dados !!!

0

1

2

3

4

5

0

5000

10000

15000

Tamanho arquivo(Kbytes)

Te

m

po de

le

it

ura

(

mili

se

gundos

)

Regressão Linear

(11)

Antes de qualquer coisa,

mostre os dados !!!

0

1

2

3

4

5

0

5000

10000

15000

Te

m

po de

le

it

ura

(

mili

se

gundos

)

Tamanho arquivo(Kbytes)

(12)

Maximize a Relação Dados/Tinta

Med. 1

Med. 3

0

10

20

30

40

50

60

70

80

90

A

B

C

(13)

Maximize a Relação Dados/Tinta

0

20

40

60

80

100

Medição 1

Medição 2

Medição 3

Medição 4

A

B

(14)

Minimize a tinta dos não-dados

Th e im ag e can not be dis pla yed . Yo ur co mp ute r ma Th e im ag e can not be dis pla yed . Yo ur co mp ute r ma y not hav e en Th e im ag e can not be dis pla yed . Yo ur co mp ute r ma y not Th e im ag e can not be dis pla yed . Yo ur co mp ute r ma 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90

Med. 1

Med. 2

Med. 3

Med. 4

A

B

C

(15)

Minimize a tinta dos não-dados

0 20 40 60 80

Med. 1

Med. 2

Med. 3

Med. 4

(16)

Minimize a tinta dos não-dados

20.4 27.4 90 20.4 38.6 34.6 31.6 46.9 45 43.9 30.6 45.9 0 20 40 60 80

Med. 1

Med. 2

Med. 3

Med. 4

A

B

(17)

Elimine a Tinta de Dados Redundantes

0 20 40 60 80

Med. 1

Med. 2

Med. 3

Med. 4

(18)

Revise e Edite

Med. 1

Med. 2

Med. 3

Med. 4

0

20

40

60

80

100

Default Microsoft Powerpoint Chart

A

B

C

(19)

Revise e Edite

Remova os efeitos decorativos

0

10

20

30

40

50

60

70

80

90

Med. 3

Med. 2

Med. 3

Med. 4

A

B

C

(20)

Revise e Edite

Remova aquilo que gera confusão no gráfico

0

10

20

30

40

50

60

70

80

90

Med. 1

Med. 2

Med. 3

Med. 4

A

B

C

(21)

Revise e Edite

Torne as legendas simples e de fácil interpretação

0

10

20

30

40

50

60

70

80

90

Med. 1

Med. 2

Med. 3

Med. 4

Rede A

Rede B

Rede C

(22)

Revise e Edite

0

20

40

60

80

100

Med. 1

Med. 2

Med. 3

Med. 4

Rede A

Rede B

Rede C

(23)

Revise e Edite

Elimine problemas oriundos das cores verde e vermelho

0

20

40

60

80

100

Med. 1

Med. 2

Med. 3

Med. 4

Rede A

Rede B

(24)

Revise e Edite

Escolha Tipos/Fontes Adequados e Simples

0

20

40

60

80

100

Med. 1

Med. 2

Med. 3

Med. 4

Rede A

Rede B

Rede C

(25)

Ações Específicas a Fazer

•  Forneça a informação que o leitor necessita para

entender o gráfico

•  Limite a confusão e complexidade do gráfico

•  O que você quer mostrar com o gráfico: qual o ponto?

•  Mostre as estatísticas graficamente

•  Nem sempre os gráficos são a melhor maneira de

representar dados experimentais: tabelas, etc

(26)

Forneça a informação que o leitor

necessita

•  Mostre as informações relativas aos eixos

–  Use os eixos para indicar os limites de variação

dos valores da variável

•  Coloque rótulos de uma maneira completa e

inteligente

(27)

Forneça a informação que o leitor

necessita

0

20

40

60

80

1

2

3

4

A

B

C

(28)

Forneça a informação que o leitor

necessita

0

Med. 1

Med. 2

Med. 3

Med. 4

Falhas

em

Milhares

Protocolo Não Testado A C B

0

20

40

60

80

(29)

Limite a confusão e complexidade do

gráfico

•  Evite o excesso de curvas em um gráfico

•  Use uma única escala para todas as curvas

•  Não use curvas “extras”

(30)

0

10

20

30

40

50

60

Med. 2

Med. 2

Med. 3

Med. 4

0

10

20

30

40

50

60

70

80

90

100 A

B

C

D

E

F

G

H

I

J

Limite a confusão e complexidade do

gráfico: seja simples

(31)

Outras Redes Testadas

0

20

40

60

80

100

Med. 1

Med. 2

Med. 3

Med. 4

Falhas em Milhares J D H

(32)

O que você quer mostrar com o gráfico:

qual o ponto?

•  Os gráficos devem acrescentar informações que de

outra maneira não estariam explicitamente mostradas

ao leitor

•  Não faça gráficos, só porque você coletou informações

experimentais

•  Saiba qual ponto do trabalho você esta querendo

demonstrar (lembre das hipóteses), e certifique-se que

o gráfico ajuda a demonstrar ou negar o ponto ou

(33)

Relembre as hipóteses

•  O número de falhas aumentou em 15 entre a medições 1 e 2:

0

20

40

60

80

100

120

Med. 1

Med. 2

(34)

Relembre as hipóteses

0

500000

1000000

1500000

2000000

2500000

3000000

3500000

4000000

Modem

Ethernet

ATM

Satellite

Throughput

(35)

Relembre as hipóteses

1

10

100

1000

10000

100000

1000000

0.01

0.1

1

10

100

1000

Throughput (Kbits/sec)

Latencia

(

µ

s)

Ethernet

Modem

ATM

Satelite

(36)

Mostre as Estatísticas Graficamente

•  Disponha as barras numa ordem lógica

–  Geográfica

–  Inferior para superior (i.e., pior para melhor)

–  Alfabética, eventualmente

•  Mostre os intervalos de confiança, quando for o caso,

por exemplo, resultados de simulações

(37)

Nem sempre use gráficos

•  Tabelas são adequadas para conjuntos de poucos valores

–  Ex.: 10 ou menos

•  Melhor para certos arranjos de dados

–  especialmente se há limitação de espaço no artigo

–  ex.: 10 gráficos de 3 pontos cada

•  As vezes uma sentença no texto resume melhor os dados

–  Uma sentença com a média e desvio padrão

•  Sempre questione se o gráfico é a melhor maneira de dizer ou

demonstrar um ponto do trabalho e se o gráfico é capaz de

fazê-lo.

(38)

Analise e discuta no texto

•  Figuras devem ser auto-explicativas

–  Muitas pessoas (principalmente os mais seniors ou mais

quantitativos), olhem primeiramente as figuras e seus

números.

–  Assim, bons graficos podem “capturar” o leitor de um artigo,

como certas fotos “capturam” o leitor de um jornal.

•  Mas o texto deve enfatizar o que a figura-gráfico

deseja demonstrar, ajudando inclusive a explicá-lo

–  No texto, faça referências explicitas as figuras

–  Aponte o que as figuras significam para as hipóteses e

interprete o significado das figuras

(39)

Estética

•  Nem todos têm de ser artistas

–  Mas figuras e gráficos devem ser visualmente

agradáveis e atrativos ao leitor

•  A elegância de um projeto está na:

–  Simplicidade do projeto

(40)

Alguns princípios de orientação em

busca de uma estética

•  Use formatos e layouts adequados aos dados

•  Use uma combinação de texto, número e desenhos

•  Busque equilíbrio, proporção e escala relevante, com

relação aos dados e ao artigo

•  Procure manter detalhes e complexidade controlados

•  Coloque no texto uma descrição narrativa do gráfico

(41)

Use uma combinação de texto, número e

desenhos

•  Coloque os gráficos próximo ao texto que discuta

esses gráficos.

•  Mesmo que voce tenha vontade de “matar” quem

projetou o processador de texto que voce usa.

•  Integre texto no gráfico

•  E. Tufte: “Gráfico de dados são parágrafos sobre

dados e devem ser tratados como tal.”

(42)
(43)

Use formatos e layouts adequados aos

dados

•  Não produza automaticamente gráficos

– Saiba porque está colocando o

gráfico no texto

•  Escolha um formato de gráfico

apropriado aos dados e artigo e/ou

apresentação

(44)

Busque equilíbrio, proporção e escala

relevante

•  Há a necessidade de um senso artístico, nem

sempre presente

•  Garanta que o texto possa ser lido

–  Tipos muito pequenos são adequados apenas

para jovens!

•  Linhas finas ajudam a estética

–  Use linhas grossas para realçar alguma

informação.

–  A dimensão horizontal deve ser maior que a

vertical: ate 50% maior

(45)

Equilíbrio, proporção e escala relevante

•  O número de falhas nas

redes permanece

constante, exceto a

rede A no mes 3.

•  A rede A tem

desempenho

claramente inferior a

outras no mes 3.

0 10 20 30 40 50 60 70 80 90 100

(46)

Melhor Proporção e Equilíbrio

•  O número de falhas nas redes permanece

constante, exceto a rede A no mes 3.

•  A rede A tem desempenho claramente inferior a

outras no mes 3.

0

50

100

(47)

Procure manter detalhes e complexidade

controlados

•  Projete gráficos “agradáveis e informativos”:

–  Evite abreviações e codificações

–  Explique os dados com textos curtos

–  Coloque “rótulos/labels” nos gráficos e evite

legendas cheias de sombreamento difíceis de

entender.

(48)
(49)

Uma Versão Agradável e Informativa

0

100

200

300

400

1

2

3

4

5

6

7

8

Número de Replicas

Tempo em

Segundos

Copiar

Compilar

Remover

Observe que não há crescimento nos tempos de compilar/remover

(50)
(51)

Have a Story About the Data

(Narrative Quality)

•  May be difficult in technical papers

•  But think about why you are drawing graph

•  Example:

– Performance is controlled by network

speed

– But it tops out at the high end

– And that’s because we hit a CPU

bottleneck

(52)

Showing a Story

About the Data

(53)

Do a Professional Job

of Drawing

•  This is easy with modern tools

– But take the time to do it right

•  Align things carefully

•  Check the final version in the format you will use

– I.e., print the Postscript one last time before

submission

– Or look at your slides on the projection

screen

(54)

Avoid Decoration

and Chartjunk

•  Powerpoint, etc. make chartjunk easy

•  Avoid clip art, automatic backgrounds, etc.

•  Remember: the data is the story

– Statistics aren’t boring

– Uninterested readers aren’t drawn by

cartoons

– Interested readers are distracted

•  Does removing it change the message?

– If not, leave it out

(55)

Examples of Chartjunk

Gridlines!

Vibration

Pointless

Fake 3-D Effects

Filled “Floor”

Clip Art

In or out?

Filled

“Walls”

Borders and

Fills Galore

Unintentional

Heavy or Double Lines

(56)

Common Mistakes in Graphics

•  Excess information

•  Multiple scales

•  Using symbols in place of text

•  Poor scales

(57)

Excess Information

•  Sneaky trick to meet length limits

•  Rules of thumb:

– 6 curves on line chart

– 10 bars on bar chart

– 8 slices on pie chart

(58)
(59)

What’s Important

About That Chart?

•  Times for cp and rcp rise with number of

replicas

•  Most other benchmarks are near

constant

(60)

The Right Amount

of Information

(61)

Multiple Scales

•  Another way to meet length limits

•  Basically, two graphs overlaid on each other

•  Confuses reader (which line goes with which

scale?)

•  Misstates relationships

– Implies equality of magnitude that doesn’t

exist

(62)

Some Especially Bad Multiple

Scales

(63)

Using Symbols

in Place of Text

•  Graphics should be self-explanatory

– Remember that the graphs often draw

the reader in

•  So use explanatory text, not symbols

•  This means no Greek letters!

(64)
(65)
(66)

Poor Scales

•  Plotting programs love non-zero origins

– But people are used to zero

•  Fiddle with axis ranges (and logarithms)

to get your message across

– But don’t lie or cheat

•  Sometimes trimming off high ends

makes things clearer

(67)

Nonzero Origins

(68)
(69)
(70)
(71)
(72)

Using Lines Incorrectly

•  Don’t connect points unless

interpolation is meaningful

•  Don’t smooth lines that are based on

samples

(73)
(74)

Pictorial Games

•  Non-zero origins and broken scales

•  Double-whammy graphs

•  Omitting confidence intervals

•  Poor histogram cell size

(75)

Non-Zero Origins

and Broken Scales

•  People expect (0,0) origins

– Subconsciously

•  So non-zero origins are a great way to lie

•  More common than not in popular press

•  Also very common to cheat by omitting

part of scale

(76)
(77)

Double-Whammy Graphs

•  Put two related measures on same graph

– One is (almost) function of other

•  Hits reader twice with same information

– And thus overstates impact

(78)

Omitting

Confidence Intervals

•  Statistical data is inherently fuzzy

•  But means appear precise

•  Giving confidence intervals can make it

clear there’s no real difference

(79)

Graph Without

(80)

Graph With

(81)

Poor Histogram Cell Size

•  Picking bucket size is always a problem

•  Prefer 5 or more observations per bucket

•  Choice of bucket size can affect results:

(82)

Special-Purpose Charts

•  Histograms

•  Scatter plots

•  Gantt charts

•  Kiviat graphs

(83)
(84)

Scatter Plots

•  Useful in statistical analysis

•  Also excellent for huge quantities of data

– Can show patterns otherwise invisible

(85)

Gantt Charts

•  Shows relative duration of Boolean conditions

•  Arranged to make lines continuous

(86)

Kiviat Graphs

•  Also called “star charts” or “radar plots”

(87)

Useful Reference Works

•  Edward R. Tufte, The Visual Display of

Quantitative Information, Graphics Press,

Cheshire, Connecticut, 1983.

•  Edward R. Tufte, Envisioning Information,

Graphics Press, Cheshire, Connecticut, 1990.

•  Edward R. Tufte, Visual Explanations,

Graphics Press, Cheshire, Connecticut, 1997.

•  Darrell Huff, How to Lie With Statistics, W.W.

Referências

Documentos relacionados

entre hepcidina e SAOS, sugerindo que a hepcidina poderia ser um marcador prognóstico de doenças inflamatórias em indivíduos com SAOS, já que apnéia do sono

c) Nominais: são variáveis que apresentam três ou mais categorias e estas não apresentam ordem alguma entre elas. Exemplo: tipo de sangue A, B, AB, O ou cor dos olhos marrom,

Lá estão sendo feitas coisas como turbinas muito mais eficientes para gerar a energia, eletrodomésticos, motores elétricos e iluminação urbana de altíssima eficiência,

O blister seguinte deverá ser iniciado após um intervalo de 7 dias sem toma de comprimidos, durante o qual ocorre habitualmente uma hemorragia de privação normalmente 2 a 3 dias

• De maneira geral, variáveis qualitativas são melhor representadas por gráficos de barra ou gráficos do tipo Kiviat.. – No caso de variáveis ordenadas, gráficos de barra

24) Atribuição de apoio à sociedade Filarmónica União 1.º de Dezembro 1902 de Atouguia da Baleia, no âmbito de uma candidatura submetida para tipologia de apoio à atividade

Mártir da Independência do Brasil, nasceu no ano de 1746 na Fazenda do Pombal, próxima ao arraial de Santa Rita do Rio Abaixo, entre a Vila de São José, hoje Tiradentes, e São

A Revista JusFaro da Faculdade de Rondônia - Faro, com objetivo de difundir artigos, resultantes de pesquisas em todas as áreas do Direito, abre chamada pública para sua nova