• Nenhum resultado encontrado

Exerc´ıcios

No documento graficos r (páginas 57-117)

2.1

Explorando Pacotes

2.1.1

Introdu¸c˜ao

No R existem, al´em dos pacotes b´asicos, v´arios outros pacotes (packages) que geram muitos tipos diferentes de gr´aficos. Nesta se¸c˜ao, iremos estudar como gerar gr´aficos estat´ısticos utilizando estes diferentes pacotes.

Entre na p´agina do R e explore alguns pacotes, claro, dando enfoque para a parte gr´afica.

Para ’baixar’ um pacote, no R digite

> require("nome.do.pacote")

Tamb´em daremos algum enfoque na forma de apresenta¸c˜ao de gr´aficos, procu- rando seguir as normas de publica¸c˜ao e, claro, dentro dos aspectos estat´ısticos.

Segunda avalia¸c˜ao: Para a segunda avalia¸c˜ao, cada aluno dever´a escolher um pacote do R, obviamente, que trabalhe com fun¸c˜oes gr´aficas. Um das quest˜oes ser´a a entrega de um trabalho (um gr´afico) baseado em uma ou mais fun¸c˜oes gr´aficas de um pacote. Vocˆe deve utilizar somente as fun¸c˜oes do pacote e/ou fun¸c˜oes b´asicas do R, ou seja, vocˆe deve usar a fun¸c˜ao require() apenas uma vez. Procure utilizar dados originais ou ent˜ao, simule-os no pr´oprio R (indique a semente set.seed()).

Ap´os a escolha do pacote, envie uma email para o professor com o subject pacote, informando qual o nome do pacote. A preferˆencia ser´a dada pela ordem de chegada dos emails.

O trabalho dever´a ser entregue no dia da segunda avalia¸c˜ao. Utilize a aula de hoje para pesquisar esses pacotes.

2.2

Apresenta¸c˜ao de Gr´aficos

2.2.1

Introdu¸c˜ao

Nesta se¸c˜ao veremos alguns pontos que tratam da apresenta¸c˜ao de gr´aficos, como por exemplo, t´ıtulos, formato etc. As informa¸c˜oes contidas desta se¸c˜ao s˜ao ba- seadas nas Normas para apresenta¸c˜ao de trabalhos cient´ıficos publicada pela UFPR. Estas normas, por sua vez, baseiam-se nas normas da ABNT (Associa¸c˜ao Brasileira de Normas T´ecnicas). Mesmo assim, muitas revistas cient´ıficas, por exemplo, po- dem possuir normas ou recomenda¸c˜oes diferentes das apresentadas nesse e em outros textos.

Procure, daqui para frente, observar os detalhes de apresenta¸c˜ao de gr´aficos, n˜ao s´o em rela¸c˜ao as normas de apresenta¸c˜ao, mas tamb´em com rela¸c˜ao `a qualidade de apresenta¸c˜ao das informa¸c˜oes.

2.2.2

Percep¸c˜ao gr´afica

Existem algumas caracter´ısticas fundamentais em gr´aficos que podem gerar diferentes percep¸c˜oes em diferentes indiv´ıduos:

1. Posi¸c˜ao ao longo de uma escala comum; 2. Posi¸c˜ao ao longo de uma escala n˜ao alinhada;

3. Longitude; 4. Angula¸c˜ao; 5. Area;´

6. Volume, densidade e satura¸c˜ao de cores; 7. Escala de cores.

Cada indiv´ıduo possui uma percep¸c˜ao diferente em determinados aspectos.

2.2.3

Classifica¸c˜ao de gr´aficos

Dependendo da finalidade, um gr´afico pode ser classificado em:

• Gr´aficos de Propaganda;

• Gr´aficos Anal´ıticos: informam o que est´a acontecendo. Em geral, os gr´aficos estat´ısticos;

• Gr´aficos que substituem tabelas: necessariamente deve-se ler os n´umeros para poder interpret´a-lo;

• Gr´aficos decorativos: apenas s˜ao apresentados porque s˜ao bonitos mas n˜ao oferecem muita informa¸c˜ao.

2.2.4

Princ´ıpios b´asicos de um gr´afico

Em um gr´afico deve-se procurar observar alguns princ´ıpios. Basicamente, um gr´afico deve ser:

• Compreens´ıvel: permite visualizar as rela¸c˜oes entre vari´aveis;

• Claro: todos os componentes de um gr´afico devem ser perfeitamente percept´ı- veis, principalmente os componentes mais imprtantes devem estar visivelmente destacados;

• Consistente: os elementos gr´aficos devem fornecer informa¸c˜oes coerentes com gr´aficos anteriores; novos elementos podem requerer uma descri¸c˜ao adicional para fazerem sentido

• Eficiˆencia: os elementos gr´aficos devem representar exatamente o que os dados querem dizer; pode ser que existam elementos que representem mais de uma informa¸c˜ao

• Necessidade: um gr´afico deve ser ´util para representar dados; deve haver uma necessidade para inserir elementos em um gr´afico

• Confiabilidade: os dados devem estar corretamente representados, principal- mente no que diz respeito `a escala

2.2.5

Elementos de um gr´afico

• T´ıtulo Principal

• T´ıtulo Secund´ario o Subt´ıtulo • Descri¸c˜ao do gr´afico

• Regi˜ao de dados e s´ımbolos • Eixo horizonta e escala • Eixo vertical e escala

• Indicadores: flechas, n´umeros • Descri¸c˜ao de sinais e marcas

2.2.6

Recomenda¸c˜oes gerais para elaborar um gr´afico

1. Os dados devem se sobressair, aparecer. Evite informa¸c˜oes desnecess´arias. 2. Utilize elementos destacados para mostrar os dados.

3. N˜ao exagere no n´umero de s´ımbolos.

4. Utilize uma linha de referˆencia quando h´a algum valor importante que deva ser visto em todo o gr´afico, por exemplo, uma linha m´edia. Cuide para que isso n˜ao interfira na apresenta¸c˜ao do gr´afico.

5. N˜ao deixar que s´ımbolos ou outros elementos interfiram em dados quantitati- vos, por exemplo, se amontoando.

6. Evite colocar notas, marcas ou sinais em um lado da regi˜ao do gr´afico. Coloque notas no texto de como explica¸c˜ao.

7. Gr´aficos sobrepostos devem ser visualmente diferenci´aveis.

8. Datos sobrepostos devem ser visualmente diferenci´aveis.

9. Um gr´afico deve mostras os dados.

10. Um gr´afico deve induzir o aobservador a pensar sobre o conte´udo e n˜ao no desenho do gr´afico, na tecnologia ou outros atributos.

11. Evitar distorcer a mensagem que os dados devem passar.

12. Evitar muitos n´umeros em um espa¸co pequeno.

13. Fazer com que grandes conjuntos de dados tenham coerˆencia.

14. Induzir que os olhos do observador comparem diferentes partes dos dados.

15. Revelar diferentes detalhes dos dados, desde a perspectiva global at´e detalhes particulares.

16. Ter um objetivo bastante claro: descri¸c˜ao, explora¸c˜ao, tabula¸c˜ao e decora¸c˜ao.

17. Estar bastante integrado as descri¸c˜oes estat´ısticas e verbais do conjunto de dados.

2.2.7

Erros mais comuns em gr´aficos

1. Em geral, excessso de decora¸c˜ao ´e um problema;

2. Ausˆencia de um t´ıtulo, marcas e indicadores;

3. Ausˆencia ou erro na escala de eixos;

4. Excesso de informa¸c˜ao;

5. Falta de dados;

2.2.8

Objetivo de um gr´afico

Inicialmente, um gr´afico tem a finalidade de apresentar uma informa¸c˜ao de maneira clara, r´apida e objetiva, al´em de resumir, organizar e apresentar dados de qualquer natureza.

Obviamente, existem naturezas diversas, bem como objetivos variados na apre- senta¸c˜ao de gr´aficos. Pode-se, por exemplo, citar gr´aficos com fins promocionais. Muitas vezes, eles n˜ao seguem quaisquer normas r´ıgidas de apresenta¸c˜ao. Mesmo nesses casos, deve-se ter sempre em mente que a informa¸c˜ao n˜ao pode ser modifi- cada. Aspectos relacionados com a maneira de evidenciar ou obscurecer informa¸c˜oes em gr´aficos n˜ao ser˜ao tratados nesse texto.

Elementos b´asicos:

2.2.9

N´umera¸c˜ao

Assim como tabelas, os gr´aficos devem ser referenciados no texto. Se eles ocorrem em um trabalho, ´e porque possuem alguma importˆancia, fornecem alguma informa¸c˜ao. Portanto, eles precisam ter alguma explica¸c˜ao ou coment´ario a respeito deles no corpo do trabalho.

Por esse motivo, os gr´aficos devem ser numerados seq¨uencialmente ao longo do texto, independente do tipo. Insere-se, no texto, a palavra Gr´afico e em seguida o n´umero. Pode-se abreviar a palavra Gr´afico. Em alguns textos ou revistas, podeser exigida a palavra figura.

Exemplo:

GR ´AFICO 1 - N´umero m´edio mensal de acidentes de trˆansito com ciclistas em Curitiba no ano de 2005.

No caso de cap´ıtulos, deve-se utilizar a numera¸c˜ao correspondente ao cap´ıtulo. Exemplo: No cap´ıtulo 1 use GR ´AFICO 1.1

GR ´AFICO 1.2

No cap´ıtulo 2 use GR ´AFICO 2.1 GR ´AFICO 2.2

2.2.10

T´ıtulo

De maneira simples, o t´ıtulo de um gr´afico deve ser suficiente para o leitor entender seu conte´udo e sua inser¸c˜ao no contexto do material publicado.

Basicamente, o t´ıtulo traz uma breve descri¸c˜ao do conte´udo do gr´afico e uma data de referˆencia, quando for o caso.

2.2.11

Fonte

Em gr´aficos estat´ısticos, ´e recomend´avel que a fonte (respons´avel) dos dados seja mencionada. Normalmente a fonte ´e apresentada abaixo do gr´afico, com uma tamanho de letra menor do que a do t´ıtulo, iniciada com a express˜ao Fonte.

2.2.12

Escala

Em um gr´afico, as informa¸c˜oes que possuem uma escala devem ser apresentadas com clareza. Os n´umeros da escala devem estar na posi¸c˜ao horizontal e na regi˜ao externa dos eixos. A unidade de medida deve aparecer no final de cada linha do gr´afico.

Caso n˜ao seja poss´ıvel apresentar a escala por completo, pode-se fazer um corte no eixo correspondente para informar que a escala n˜ao est´a completa.

2.2.13

Diferen¸ca de linhas

Cores: dependem dos recursos e da finalidade. Em geral, para publica¸c˜ao em revistas cient´ıficas, em se tratando de gr´aficos estat´ısticos, s˜ao utilizados apenas gr´aficos em preto e branco. Uma alternativa ´e utilizar tonalidades de preto, passando pelo cinza, at´e o branco.

Al´em de cores, podem-se utilizar hachuras ou linhas pontilhadas

legenda: Tanto cores, como linhas pontilhadas ou hachuras devem ser referen- ciadas em uma legenda.

2.2.14

Apresenta¸c˜ao

Em geral, pode-se dizer que quando um gr´afico n˜ao consegue expressar a devida informa¸c˜ao sem a necessidade de n´umeros, ´e porque uma tabela deve ser uma op¸c˜ao mais adequada.

2.3

Gr´aficos univariados

Nesta se¸c˜ao, estudaremos alguns gr´aficos univariados. O principal objetivo destes gr´aficos ´e fazer uma an´alise descritiva de dados. Entende-se por an´alise des- critiva a obten¸c˜ao de informa¸c˜oes que auxiliem na interpreta¸c˜ao e na avalia¸c˜ao da qualidade dos dados em determinadas situa¸c˜oes. Basicamente a freq¨uˆencia e a forma de distribui¸c˜ao dos dados s˜ao os aspectos que podem ser considerados mais relevan- tes em uma an´alise gr´afica univariada. Obviamente, em casos particulares, pode-se ter interesses diferentes dos aqui apresentados.

No R, iremos utilizar alguns conjuntos de dados provenientes de pacotes e em algumas situa¸c˜oes, utilizaremos fun¸c˜oes espec´ıficas de alguns pacotes.

2.3.1

Ramo-e-folhas

O objetivo de um gr´afico ramo-e-folhas ´e resumir os dados de tal forma que se possa ter uma no¸c˜ao da forma da distribui¸c˜ao dos dados (sim´etrica, assim´etrica), a freq¨uˆencia de observa¸c˜oes, vazios entre os dados e poss´ıveis dados discrepantes (outliers).

As observa¸c˜oes devem ser divididas em duas partes. A primeira, chamada de ramo, ´e colocada `a direita de uma linha vertical, e a segunda, chamada de folhas, ´e colocada ´a esquerda. Por exemplo, se a vari´avel possui valores do tipo 2, 34; 2, 98, o n´umero 2 ser´a o ramo e 34 e 98 ser˜ao as folhas.

A maneira como s˜ao distribu´ıdos os ramos e folhas podem variar em fun¸c˜ao da quantidade de dados. Em alguns casos, pode-se ter uma visualiza¸c˜ao melhor com uma separa¸c˜ao dos dados por ramo.

Exemplo

Vamos considerar um conjuto de dados simulados no R:

> set.seed(2209)

> dados <- sample(1:100, 50)

Para construir o gr´afico, utiliza-se a fun¸c˜ao stem().

> stem(dados)

The decimal point is 1 digit(s) to the right of the |

0 | 267 1 | 01257 2 | 03579 3 | 0123 4 | 345678 5 | 1369 6 | 346789 7 | 23468 8 | 3456789 9 | 2679 10 | 0

Veja os argumentos e o help da da fun¸c˜ao stem():

> args(stem)

function (x, scale = 1, width = 80, atom = 1e-08) NULL

Experimente alterar alguns dos parˆametros da fun¸c˜ao. Tente, tamb´em, aumen- tar o tamanho e o tipo de dado gerado. Por exemplo, gere dados de uma distribui¸c˜ao Normal, utilizando rnorm().

2.3.2

Box-Plot

O box-plot ´e um gr´afico que mostra a posi¸c˜ao central, dispers˜ao e simetria dos dados de uma amostra , comprimento de caudas e dados discrepantes. ´E utilizado para resumir as informa¸c˜oes de um conjunto de dados.

Esse gr´afico ´e baseado no “resumo dos 5 n´umeros”(fivenum()).

Considere o seguinte conjunto de dados: 17, 22, 23, 27, 29, 32, 38, 42, 46, 52, 60, 92

Para construir o box-plot dessas observa¸c˜oes, devemos seguir os seguintes pas- sos:

Passo 1: Calcular a mediana , o primeiro e terceiro quartis, e a amplitude interquart´ılica.

> box <- c(17, 22, 23, 27, 29, 32, 38, 42, 46, 52, 60, 92) > quantile(box, type = 2)

0% 25% 50% 75% 100%

17 25 35 49 92

> AIQ <- quantile(box, 0.75, type = 2) - quantile(box, 0.25, + type = 2)

Passo 2: Calcular 1,5 × AIQ =1,5 × 24=36 e, Limite inferior = Q1-36=25-36=-11 Limite superior = Q3+36=49+36=85

Passo 3: Encontrar o menor valor e o maior valor dentro dos limites inferiores e supe- riores, respectivamente: menor=17 e maior=60;

Passo 4: Construir o gr´afico (figura 2.1)

No R, basta utilizar a fun¸c˜ao boxplot() informando a vari´avel que ser´a uti- lizada.

Al´em do gr´afico, a fun¸c˜ao boxplot() retorna outras estat´ıstica que podem ser de interesse.

Figura 2.1: Gr´afico Box-Plot. > boxplot(box, main = "Box plot")

20 40 60 80 Box plot $stats [1] 17 25 35 49 60 $n [1] 12 $conf [1] 24.05344 45.94656 $out [1] 92

Veja outras op¸c˜oes da fun¸c˜ao boxplot().

num´erica, ser´a constru´ıdo apenas um box-plot. No caso de existir mais de uma vari´avel, por exemplo, um data.frame, a fun¸c˜ao boxplot() ir´a construir um box- plot para cada coluna.

Se existir uma vari´avel do tipo factor, pode-se utilizar uma f´ormula para construir um box-plot para cada categoria.

Por exemplo, considere os dados sobre gatos (cats) do pacote MASS. Existem trˆes colunas: Sex (sexo), Bwt (peso do corpo), Hwt (peso do cora¸c˜ao).

> library(MASS) > data(cats)

Para construir um box-plot para cada um dos sexos, utiliza-se o seguinte:

> boxplot(Bwt ~ Sex, data = cats)

Experimente alterar algumas op¸c˜oes da fun¸c˜ao boxplot(). Veja, por exemplo, como mudar cores.

A op¸c˜ao notch=TRUE insere um corte (entalhe) em cada box-plot. Quando esses cortes se sobrep˜oem, isso indica que n˜ao deve haver diferen¸cas entre as medianas dos grupos.

2.3.3

Gr´aficos de setores ou circulares

O gr´afico de setores ou circular, tamb´em conhecido como ’pizza’ pode ser utilizado para representar a freq¨uˆencia de observa¸c˜oes de diferentes categorias. O tamanho de cada setor ´e proporcional ao n´umero de observa¸c˜oes em cada categoria. O tamanho pode ser definido em n´umeros percentuais ou absolutos.

Em geral, um gr´afico de setores n˜ao ´e um bom modo de representar dados por- que o olho humano tem dificuldades para comparar ´areas relativas. em compara¸c˜ao com medidas lineares.

No R, a fun¸c˜ao utilizada para esse tipo de gr´afico ´e pie(). Vamos utilizar os dados do arquivo cats do pacote MASS:

> require(MASS) > data(cats) > attach(cats)

Figura 2.2: .Gr´afico Box-Plot com cores.

> boxplot(Bwt ~ Sex, col = c("red", "blue"), data = cats)

F M

2.0

2.5

3.0

3.5

Experimente obter algumas informa¸c˜oes,

> summary(cats) Sex Bwt Hwt F:47 Min. :2.000 Min. : 6.30 M:97 1st Qu.:2.300 1st Qu.: 8.95 Median :2.700 Median :10.10 Mean :2.724 Mean :10.63 3rd Qu.:3.025 3rd Qu.:12.12 Max. :3.900 Max. :20.50

A fun¸c˜ao tapply() (t de table) pode ser utilizada para obter estat´ısticas por grupos:

> tapply(Bwt, Sex, mean)

F M

2.359574 2.900000

Nesse exemplo, utiliza-se a vari´avel resposta Bwt, agrupa-se por Sex e estima-se a m´edia de cada grupo.

ou fazendo tabelas,

> table(Sex)

Sex F M 47 97

Suponha uma nova vari´avel, onde, se o peso do cora¸c˜ao for maior ou igual a 9,5, o gato est´a apto e, caso contr´ario, estar´a inapto.

> aptidao <- ifelse(Hwt >= 9.5, "apto", "inapto") > table(Sex, aptidao)

aptidao Sex apto inapto

F 23 24

M 72 25

Obten¸c˜ao de uma soma marginal:

> sex.t <- table(Sex, aptidao) > margin.table(sex.t, 1)

Sex F M 47 97

aptidao

apto inapto

95 49

Para obter freq¨uˆencias relativas, utilize

> prop.table(sex.t, 1)

aptidao

Sex apto inapto

F 0.4893617 0.5106383 M 0.7422680 0.2577320

> prop.table(sex.t, 2)

aptidao

Sex apto inapto

F 0.2421053 0.4897959 M 0.7578947 0.5102041

Se for de interesse obter valores em percentual, multiplique por 100. Para obter as propor¸c˜oes em fun¸c˜ao do total geral, basta utilizar

> sex.t/sum(sex.t)

aptidao

Sex apto inapto

F 0.1597222 0.1666667 M 0.5000000 0.1736111

> round(sex.t/sum(sex.t), 2)

aptidao Sex apto inapto

F 0.16 0.17 M 0.50 0.17

Figura 2.3: Gr´afico de Setores. > pie(margin.table(sex.t, 2))

apto

inapto

(com duas casas decimais)

O gr´afico de setores pode ser obtido da seguinte maneira: Outros exemplos

Alguns outros exemplos podem ser vistos a seguir. Por exemplo:

> cores <- c(0.3, 0.25, 0.2, 0.15, 0.1)

> names(cores) <- c("verde", "vermelho", "azul", "laranja", + "preto")

Para esses dados, um gr´afico de setores pode ser constru´ıdo da seguinte forma: Pode-se trabalhar com cores da seguinte forma:

Figura 2.4: Gr´afico de Setores. > pie(cores) verde vermelho azul laranja preto

Existem outros parˆametros gr´aficos que podem ser utilizados. Veja os argu- mentos da fun¸c˜ao pie() e outros exemplos utilizando ?pie.

2.3.4

Gr´afico de barras

Assim como o gr´afico de setores, o gr´afico de barras ´e utilizado para representar a freq¨uˆencia absoluta ou percentual de diferentes categorias.

Basicamente, s˜ao constru´ıdas barras proporcionais as freq¨uˆencias. No R, utiliza- se a fun¸c˜ao barplot(). Como exemplo veja a figura 2.6,

Tamb´em, pode-se trabalhar com cores (figura 2.7):

Quando trata-se de dados dispostos em uma tabela, a fun¸c˜ao barplot() ’en- xerga’ os dados da seguinte maneira (figura 2.8):

Figura 2.5: Gr´afico de Setores. > pie(rep(1, 24), col = rainbow(24), radius = 0.9)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Para inverter as posi¸c˜oes, basta utilizar a fun¸c˜ao t(), que transp˜oe a matriz de dados (figura 2.9):

Ainda, pode-se colocar as barras lado a lado e inserir uma legenda (figura 2.10) :

Se os dados est˜ao no formato de uma matriz, as barras s˜ao agrupadas para re- presentar os dados de maneira adequada. Por exemplo, considere o seguite conjunto de dados:

> disciplina <- c("CE213", "CE214", "CE219") > alunos <- c("A", "B", "C")

> notas <- matrix(c(71, 62, 75, 83, 54, 60, 82, 43, 67), nc = 3, + dimnames = list(alunos, disciplina))

Figura 2.6: Gr´afico de Barras. > barplot(cores)

verde vermelho azul laranja preto

0.00 0.05 0.10 0.15 0.20 0.25 0.30

CE213 CE214 CE219

A 71 83 82

B 62 54 43

C 75 60 67

Para esses dados, a fun¸c˜ao barplot() retorna o seguinte gr´afico:

Veja o arquivo de ajuda da fun¸c˜ao barplot() para ver mais exemplos e outras funcionalidades.

Figura 2.7: Gr´afico de Barras.

> barplot(cores, col = c("green", "red", "blue", "orange",

+ "black"))

verde vermelho azul laranja preto

0.00 0.05 0.10 0.15 0.20 0.25 0.30

2.3.5

Histograma

Um histograma ´e utilizado para representar a distribui¸c˜ao de uma vari´avel aleat´oria cont´ınua. Basicamente, as freq¨uˆencias observadas s˜ao representadas por classes de ocorrˆencia. As freq¨uˆencias absolutas podem ser substitu´ıdas por freq¨uˆen- cias relativas ou proporcionais.

Um dos principais aspectos na constru¸c˜ao de um histograma ´e a defini¸c˜ao do n´umero de classes. Existem v´arias proposi¸c˜oes sobre esse aspecto. No R algumas dessas proposi¸c˜oes est˜ao implementadas. Inicialmente, vamos estudar os comandos b´asicos do histograma e a seguir, aplicar os diferentes m´etodos para defini¸c˜ao do n´umero de classes.

Figura 2.8: Gr´afico de Barras a partir de uma tabela. > barplot(sex.t) apto inapto 0 20 40 60 80

fun¸c˜ao, utilize ?hist ou args(hist) para ver quais argumentos s˜ao poss´ıveis para a fun¸c˜ao hist().

function (x, ...) NULL

Como exemplo, considere o seguinte conjunto de dados:

> set.seed(123)

> x <- sample(1:100, 50, rep = TRUE) > x

[1] 29 79 41 89 95 5 53 90 56 46 96 46 68 58 11 90 25

[18] 5 33 96 89 70 65 100 66 71 55 60 29 15 97 91 70 80

Figura 2.9: Gr´afico de Barras a partir de uma tabela - invers˜ao . > barplot(t(sex.t)) F M 0 20 40 60 80

Um simples histograma pode ser gerado da seguinte maneira:

O n´umero de classes pode ser alterado com o comando breaks. Nesse caso s˜ao aceitos um simples n´umero indicando quantas classes devem ser formadas. Inter- namente, h´a uma fun¸c˜ao de tolerˆancia que pode n˜ao responder ao valor informado. Dependendo da configura¸c˜ao dos dados,o R, automaticamente, faz um ajuste dife- rente do solicitado.

Veja alguns exemplos

As classes podem ser explicitamente definidas pelo usu´ario de v´arias maneiras:

> hist(x, br = c(0, 15, 30, 45, 60, 75, 90, max(x))) > hist(x, br = seq(0, 100, len = 8))

Figura 2.10: Gr´afico de Barras a partir de uma tabela - legenda. > barplot(sex.t, beside = TRUE, legend.text = rownames(sex.t),

+ col = c("white", "gray"))

apto inapto F M 0 10 20 30 40 50 60 70 > hist(x, br = c(0, 10, 35, 45, 60, 70, 90, max(x)))

O argumento right=TRUE, indica que o intervalo de classe ´e definido da forma (a,b], ou seja, aberto `a esquerda e fechado `a direita.

O argumento include.lowest=TRUE indica como o R trata das observa¸c˜oes que est˜ao nos extremos dos dados. Esse argumento ´e dependente da op¸c˜ao breaks e rigth.

O n´umero de classes ´e importante na constru¸c˜ao do histograma, pois isso afeta a forma do gr´afico e por sua vez, a maneira como os dados ou informa¸c˜oes ser˜ao interpretadas.

Na fun¸c˜ao hist()o m´etodo de Sturges ´e o padr˜ao. Esse m´etodo define o n´umero de classes, k, atrav´es da seguinte express˜ao k = 1 + log2(n). Outra op¸c˜ao

Figura 2.11: Gr´afico de Barras a partir de uma ’matriz’.

No documento graficos r (páginas 57-117)

Documentos relacionados