2.1
Explorando Pacotes
2.1.1
Introdu¸c˜ao
No R existem, al´em dos pacotes b´asicos, v´arios outros pacotes (packages) que geram muitos tipos diferentes de gr´aficos. Nesta se¸c˜ao, iremos estudar como gerar gr´aficos estat´ısticos utilizando estes diferentes pacotes.
Entre na p´agina do R e explore alguns pacotes, claro, dando enfoque para a parte gr´afica.
Para ’baixar’ um pacote, no R digite
> require("nome.do.pacote")
Tamb´em daremos algum enfoque na forma de apresenta¸c˜ao de gr´aficos, procu- rando seguir as normas de publica¸c˜ao e, claro, dentro dos aspectos estat´ısticos.
Segunda avalia¸c˜ao: Para a segunda avalia¸c˜ao, cada aluno dever´a escolher um pacote do R, obviamente, que trabalhe com fun¸c˜oes gr´aficas. Um das quest˜oes ser´a a entrega de um trabalho (um gr´afico) baseado em uma ou mais fun¸c˜oes gr´aficas de um pacote. Vocˆe deve utilizar somente as fun¸c˜oes do pacote e/ou fun¸c˜oes b´asicas do R, ou seja, vocˆe deve usar a fun¸c˜ao require() apenas uma vez. Procure utilizar dados originais ou ent˜ao, simule-os no pr´oprio R (indique a semente set.seed()).
Ap´os a escolha do pacote, envie uma email para o professor com o subject pacote, informando qual o nome do pacote. A preferˆencia ser´a dada pela ordem de chegada dos emails.
O trabalho dever´a ser entregue no dia da segunda avalia¸c˜ao. Utilize a aula de hoje para pesquisar esses pacotes.
2.2
Apresenta¸c˜ao de Gr´aficos
2.2.1
Introdu¸c˜ao
Nesta se¸c˜ao veremos alguns pontos que tratam da apresenta¸c˜ao de gr´aficos, como por exemplo, t´ıtulos, formato etc. As informa¸c˜oes contidas desta se¸c˜ao s˜ao ba- seadas nas Normas para apresenta¸c˜ao de trabalhos cient´ıficos publicada pela UFPR. Estas normas, por sua vez, baseiam-se nas normas da ABNT (Associa¸c˜ao Brasileira de Normas T´ecnicas). Mesmo assim, muitas revistas cient´ıficas, por exemplo, po- dem possuir normas ou recomenda¸c˜oes diferentes das apresentadas nesse e em outros textos.
Procure, daqui para frente, observar os detalhes de apresenta¸c˜ao de gr´aficos, n˜ao s´o em rela¸c˜ao as normas de apresenta¸c˜ao, mas tamb´em com rela¸c˜ao `a qualidade de apresenta¸c˜ao das informa¸c˜oes.
2.2.2
Percep¸c˜ao gr´afica
Existem algumas caracter´ısticas fundamentais em gr´aficos que podem gerar diferentes percep¸c˜oes em diferentes indiv´ıduos:
1. Posi¸c˜ao ao longo de uma escala comum; 2. Posi¸c˜ao ao longo de uma escala n˜ao alinhada;
3. Longitude; 4. Angula¸c˜ao; 5. Area;´
6. Volume, densidade e satura¸c˜ao de cores; 7. Escala de cores.
Cada indiv´ıduo possui uma percep¸c˜ao diferente em determinados aspectos.
2.2.3
Classifica¸c˜ao de gr´aficos
Dependendo da finalidade, um gr´afico pode ser classificado em:
• Gr´aficos de Propaganda;
• Gr´aficos Anal´ıticos: informam o que est´a acontecendo. Em geral, os gr´aficos estat´ısticos;
• Gr´aficos que substituem tabelas: necessariamente deve-se ler os n´umeros para poder interpret´a-lo;
• Gr´aficos decorativos: apenas s˜ao apresentados porque s˜ao bonitos mas n˜ao oferecem muita informa¸c˜ao.
2.2.4
Princ´ıpios b´asicos de um gr´afico
Em um gr´afico deve-se procurar observar alguns princ´ıpios. Basicamente, um gr´afico deve ser:
• Compreens´ıvel: permite visualizar as rela¸c˜oes entre vari´aveis;
• Claro: todos os componentes de um gr´afico devem ser perfeitamente percept´ı- veis, principalmente os componentes mais imprtantes devem estar visivelmente destacados;
• Consistente: os elementos gr´aficos devem fornecer informa¸c˜oes coerentes com gr´aficos anteriores; novos elementos podem requerer uma descri¸c˜ao adicional para fazerem sentido
• Eficiˆencia: os elementos gr´aficos devem representar exatamente o que os dados querem dizer; pode ser que existam elementos que representem mais de uma informa¸c˜ao
• Necessidade: um gr´afico deve ser ´util para representar dados; deve haver uma necessidade para inserir elementos em um gr´afico
• Confiabilidade: os dados devem estar corretamente representados, principal- mente no que diz respeito `a escala
2.2.5
Elementos de um gr´afico
• T´ıtulo Principal• T´ıtulo Secund´ario o Subt´ıtulo • Descri¸c˜ao do gr´afico
• Regi˜ao de dados e s´ımbolos • Eixo horizonta e escala • Eixo vertical e escala
• Indicadores: flechas, n´umeros • Descri¸c˜ao de sinais e marcas
2.2.6
Recomenda¸c˜oes gerais para elaborar um gr´afico
1. Os dados devem se sobressair, aparecer. Evite informa¸c˜oes desnecess´arias. 2. Utilize elementos destacados para mostrar os dados.3. N˜ao exagere no n´umero de s´ımbolos.
4. Utilize uma linha de referˆencia quando h´a algum valor importante que deva ser visto em todo o gr´afico, por exemplo, uma linha m´edia. Cuide para que isso n˜ao interfira na apresenta¸c˜ao do gr´afico.
5. N˜ao deixar que s´ımbolos ou outros elementos interfiram em dados quantitati- vos, por exemplo, se amontoando.
6. Evite colocar notas, marcas ou sinais em um lado da regi˜ao do gr´afico. Coloque notas no texto de como explica¸c˜ao.
7. Gr´aficos sobrepostos devem ser visualmente diferenci´aveis.
8. Datos sobrepostos devem ser visualmente diferenci´aveis.
9. Um gr´afico deve mostras os dados.
10. Um gr´afico deve induzir o aobservador a pensar sobre o conte´udo e n˜ao no desenho do gr´afico, na tecnologia ou outros atributos.
11. Evitar distorcer a mensagem que os dados devem passar.
12. Evitar muitos n´umeros em um espa¸co pequeno.
13. Fazer com que grandes conjuntos de dados tenham coerˆencia.
14. Induzir que os olhos do observador comparem diferentes partes dos dados.
15. Revelar diferentes detalhes dos dados, desde a perspectiva global at´e detalhes particulares.
16. Ter um objetivo bastante claro: descri¸c˜ao, explora¸c˜ao, tabula¸c˜ao e decora¸c˜ao.
17. Estar bastante integrado as descri¸c˜oes estat´ısticas e verbais do conjunto de dados.
2.2.7
Erros mais comuns em gr´aficos
1. Em geral, excessso de decora¸c˜ao ´e um problema;2. Ausˆencia de um t´ıtulo, marcas e indicadores;
3. Ausˆencia ou erro na escala de eixos;
4. Excesso de informa¸c˜ao;
5. Falta de dados;
2.2.8
Objetivo de um gr´afico
Inicialmente, um gr´afico tem a finalidade de apresentar uma informa¸c˜ao de maneira clara, r´apida e objetiva, al´em de resumir, organizar e apresentar dados de qualquer natureza.
Obviamente, existem naturezas diversas, bem como objetivos variados na apre- senta¸c˜ao de gr´aficos. Pode-se, por exemplo, citar gr´aficos com fins promocionais. Muitas vezes, eles n˜ao seguem quaisquer normas r´ıgidas de apresenta¸c˜ao. Mesmo nesses casos, deve-se ter sempre em mente que a informa¸c˜ao n˜ao pode ser modifi- cada. Aspectos relacionados com a maneira de evidenciar ou obscurecer informa¸c˜oes em gr´aficos n˜ao ser˜ao tratados nesse texto.
Elementos b´asicos:
2.2.9
N´umera¸c˜ao
Assim como tabelas, os gr´aficos devem ser referenciados no texto. Se eles ocorrem em um trabalho, ´e porque possuem alguma importˆancia, fornecem alguma informa¸c˜ao. Portanto, eles precisam ter alguma explica¸c˜ao ou coment´ario a respeito deles no corpo do trabalho.
Por esse motivo, os gr´aficos devem ser numerados seq¨uencialmente ao longo do texto, independente do tipo. Insere-se, no texto, a palavra Gr´afico e em seguida o n´umero. Pode-se abreviar a palavra Gr´afico. Em alguns textos ou revistas, podeser exigida a palavra figura.
Exemplo:
GR ´AFICO 1 - N´umero m´edio mensal de acidentes de trˆansito com ciclistas em Curitiba no ano de 2005.
No caso de cap´ıtulos, deve-se utilizar a numera¸c˜ao correspondente ao cap´ıtulo. Exemplo: No cap´ıtulo 1 use GR ´AFICO 1.1
GR ´AFICO 1.2
No cap´ıtulo 2 use GR ´AFICO 2.1 GR ´AFICO 2.2
2.2.10
T´ıtulo
De maneira simples, o t´ıtulo de um gr´afico deve ser suficiente para o leitor entender seu conte´udo e sua inser¸c˜ao no contexto do material publicado.
Basicamente, o t´ıtulo traz uma breve descri¸c˜ao do conte´udo do gr´afico e uma data de referˆencia, quando for o caso.
2.2.11
Fonte
Em gr´aficos estat´ısticos, ´e recomend´avel que a fonte (respons´avel) dos dados seja mencionada. Normalmente a fonte ´e apresentada abaixo do gr´afico, com uma tamanho de letra menor do que a do t´ıtulo, iniciada com a express˜ao Fonte.
2.2.12
Escala
Em um gr´afico, as informa¸c˜oes que possuem uma escala devem ser apresentadas com clareza. Os n´umeros da escala devem estar na posi¸c˜ao horizontal e na regi˜ao externa dos eixos. A unidade de medida deve aparecer no final de cada linha do gr´afico.
Caso n˜ao seja poss´ıvel apresentar a escala por completo, pode-se fazer um corte no eixo correspondente para informar que a escala n˜ao est´a completa.
2.2.13
Diferen¸ca de linhas
Cores: dependem dos recursos e da finalidade. Em geral, para publica¸c˜ao em revistas cient´ıficas, em se tratando de gr´aficos estat´ısticos, s˜ao utilizados apenas gr´aficos em preto e branco. Uma alternativa ´e utilizar tonalidades de preto, passando pelo cinza, at´e o branco.
Al´em de cores, podem-se utilizar hachuras ou linhas pontilhadas
legenda: Tanto cores, como linhas pontilhadas ou hachuras devem ser referen- ciadas em uma legenda.
2.2.14
Apresenta¸c˜ao
Em geral, pode-se dizer que quando um gr´afico n˜ao consegue expressar a devida informa¸c˜ao sem a necessidade de n´umeros, ´e porque uma tabela deve ser uma op¸c˜ao mais adequada.
2.3
Gr´aficos univariados
Nesta se¸c˜ao, estudaremos alguns gr´aficos univariados. O principal objetivo destes gr´aficos ´e fazer uma an´alise descritiva de dados. Entende-se por an´alise des- critiva a obten¸c˜ao de informa¸c˜oes que auxiliem na interpreta¸c˜ao e na avalia¸c˜ao da qualidade dos dados em determinadas situa¸c˜oes. Basicamente a freq¨uˆencia e a forma de distribui¸c˜ao dos dados s˜ao os aspectos que podem ser considerados mais relevan- tes em uma an´alise gr´afica univariada. Obviamente, em casos particulares, pode-se ter interesses diferentes dos aqui apresentados.
No R, iremos utilizar alguns conjuntos de dados provenientes de pacotes e em algumas situa¸c˜oes, utilizaremos fun¸c˜oes espec´ıficas de alguns pacotes.
2.3.1
Ramo-e-folhas
O objetivo de um gr´afico ramo-e-folhas ´e resumir os dados de tal forma que se possa ter uma no¸c˜ao da forma da distribui¸c˜ao dos dados (sim´etrica, assim´etrica), a freq¨uˆencia de observa¸c˜oes, vazios entre os dados e poss´ıveis dados discrepantes (outliers).
As observa¸c˜oes devem ser divididas em duas partes. A primeira, chamada de ramo, ´e colocada `a direita de uma linha vertical, e a segunda, chamada de folhas, ´e colocada ´a esquerda. Por exemplo, se a vari´avel possui valores do tipo 2, 34; 2, 98, o n´umero 2 ser´a o ramo e 34 e 98 ser˜ao as folhas.
A maneira como s˜ao distribu´ıdos os ramos e folhas podem variar em fun¸c˜ao da quantidade de dados. Em alguns casos, pode-se ter uma visualiza¸c˜ao melhor com uma separa¸c˜ao dos dados por ramo.
Exemplo
Vamos considerar um conjuto de dados simulados no R:
> set.seed(2209)
> dados <- sample(1:100, 50)
Para construir o gr´afico, utiliza-se a fun¸c˜ao stem().
> stem(dados)
The decimal point is 1 digit(s) to the right of the |
0 | 267 1 | 01257 2 | 03579 3 | 0123 4 | 345678 5 | 1369 6 | 346789 7 | 23468 8 | 3456789 9 | 2679 10 | 0
Veja os argumentos e o help da da fun¸c˜ao stem():
> args(stem)
function (x, scale = 1, width = 80, atom = 1e-08) NULL
Experimente alterar alguns dos parˆametros da fun¸c˜ao. Tente, tamb´em, aumen- tar o tamanho e o tipo de dado gerado. Por exemplo, gere dados de uma distribui¸c˜ao Normal, utilizando rnorm().
2.3.2
Box-Plot
O box-plot ´e um gr´afico que mostra a posi¸c˜ao central, dispers˜ao e simetria dos dados de uma amostra , comprimento de caudas e dados discrepantes. ´E utilizado para resumir as informa¸c˜oes de um conjunto de dados.
Esse gr´afico ´e baseado no “resumo dos 5 n´umeros”(fivenum()).
Considere o seguinte conjunto de dados: 17, 22, 23, 27, 29, 32, 38, 42, 46, 52, 60, 92
Para construir o box-plot dessas observa¸c˜oes, devemos seguir os seguintes pas- sos:
Passo 1: Calcular a mediana , o primeiro e terceiro quartis, e a amplitude interquart´ılica.
> box <- c(17, 22, 23, 27, 29, 32, 38, 42, 46, 52, 60, 92) > quantile(box, type = 2)
0% 25% 50% 75% 100%
17 25 35 49 92
> AIQ <- quantile(box, 0.75, type = 2) - quantile(box, 0.25, + type = 2)
Passo 2: Calcular 1,5 × AIQ =1,5 × 24=36 e, Limite inferior = Q1-36=25-36=-11 Limite superior = Q3+36=49+36=85
Passo 3: Encontrar o menor valor e o maior valor dentro dos limites inferiores e supe- riores, respectivamente: menor=17 e maior=60;
Passo 4: Construir o gr´afico (figura 2.1)
No R, basta utilizar a fun¸c˜ao boxplot() informando a vari´avel que ser´a uti- lizada.
Al´em do gr´afico, a fun¸c˜ao boxplot() retorna outras estat´ıstica que podem ser de interesse.
Figura 2.1: Gr´afico Box-Plot. > boxplot(box, main = "Box plot")
20 40 60 80 Box plot $stats [1] 17 25 35 49 60 $n [1] 12 $conf [1] 24.05344 45.94656 $out [1] 92
Veja outras op¸c˜oes da fun¸c˜ao boxplot().
num´erica, ser´a constru´ıdo apenas um box-plot. No caso de existir mais de uma vari´avel, por exemplo, um data.frame, a fun¸c˜ao boxplot() ir´a construir um box- plot para cada coluna.
Se existir uma vari´avel do tipo factor, pode-se utilizar uma f´ormula para construir um box-plot para cada categoria.
Por exemplo, considere os dados sobre gatos (cats) do pacote MASS. Existem trˆes colunas: Sex (sexo), Bwt (peso do corpo), Hwt (peso do cora¸c˜ao).
> library(MASS) > data(cats)
Para construir um box-plot para cada um dos sexos, utiliza-se o seguinte:
> boxplot(Bwt ~ Sex, data = cats)
Experimente alterar algumas op¸c˜oes da fun¸c˜ao boxplot(). Veja, por exemplo, como mudar cores.
A op¸c˜ao notch=TRUE insere um corte (entalhe) em cada box-plot. Quando esses cortes se sobrep˜oem, isso indica que n˜ao deve haver diferen¸cas entre as medianas dos grupos.
2.3.3
Gr´aficos de setores ou circulares
O gr´afico de setores ou circular, tamb´em conhecido como ’pizza’ pode ser utilizado para representar a freq¨uˆencia de observa¸c˜oes de diferentes categorias. O tamanho de cada setor ´e proporcional ao n´umero de observa¸c˜oes em cada categoria. O tamanho pode ser definido em n´umeros percentuais ou absolutos.
Em geral, um gr´afico de setores n˜ao ´e um bom modo de representar dados por- que o olho humano tem dificuldades para comparar ´areas relativas. em compara¸c˜ao com medidas lineares.
No R, a fun¸c˜ao utilizada para esse tipo de gr´afico ´e pie(). Vamos utilizar os dados do arquivo cats do pacote MASS:
> require(MASS) > data(cats) > attach(cats)
Figura 2.2: .Gr´afico Box-Plot com cores.
> boxplot(Bwt ~ Sex, col = c("red", "blue"), data = cats)
F M
2.0
2.5
3.0
3.5
Experimente obter algumas informa¸c˜oes,
> summary(cats) Sex Bwt Hwt F:47 Min. :2.000 Min. : 6.30 M:97 1st Qu.:2.300 1st Qu.: 8.95 Median :2.700 Median :10.10 Mean :2.724 Mean :10.63 3rd Qu.:3.025 3rd Qu.:12.12 Max. :3.900 Max. :20.50
A fun¸c˜ao tapply() (t de table) pode ser utilizada para obter estat´ısticas por grupos:
> tapply(Bwt, Sex, mean)
F M
2.359574 2.900000
Nesse exemplo, utiliza-se a vari´avel resposta Bwt, agrupa-se por Sex e estima-se a m´edia de cada grupo.
ou fazendo tabelas,
> table(Sex)
Sex F M 47 97
Suponha uma nova vari´avel, onde, se o peso do cora¸c˜ao for maior ou igual a 9,5, o gato est´a apto e, caso contr´ario, estar´a inapto.
> aptidao <- ifelse(Hwt >= 9.5, "apto", "inapto") > table(Sex, aptidao)
aptidao Sex apto inapto
F 23 24
M 72 25
Obten¸c˜ao de uma soma marginal:
> sex.t <- table(Sex, aptidao) > margin.table(sex.t, 1)
Sex F M 47 97
aptidao
apto inapto
95 49
Para obter freq¨uˆencias relativas, utilize
> prop.table(sex.t, 1)
aptidao
Sex apto inapto
F 0.4893617 0.5106383 M 0.7422680 0.2577320
> prop.table(sex.t, 2)
aptidao
Sex apto inapto
F 0.2421053 0.4897959 M 0.7578947 0.5102041
Se for de interesse obter valores em percentual, multiplique por 100. Para obter as propor¸c˜oes em fun¸c˜ao do total geral, basta utilizar
> sex.t/sum(sex.t)
aptidao
Sex apto inapto
F 0.1597222 0.1666667 M 0.5000000 0.1736111
> round(sex.t/sum(sex.t), 2)
aptidao Sex apto inapto
F 0.16 0.17 M 0.50 0.17
Figura 2.3: Gr´afico de Setores. > pie(margin.table(sex.t, 2))
apto
inapto
(com duas casas decimais)
O gr´afico de setores pode ser obtido da seguinte maneira: Outros exemplos
Alguns outros exemplos podem ser vistos a seguir. Por exemplo:
> cores <- c(0.3, 0.25, 0.2, 0.15, 0.1)
> names(cores) <- c("verde", "vermelho", "azul", "laranja", + "preto")
Para esses dados, um gr´afico de setores pode ser constru´ıdo da seguinte forma: Pode-se trabalhar com cores da seguinte forma:
Figura 2.4: Gr´afico de Setores. > pie(cores) verde vermelho azul laranja preto
Existem outros parˆametros gr´aficos que podem ser utilizados. Veja os argu- mentos da fun¸c˜ao pie() e outros exemplos utilizando ?pie.
2.3.4
Gr´afico de barras
Assim como o gr´afico de setores, o gr´afico de barras ´e utilizado para representar a freq¨uˆencia absoluta ou percentual de diferentes categorias.
Basicamente, s˜ao constru´ıdas barras proporcionais as freq¨uˆencias. No R, utiliza- se a fun¸c˜ao barplot(). Como exemplo veja a figura 2.6,
Tamb´em, pode-se trabalhar com cores (figura 2.7):
Quando trata-se de dados dispostos em uma tabela, a fun¸c˜ao barplot() ’en- xerga’ os dados da seguinte maneira (figura 2.8):
Figura 2.5: Gr´afico de Setores. > pie(rep(1, 24), col = rainbow(24), radius = 0.9)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Para inverter as posi¸c˜oes, basta utilizar a fun¸c˜ao t(), que transp˜oe a matriz de dados (figura 2.9):
Ainda, pode-se colocar as barras lado a lado e inserir uma legenda (figura 2.10) :
Se os dados est˜ao no formato de uma matriz, as barras s˜ao agrupadas para re- presentar os dados de maneira adequada. Por exemplo, considere o seguite conjunto de dados:
> disciplina <- c("CE213", "CE214", "CE219") > alunos <- c("A", "B", "C")
> notas <- matrix(c(71, 62, 75, 83, 54, 60, 82, 43, 67), nc = 3, + dimnames = list(alunos, disciplina))
Figura 2.6: Gr´afico de Barras. > barplot(cores)
verde vermelho azul laranja preto
0.00 0.05 0.10 0.15 0.20 0.25 0.30
CE213 CE214 CE219
A 71 83 82
B 62 54 43
C 75 60 67
Para esses dados, a fun¸c˜ao barplot() retorna o seguinte gr´afico:
Veja o arquivo de ajuda da fun¸c˜ao barplot() para ver mais exemplos e outras funcionalidades.
Figura 2.7: Gr´afico de Barras.
> barplot(cores, col = c("green", "red", "blue", "orange",
+ "black"))
verde vermelho azul laranja preto
0.00 0.05 0.10 0.15 0.20 0.25 0.30
2.3.5
Histograma
Um histograma ´e utilizado para representar a distribui¸c˜ao de uma vari´avel aleat´oria cont´ınua. Basicamente, as freq¨uˆencias observadas s˜ao representadas por classes de ocorrˆencia. As freq¨uˆencias absolutas podem ser substitu´ıdas por freq¨uˆen- cias relativas ou proporcionais.
Um dos principais aspectos na constru¸c˜ao de um histograma ´e a defini¸c˜ao do n´umero de classes. Existem v´arias proposi¸c˜oes sobre esse aspecto. No R algumas dessas proposi¸c˜oes est˜ao implementadas. Inicialmente, vamos estudar os comandos b´asicos do histograma e a seguir, aplicar os diferentes m´etodos para defini¸c˜ao do n´umero de classes.
Figura 2.8: Gr´afico de Barras a partir de uma tabela. > barplot(sex.t) apto inapto 0 20 40 60 80
fun¸c˜ao, utilize ?hist ou args(hist) para ver quais argumentos s˜ao poss´ıveis para a fun¸c˜ao hist().
function (x, ...) NULL
Como exemplo, considere o seguinte conjunto de dados:
> set.seed(123)
> x <- sample(1:100, 50, rep = TRUE) > x
[1] 29 79 41 89 95 5 53 90 56 46 96 46 68 58 11 90 25
[18] 5 33 96 89 70 65 100 66 71 55 60 29 15 97 91 70 80
Figura 2.9: Gr´afico de Barras a partir de uma tabela - invers˜ao . > barplot(t(sex.t)) F M 0 20 40 60 80
Um simples histograma pode ser gerado da seguinte maneira:
O n´umero de classes pode ser alterado com o comando breaks. Nesse caso s˜ao aceitos um simples n´umero indicando quantas classes devem ser formadas. Inter- namente, h´a uma fun¸c˜ao de tolerˆancia que pode n˜ao responder ao valor informado. Dependendo da configura¸c˜ao dos dados,o R, automaticamente, faz um ajuste dife- rente do solicitado.
Veja alguns exemplos
As classes podem ser explicitamente definidas pelo usu´ario de v´arias maneiras:
> hist(x, br = c(0, 15, 30, 45, 60, 75, 90, max(x))) > hist(x, br = seq(0, 100, len = 8))
Figura 2.10: Gr´afico de Barras a partir de uma tabela - legenda. > barplot(sex.t, beside = TRUE, legend.text = rownames(sex.t),
+ col = c("white", "gray"))
apto inapto F M 0 10 20 30 40 50 60 70 > hist(x, br = c(0, 10, 35, 45, 60, 70, 90, max(x)))
O argumento right=TRUE, indica que o intervalo de classe ´e definido da forma (a,b], ou seja, aberto `a esquerda e fechado `a direita.
O argumento include.lowest=TRUE indica como o R trata das observa¸c˜oes que est˜ao nos extremos dos dados. Esse argumento ´e dependente da op¸c˜ao breaks e rigth.
O n´umero de classes ´e importante na constru¸c˜ao do histograma, pois isso afeta a forma do gr´afico e por sua vez, a maneira como os dados ou informa¸c˜oes ser˜ao interpretadas.
Na fun¸c˜ao hist()o m´etodo de Sturges ´e o padr˜ao. Esse m´etodo define o n´umero de classes, k, atrav´es da seguinte express˜ao k = 1 + log2(n). Outra op¸c˜ao
Figura 2.11: Gr´afico de Barras a partir de uma ’matriz’.