no primeiro caso, essa base ´e a porcentagem de eleitores favor´aveis ao candidato antes da propaganda (14%) e no segundo caso ´e o total (n˜ao especificado) de eleitores avaliados na amostra (favor´aveis ou n˜ao ao candidato).
Uma porcentagem n˜ao pode diminuir mais do que 100%. Se o pre¸co de um determinado produto decresce de R$3,60 para R$1,20, a dimi-nui¸c˜ao de pre¸co ´e de 67% [= 100 x (3,60 - 1,20)/3,60] e n˜ao de 200%
[= 100 x (3,60 - 1,20)/1,20]. Aqui tamb´em, o importante ´e definir a base: a ideia ´e comparar a varia¸c˜ao de pre¸co (R$ 2,40) com o pre¸co inicial do produto (R$3,60) e n˜ao com o pre¸co final (R$1,20). Na si-tua¸c˜ao limite, em que o produto ´e oferecido gratuitamente, a varia¸c˜ao de pre¸co ´e de R$3,60; consequentemente, a diminui¸c˜ao de pre¸co limite
´e de 100%. Note que se estiv´essemos diante de um aumento de pre¸co de R$ 1,20 para R$3,60, dir´ıamos que o aumento foi de 200% [= 100 x (3,60 - 1,20)/1,20)].
Sheet1
Page 1
Figura 2.5: Tabela comparativa das notas m´edias da avalia¸c˜ao das subpre-feituras no modelo padronizado para a escala [0,1]
3) Utilize as sugest˜oes para constru¸c˜ao de planilhas apresentadas na Se¸c˜ao 2.2 com a finalidade de preparar os dados dos diferentes conjuntos do arquivo MorettinSingerDados.xls para an´alise estat´ıstica.
4) A Figura 2.6 cont´em uma planilha encaminhada pelos investigado-res investigado-respons´aveis por um estudo sobre AIDS para an´alise estat´ıstica.
Organize-a de forma a permitir sua an´alise por meio de um pacote computacional como o R.
Grupo I Tempo de Ganho de Peso registro Diagn´ostico DST MAC por Semana
2847111D pr´e natal n˜ao P´ılula 11Kg em 37 semanas
3034048F 6 meses n˜ao p´ılula ?
3244701J 1 ano n˜ao Condon ?
2943791B pr´e natal n˜ao n˜ao 8 Kg em 39 semanas
3000327F 4 anos condiloma/ s´ıfilis n˜ao 9Kg em 39 semanas
3232893D 1 ano n˜ao DIU 3Kg em 39 semanas
3028772E 3 anos n˜ao n˜ao 3 kg em 38 semanas
3240047G pr´e natal n˜ao p´ılula 9 Kg em 38 semanas
3017222G HPV CONDON falta exame cl´ınico
3015834J 2 anos n˜ao condon 14 Kg em 40 semanas
Grupo II Tempo de Ganho de Peso
registro Diagn´ostico DST MAC por Semana 3173611E 3 meses abscesso ovariano condon 15 Kg em 40 semanas
3296159D pr´e natal n˜ao condon 0 Kg em ? semanas
3147820D1 2 anos n˜ao sem dados 4 Kg em 37 semanas
3274750K 3 anos n˜ao condon 8 Kg em 38 semanas
3274447H pr´e natal sif´ılis com 3 meses condon
2960066D 5 anos n˜ao ? 13 Kg em 36 semanas
3235727J 7 anos n˜ao Condon (-) 2 Kg em 38 semanas
3264897E condiloma condon nenhum Kg
3044120J 5 anos HPV 3 Kg em 39 semanas 1
Figura 2.6: Planilha com dados de um estudo sobre AIDS.
5) Num estudo planejado para avaliar o consumo m´edio de combust´ıvel de ve´ıculos em diferentes velocidades foram utilizados 4 autom´oveis da marca A e 3 autom´oveis da marca B selecionados ao acaso das respectivas linhas de produ¸c˜ao. O consumo (em L/km) de cada um dos 7 autom´oveis foi observado em 3 velocidades diferentes (40 km/h, 80 km/h e 110 km/h). Construa uma planilha apropriada para a coleta e an´alise estat´ıstica dos dados, rotulando-a adequadamente.
6) A planilha apresentada na Figura 2.7 cont´em dados de um estudo em que o limiar auditivo foi avaliado nas orelhas direita (OD) e es-querda (OE) de 13 pacientes em 3 ocasi˜oes (Limiar, Teste 1 e Teste 2). Reformate-a segundo as recomenda¸c˜oes da Se¸c˜ao 2.3.
7) Preencha a ficha de inscri¸c˜ao do Centro de Estat´ıstica Aplicada (www.
ime.usp.br/~cea) com as informa¸c˜oes de um estudo em que vocˆe est´a envolvido.
Limiar Teste1 Teste2
OD 50 / OE 55 OD/OE 50 OD/OE 80%
OD 41 /OE 40 OD 45/OE 50 OD 68% OE 80%
OD/OE 41,25 OD/OE 45 OD 64% OE 72%
OD 45/OE 43,75 OD 60/OE 50 OD 76%/OE 88%
OD51,25/ OE47,5 OD/OE 50 OD 80%/OE 88%
OD45/ OE 52,5 OD/OE 50 OD 84%/OE 96%
OD 52,5/OE 50 OD55/OE45 OD 40%/OE 28%
OD 42,15/0E48,75 OD 40/OE 50 OD80%/OE76%
OD50/ OE 48,75 OD/OE 50 OD 72%/OE 80%
OD47,5/OE46,25 OD/OE 50 OD/OE 84%
OD55/OE 56,25 OD55/OE60 OD80%/OE 84%
OD/OE 46,25 OD40/OE35 OD72%/OE 84%
OD 50/OE 47,5 OD/OE45 OD/OE 76%
Figura 2.7: Limiar auditivo de pacientes observados em 3 ocasi˜oes.
An´ alise de dados de uma vari´ avel
Vocˆe pode, certamente, ter um entendimento profundo da natu-reza por meio de medidas quantitativas, mas vocˆe deve saber do que est´a falando antes que comece a usar os n´umeros para fazer previs˜oes.
Lewis Thomas
3.1 Introdu¸ c˜ ao
Neste cap´ıtulo consideraremos a an´alise descritiva de dados provenientes da observa¸c˜ao de uma vari´avel. As t´ecnicas utilizadas podem ser empregadas tanto para dados provenientes de uma popula¸c˜ao quanto para dados oriundos de uma amostra.
A ideia de uma an´alise descritiva de dados ´e tentar responder as seguintes quest˜oes:
i) qual a frequˆencia com que cada valor (ou intervalo de valores) aparece no conjunto de dados ou seja, qual a distribui¸c˜ao de frequˆencias dos dados?
ii) quais s˜ao alguns valores t´ıpicos do conjunto de dados, como m´ınimo e m´aximo?
iii) qual seria um valor para representar a posi¸c˜ao (ou localiza¸c˜ao) central do conjunto de dados?
iv) qual seria uma medida da variabilidade ou dispers˜ao dos dados?
v) existem valores at´ıpicos ou discrepantes (outliers) no conjunto de da-dos?
vi) os dados podem ser considerados sim´etricos?
Nesse contexto, um dos objetivos da an´alise descritiva ´e organizar e exibir os dados de maneira apropriada e para isso utilizamos
i) gr´aficos e tabelas;
ii) medidas para resumo de dados.
As t´ecnicas empregadas na an´alise descritiva dependem do tipo de vari´aveis que comp˜oem o conjunto de dados em quest˜ao. Uma poss´ıvel classifica¸c˜ao de vari´aveis est´a representada na Figura 3.1.
Vari´aveis qualitativas
Nominais (classifica¸c˜ao)
sexo, ra¸ca, grupo sangu´ıneo
Ordinais (classifica¸c˜ao)
press˜ao arterial (baixa, m´edia, alta)
Vari´aveis quantitativas
Discretas (contagem)
numero de acidentes, filhos
Cont´ınuas (mensura¸c˜ao)
peso, altura, taxa de colesterol
1
Figura 3.1: Classifica¸c˜ao de vari´aveis.
Vari´aveis qualitativas s˜ao aquelas que indicam um atributo (n˜ao num´erico) da unidade de investiga¸c˜ao (sexo, por exemplo). Elas podem ser ordinais, quando h´a uma ordem nas diferentes categorias do atributo (tamanho de uma escola: pequena, m´edia ou grande, por exemplo) ou nominais, quando n˜ao h´a essa ordem (regi˜ao em que est´a localizada uma empresa: norte, sul, leste ou oeste, por exemplo).
Vari´aveis quantitativas s˜ao aquelas que exibem valores num´ericos asso-ciados `a unidade de investiga¸c˜ao (peso, por exemplo). Elas podem ser dis-cretas, quando assumem valores no conjunto dos n´umeros naturais (n´umero de gesta¸c˜oes de uma paciente) ou cont´ınuas, quando assumem valores no conjunto dos n´umeros reais (tempo gasto por um atleta para percorrer 100 m, por exemplo). Ver Nota de Cap´ıtulo 1.