• Nenhum resultado encontrado

no primeiro caso, essa base ´e a porcentagem de eleitores favor´aveis ao candidato antes da propaganda (14%) e no segundo caso ´e o total (n˜ao especificado) de eleitores avaliados na amostra (favor´aveis ou n˜ao ao candidato).

Uma porcentagem n˜ao pode diminuir mais do que 100%. Se o pre¸co de um determinado produto decresce de R$3,60 para R$1,20, a dimi-nui¸c˜ao de pre¸co ´e de 67% [= 100 x (3,60 - 1,20)/3,60] e n˜ao de 200%

[= 100 x (3,60 - 1,20)/1,20]. Aqui tamb´em, o importante ´e definir a base: a ideia ´e comparar a varia¸c˜ao de pre¸co (R$ 2,40) com o pre¸co inicial do produto (R$3,60) e n˜ao com o pre¸co final (R$1,20). Na si-tua¸c˜ao limite, em que o produto ´e oferecido gratuitamente, a varia¸c˜ao de pre¸co ´e de R$3,60; consequentemente, a diminui¸c˜ao de pre¸co limite

´e de 100%. Note que se estiv´essemos diante de um aumento de pre¸co de R$ 1,20 para R$3,60, dir´ıamos que o aumento foi de 200% [= 100 x (3,60 - 1,20)/1,20)].

Sheet1

Page 1

Figura 2.5: Tabela comparativa das notas m´edias da avalia¸c˜ao das subpre-feituras no modelo padronizado para a escala [0,1]

3) Utilize as sugest˜oes para constru¸c˜ao de planilhas apresentadas na Se¸c˜ao 2.2 com a finalidade de preparar os dados dos diferentes conjuntos do arquivo MorettinSingerDados.xls para an´alise estat´ıstica.

4) A Figura 2.6 cont´em uma planilha encaminhada pelos investigado-res investigado-respons´aveis por um estudo sobre AIDS para an´alise estat´ıstica.

Organize-a de forma a permitir sua an´alise por meio de um pacote computacional como o R.

Grupo I Tempo de Ganho de Peso registro Diagn´ostico DST MAC por Semana

2847111D pr´e natal ao P´ılula 11Kg em 37 semanas

3034048F 6 meses ao p´ılula ?

3244701J 1 ano ao Condon ?

2943791B pr´e natal ao ao 8 Kg em 39 semanas

3000327F 4 anos condiloma/ s´ıfilis ao 9Kg em 39 semanas

3232893D 1 ano ao DIU 3Kg em 39 semanas

3028772E 3 anos ao ao 3 kg em 38 semanas

3240047G pr´e natal ao p´ılula 9 Kg em 38 semanas

3017222G HPV CONDON falta exame cl´ınico

3015834J 2 anos ao condon 14 Kg em 40 semanas

Grupo II Tempo de Ganho de Peso

registro Diagn´ostico DST MAC por Semana 3173611E 3 meses abscesso ovariano condon 15 Kg em 40 semanas

3296159D pr´e natal ao condon 0 Kg em ? semanas

3147820D1 2 anos ao sem dados 4 Kg em 37 semanas

3274750K 3 anos ao condon 8 Kg em 38 semanas

3274447H pr´e natal sif´ılis com 3 meses condon

2960066D 5 anos ao ? 13 Kg em 36 semanas

3235727J 7 anos ao Condon (-) 2 Kg em 38 semanas

3264897E condiloma condon nenhum Kg

3044120J 5 anos HPV 3 Kg em 39 semanas 1

Figura 2.6: Planilha com dados de um estudo sobre AIDS.

5) Num estudo planejado para avaliar o consumo m´edio de combust´ıvel de ve´ıculos em diferentes velocidades foram utilizados 4 autom´oveis da marca A e 3 autom´oveis da marca B selecionados ao acaso das respectivas linhas de produ¸c˜ao. O consumo (em L/km) de cada um dos 7 autom´oveis foi observado em 3 velocidades diferentes (40 km/h, 80 km/h e 110 km/h). Construa uma planilha apropriada para a coleta e an´alise estat´ıstica dos dados, rotulando-a adequadamente.

6) A planilha apresentada na Figura 2.7 cont´em dados de um estudo em que o limiar auditivo foi avaliado nas orelhas direita (OD) e es-querda (OE) de 13 pacientes em 3 ocasi˜oes (Limiar, Teste 1 e Teste 2). Reformate-a segundo as recomenda¸c˜oes da Se¸c˜ao 2.3.

7) Preencha a ficha de inscri¸c˜ao do Centro de Estat´ıstica Aplicada (www.

ime.usp.br/~cea) com as informa¸c˜oes de um estudo em que vocˆe est´a envolvido.

Limiar Teste1 Teste2

OD 50 / OE 55 OD/OE 50 OD/OE 80%

OD 41 /OE 40 OD 45/OE 50 OD 68% OE 80%

OD/OE 41,25 OD/OE 45 OD 64% OE 72%

OD 45/OE 43,75 OD 60/OE 50 OD 76%/OE 88%

OD51,25/ OE47,5 OD/OE 50 OD 80%/OE 88%

OD45/ OE 52,5 OD/OE 50 OD 84%/OE 96%

OD 52,5/OE 50 OD55/OE45 OD 40%/OE 28%

OD 42,15/0E48,75 OD 40/OE 50 OD80%/OE76%

OD50/ OE 48,75 OD/OE 50 OD 72%/OE 80%

OD47,5/OE46,25 OD/OE 50 OD/OE 84%

OD55/OE 56,25 OD55/OE60 OD80%/OE 84%

OD/OE 46,25 OD40/OE35 OD72%/OE 84%

OD 50/OE 47,5 OD/OE45 OD/OE 76%

Figura 2.7: Limiar auditivo de pacientes observados em 3 ocasi˜oes.

An´ alise de dados de uma vari´ avel

Vocˆe pode, certamente, ter um entendimento profundo da natu-reza por meio de medidas quantitativas, mas vocˆe deve saber do que est´a falando antes que comece a usar os n´umeros para fazer previs˜oes.

Lewis Thomas

3.1 Introdu¸ c˜ ao

Neste cap´ıtulo consideraremos a an´alise descritiva de dados provenientes da observa¸c˜ao de uma vari´avel. As t´ecnicas utilizadas podem ser empregadas tanto para dados provenientes de uma popula¸c˜ao quanto para dados oriundos de uma amostra.

A ideia de uma an´alise descritiva de dados ´e tentar responder as seguintes quest˜oes:

i) qual a frequˆencia com que cada valor (ou intervalo de valores) aparece no conjunto de dados ou seja, qual a distribui¸c˜ao de frequˆencias dos dados?

ii) quais s˜ao alguns valores t´ıpicos do conjunto de dados, como m´ınimo e m´aximo?

iii) qual seria um valor para representar a posi¸c˜ao (ou localiza¸c˜ao) central do conjunto de dados?

iv) qual seria uma medida da variabilidade ou dispers˜ao dos dados?

v) existem valores at´ıpicos ou discrepantes (outliers) no conjunto de da-dos?

vi) os dados podem ser considerados sim´etricos?

Nesse contexto, um dos objetivos da an´alise descritiva ´e organizar e exibir os dados de maneira apropriada e para isso utilizamos

i) gr´aficos e tabelas;

ii) medidas para resumo de dados.

As t´ecnicas empregadas na an´alise descritiva dependem do tipo de vari´aveis que comp˜oem o conjunto de dados em quest˜ao. Uma poss´ıvel classifica¸c˜ao de vari´aveis est´a representada na Figura 3.1.

Vari´aveis qualitativas

Nominais (classifica¸c˜ao)

sexo, ra¸ca, grupo sangu´ıneo

Ordinais (classifica¸c˜ao)

press˜ao arterial (baixa, m´edia, alta)

Vari´aveis quantitativas

Discretas (contagem)

numero de acidentes, filhos

Cont´ınuas (mensura¸c˜ao)

peso, altura, taxa de colesterol

1

Figura 3.1: Classifica¸c˜ao de vari´aveis.

Vari´aveis qualitativas s˜ao aquelas que indicam um atributo (n˜ao num´erico) da unidade de investiga¸c˜ao (sexo, por exemplo). Elas podem ser ordinais, quando h´a uma ordem nas diferentes categorias do atributo (tamanho de uma escola: pequena, m´edia ou grande, por exemplo) ou nominais, quando n˜ao h´a essa ordem (regi˜ao em que est´a localizada uma empresa: norte, sul, leste ou oeste, por exemplo).

Vari´aveis quantitativas s˜ao aquelas que exibem valores num´ericos asso-ciados `a unidade de investiga¸c˜ao (peso, por exemplo). Elas podem ser dis-cretas, quando assumem valores no conjunto dos n´umeros naturais (n´umero de gesta¸c˜oes de uma paciente) ou cont´ınuas, quando assumem valores no conjunto dos n´umeros reais (tempo gasto por um atleta para percorrer 100 m, por exemplo). Ver Nota de Cap´ıtulo 1.

No documento Introdu¸c˜ao `a Ciˆencia de Dados (páginas 44-50)