• Nenhum resultado encontrado

Introdução à Estatística- Séries Estatísticas Intervalos de Classe 1 Prof. Antonio Sales - para uso exclusivo em sala de aula, 2013

N/A
N/A
Protected

Academic year: 2021

Share "Introdução à Estatística- Séries Estatísticas Intervalos de Classe 1 Prof. Antonio Sales - para uso exclusivo em sala de aula, 2013"

Copied!
10
0
0

Texto

(1)

Introdução à Estatística- Séries Estatísticas Intervalos de Classe1 Prof. Antonio Sales - para uso exclusivo em sala de aula, 2013

Quando temos um número elevado de dados é possível fazer uma redução organizando esses dados em intervalos de classe, como veremos a seguir:

Suponha que numa amostra de 60 acadêmicos tenhamos as seguintes idades, já organizadas: 17,17,17,18,18,18,18,18,19,19,19,19,21,21,21,21,22,22,22,22,23,24,24,24,24,24,25,25,26,2 6,26,27,27,28, 28,28,28,29,29,29,29,33,33,33,33,33,34,34,35,36,37,37,37,38,39, 39, 39,39, 40, 40.

Teríamos as seguintes classes e frequências:

i xi fi Fi 1 17 3 2 18 5 3 4 4 4 21 4 5 22 4 6 23 1 7 24 5 8 25 2 9 26 3 10 27 2 11 28 4 12 29 4 13 33 5 14 34 2 15 35 1 16 36 1 17 37 3 18 38 1 19 39 4 20 40 2 ∑ 60

1

(2)

Esses dados podem ser agrupados em intervalos de classe de amplitude 4 como segue: i Idades fi xi 1 17|---21 12 19 2 21|---25 14 23 3 25|---29 11 27 4 29|---33 4 31 5 33|---37 9 35 6 37|---41 10 39 ∑ 60

(3)

Questionamentos:

1. Como foram obtidos os xi? 2. Como foram obtidos os fi?

3. A idade de 21 anos foi contada na classe 1 ou na classe 2? E a 33?

4. As idades de 17 a 21 anos foram agrupadas em uma classe. Qual o limite inferior dessa classe? Qual o limite superior dessa classe?

5. Qual o limite inferior da classe 6? Qual o limite superior da classe 6? 6. Por que o 41 foi “incluído” ? Ele fará diferença na soma das frequências? 7. Dizemos que, nesse caso, cada classe tem amplitude 4. Por que?

8. Qual seria a amplitude total dessa sequência? 9. Qual a amplitude amostral?

10. Qual seria o limite mínimo dessa sequência? 11. Qual o limite máximo da sequência?

12. Como se faz para calcular a média das idades, nesse caso? Numa distribuição de frequência com intervalos de classes temos: Limite inferior da classe: (i) que é o menor valor de cada classe Limite superior da classe: (Li) que é o maior valor de cada classe.

O ponto médio da cada classe (xi) que representa a classe é obtido fazendo-se a média aritmética entre o limite superior e o limite inferior de cada classe (

2

i Li xi  ) Amplitude da classe: hi=Li-i

O limite superior não é computado na classe em que aparece, isto é, a frequência desse elemento é incluída na classe onde ele é limite inferior. Observe que o limite superior de uma classe é o limite inferior da classe seguinte.

Numa distribuição de frequência (tabela) temos a chamada amplitude total (AT) que é obtida fazendo-se, L(máx)- (mín), se a distribuição estiver organizada em intervalos de classe (os dados estiverem agrupados), ou simplesmente subtraindo o menor valor do maior valor da sequência, se a distribuição estiver sem intervalo de classe (os dados não estiverem agrupados).

A média, quando os dados estão organizados em intervalo de classe, é obtida da forma como já foi vista anteriormente, fazendo

n fixi

, onde xi é a média entre Li e i e n=

fi

. Resumindo alguns símbolos e definições:

Limite inferior da classe: i Limite superior da classe: Li Amplitude da classe: hí=Li-i

Amplitude Total: AT= L(máx)- (mín), isto é, o limite inferior da primeira classe é subtraído do limite superior da última classe. No exemplo dado, temos: AT = 41-17 = 24

Amplitude Amostral: AA. Do maior valor subtrai-se o menor valor da sequência. No exemplo dado: 40-17 = 23

(4)

Exercícios:

1. Organize as sequências abaixo em intervalos de classe conforme indicado e determine xi, fi, fri, Fi, Fri, fixi e a média de cada uma delas.

a) 1,1,1,2,2,3,3,3,4,4,4,4,4,4,5,5,5,5,6,6,7,7,8,9,9,10,10,11,12 com h=3 b) 12, 14, 15, 16, 16, 17, 18, 18, 18, 19, 19, 19, 20, 20, 20, 21, 22, 24, 24, 24, 25, 26, 27, 27, 28, 30, 30, 30,30 com h=4 c) 1,0; 1,0; 1,2; 1,3; 1,5; 1,8; 2,0; 2,0; 2,0; 2,2; 2,4; 2,5; 2,6; 3,0; 3,5; 3,6; 3,9; 4,1; 4,2; 4,2; 4,6; 4,6; 4,7; 4,8 com h=1 d) 130, 137, 137, 140, 140, 145, 146, 149, 155, 160, 160, 163, 166, 167, 168, 170, 172, 173, 174, 175, 177, 180, 181, 187 com h=10

Conforme foi visto, uma distribuição de frequência (tabela) pode ser organizada com dados agrupados em intervalo de classe. É uma forma de reduzir o número de dados e reduzir o número de operações necessárias.

Os critérios para agrupar os dados de uma sequência estatística não estão devidamente padronizados. Alguns autores deixam a critério do pesquisador2 , outros, no entanto são mais exigentes e sugerem que se faça i  n e h=

i

AA

onde i é o número de classes, n é o número total de dados ou o somatório das frequências (

fi

), AA é amplitude amostral e h é o intervalo de classe. Outros recomendam o método de Sturges que faz i  1+3,3logn e não difere muito do critério da raiz quadrada.

Dessa forma, sugerimos que quando uma sequência de dados estatísticos é tal que seja possível fazer uma distribuição de frequência (tabela) com, aproximadamente, até dez classes pode não ser necessário utilizar o recurso de intervalos de classes. A menos que se queria agrupar por faixa etária, por exemplo, não há necessidade de se trabalhar com intervalos quando o número de classes não exceder a dez. Recomenda-se também que o número não ultrapasse a 20 classes e nem seja menor do que 5.

Há circunstâncias, porém, que se torna imperioso fazer agrupamento dos dados em intervalo de classe, seja pela quantidade deles seja pela forma como aparecem (forma decimal, por exemplo). As variáveis quantitativa contínuas devem ser trabalhadas com intervalo de classe.

Exemplificando:

No exemplo inicial que foi organizado arbitrariamente em 6 classes, se tivéssemos seguida essas regras poderia ter um número de classes diferente.

Vejamos pela regra da raiz quadrada: i = 60 7,748. Teria 8 classes e, fazendo,

3 8 , 2 8 23 8    AA tem-se h=3.

Os dados devem ser agrupados em intervalos de classe de amplitude 8 como segue:

i Idades xi fi fixi Fi fri Fri

1 17 I --- 20 2 20 I --- 23 3 23 I--- 26 4 26 I--- 29 5 29 I--- 32 6 32 I--- 35

2

SPINELLI, Walter, SOUZA, M. H.S.de. Introdução à estatística. São Paulo: Ática, 1990,p. 28. Se o objetivo de se agrupar por intervalo de classe é a facilidade para trabalhar os dados ou para comunicar os resultados, ninguém melhor do que quem tem a responsabilidade de trabalhar esses dados para escolher o número de classes e a amplitude de cada uma.

(5)

7 35 I--- 38 8 38 I--- 41

Deixamos a cargo do leitor preencher as demais colunas.

E pela regra de Sturges? É necessário que se saiba qual o logaritmo decimal de 60 que é facilmente encontrado em tábuas de logaritmos ou nas calculadoras científicas. Tomo uma calculadora científica e digito 60log. Ela me fornece o seguinte valor: 1,778 que é arredondado para 1,8.

Seguindo a regra: i  1+3,3log60i 1+3,3 x 1,8  i 1+5,94 i 6,947

A regra de Sturges determina que a sequência deve ter 7 classes O intervalo de classe é

h= 3,28 3

7 23

7   

AA

e a distribuição ficaria igual à anterior, feita pela regra da raiz quadrada.

Como se pode ver, nenhuma dessas regras possui rigor absoluto. É permitido arredondamentos e aproximações. Nesse último caso o número de classes não parou em 7. Foram necessárias 8 classes.

Alguns exercícios:

2. Determinar a amplitude total das sequências abaixo: a) 3,3,3,3,3,4,4,4,4

b) 2,3,5,6,15,18,25,33 c) 2,3,4,5,6,7

d) 11,15,19,23,27,31

Em qual delas os dados estão mais dispersos (há maior dispersão)? Em qual delas há menor dispersão?

Crie uma sequência de dispersão zero. DESVIO EM RELAÇÃO À MÉDIA

É a diferença entre cada valor do conjunto de valores ou sequência e a média

(

)

_

x

xi

di

.

Essa diferença pode ser positiva, negativa ou nula.

Quando será positiva? Quando será negativa? Quando será nula?

Os valores abaixo da média terão a diferença em relação à média, positiva, nula ou negativa?

Convém observar que a soma de todas as diferenças em relação à média é nula.

k i

di

x

xi

1 _

0

0

)

(

.Verifique isso nas sequências abaixo:

a) 2, 4, 4, 10 b) 1, 2, 4, 4, 9 c) 10, 11, 12, 15

d) 15, 15, 20, 25, 25, 35, 45, 60

GRÁFICOS E SERIES ESTATÍSTICAS

Segundo Crespo (1996, p.26) “série estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie”.

Podemos então dizer que o seguinte quadro, adaptado da revista veja, é uma série estatística, porque temos ali a espécie e a época.

(6)

Redução de Taxas de Colestrol na Clínica Colesterina, Campo Grande , MS, 2004

1 1 3 2 5 2 1 1 1 3 7 1 0 1 2 3 4 5 6 7 8

O35 O36 O38 O39 O40 O41 O42 O44 O45 O46 O47 O48

T a xa s N º d e P a c ie n te s Correspondências da semana 1-8/09/2004 Espécie Quantidade E-mails 1948 Cartas 55 fax 29 Total 2032 Fonte: Veja 8/9/2004

Com relação ao gráfico admitimos que todos já tenham uma idéia do que seja. O conceito de gráfico parece ser de domínio público tendo em vista o seu largo uso. Destacamos aqui, de Crespo (1996, p.38), três requisitos que devem ser levados em conta ao construir um gráfico.

a) Simplicidade: devem ser evitados os traços desnecessários que possam desviar atenção do observador.

b) Clareza: deve possibilitar uma correta interpretação do fenômeno c) Veracidade: deve expressar a verdade.

Há muitos tipos de gráficos e cabe ao pesquisador escolher o que melhor lhe agrada ou melhor representa o seu trabalho.

Tipos de gráficos: 1. Diagramas:

Gráfico em linha ou em curva Gráfico em colunas ou em barras

Gráfico em setores (conhecido como pizza)

Exemplo de gráfico de colunas e da tabela que o gerou

Redução da Taxa de Colesterol na Clínica Colesterina, Campo Grande, 2004

Fonte: Arquivos da Clínica

Fonte: Arquivos da Clínica)

Outro exemplo usando frequência relativa Taxas Nº de Pacientes 35 1 36 1 38 3 39 2 40 5 41 2 42 1 44 1 45 1 46 3 47 7 48 1

(7)

Cabeçalho

Ida de , e m a no s , da s c ria nç a s c o ns ult a da s no pla nt ã o de 2 5 / 0 5 / 2 0 0 4 no P o s t o X e re s pe c t iv a po rc e nt a ge m . O5; 20% O7; 16% O8; 12% O9; 40% O10; 8% O12; 4% Idade, em anos, das crianças

atendidas no plantão de 25/05/204, no Posto X. Idade Porcentagem 5 20 7 16 9 12 8 40 10 8 12 4

Fonte: Arquivos do Posto

Fonte: Arquivos do Posto

2.Cartogramas: em forma de mapas 3.Pictogramas

Procure em livros de Estatística exemplos dos gráficos indicados acima. Qual a diferença entre um gráfico de barras e um gráfico em colunas?

O gráfico em setores é apropriado, quando se tem muitos dados para registrar?

Qual o símbolo apropriado para que um dentista faça um pictograma de uma sequência de dentes tratados? E para um enfermeiro que trabalha num setor de pediatria?

Quais os gráficos mais usados? Por que? Como fazer um gráfico usando o Excel

1. Construir a série estatística ou uma planilha (tabela) com os dados que se quer colocar no gráfico.

2. Selecionar as colunas que serão transferidas para o gráfico 3. Clicar no menu, em inserir gráficos.

4. Escolher o tipo de gráfico

5. Seguir as instruções que aparecerem na tela e ir selecionando as opções apropriadas. Tanto o gráfico quanto a tabela (ou série) que lhe der origem devem possuir título e fonte. O título deve ser redigido de tal forma que responda a três perguntas básicas: O QUE? QUANDO? ONDE?

A tabela ou quadro, além do titulo e fonte deve possuir também o cabeçalho. O que é cabeçalho? Consulte Crespo (1996) para responder essa pergunta.

Sugestão: Veja no mesmo autor indicado acima outras informações sobre séries estatísticas, tabelas e gráficos.

Obs. Os livros de metodologia científica distinguem tabela de quadro. Segundo Araújo (2002), pelas normas da ABNT o que estamos chamando de tabela deve ser denominado de quadro. Tabela, segundo a ABNT, não possui linhas laterais. Dessa forma, o primeiro exemplo abaixo é um quadro e o segundo é uma tabela:

1. Quadro

Correspondências da semana ( Título ) 1-8/09/2004

Espécie Quantidade E-mails 1948

(8)

Cabeçalho

Cartas 55 Fax 29 Total 2032 Fonte: Veja 8/9/2004 2. Tabela

Correspondências da semana ( Título ) 1-8/09/2004 Espécie Quantidade E-mail 1948 Cartas 55 Fax 29 Total 2032 Fonte: Veja 8/9/2004

Obs. As linhas internas são optativas.

MEDIDAS DE TENDÊNCIA CENTRAL EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE.

O cálculo da média é o que menos sofre com a distribuição de frequência em intervalos de classe. Determina-se a média aritmética ponderada utilizando o xi ( ponto médio de cada classe) e a frequência simples, como nos casos em que não há intervalos de classe.

O cálculo da mediana será visto no capítulo sobre separatrizes e, ver-se-á que, sofre uma mudança significativa no processo.

A MODA EM DISTRIBUIÇÃO DE FREQUÊNCIA COM INTERVALOS DE CLASSE. Seja a distribuição de frequência abaixo:

i Idades xi fi Fi 1 5 I--- 10 7,5 6 6 2 10 I--- 15 12,5 8 14 3 15 I--- 20 17,5 3 17 4 20 I--- 25 22,5 5 22 5 25 I--- 30 27,5 5 27 n=27

Qual será a idade considerada como moda? De imediato é possível constatar que a moda está na classe 2, isto é, a 2ª classe é a classe modal.

Para determinar a moda há alguns métodos. Um deles, o mais simples, propõe que se considere xi ou o valor médio da classe como a moda (

2

* *

L

Mo

), onde

*

e

L

* são o limite inferior e limite superior da classe modal, respectivamente. É conhecida como moda bruta.

Por esse método a moda da distribuição acima seria 12,5. Há um processo mais elaborado,

conhecido como fórmula de Czuber, onde * * *

* *

.

)]

(

(

))

(

[(

)

(

h

post

f

f

ant

f

f

ant

f

f

Mo

,

Czuber deduziu a sua fórmula partindo do pressuposto de que a moda divide o intervalo da classe modal em distâncias proporcionais às diferenças entre as frequências da classe modal com as frequências das classes contíguas.

(9)

onde

*, f* e h* são limite inferior, frequência simples e amplitude de classe, da classe modal, respectivamente. Enquanto f(ant) e f(post) são as frequências simples das classes anterior e posterior à classe modal.

No exemplo dado, tem-se que *=10, f*=8, h*=5, f(ant)=6 e f(post)=3. Aplicando a fórmula de Czuber:

5

)]

3

8

(

)

6

8

[(

6

8

10

x

Mo

5

]

5

2

[

2

10

x

Mo

  5 7 2 10 x Mo   10 0,3x5 Mo 10+1,5=11,5

No entanto, considerando que, como diz Barbosa(s.d) , a moda é uma medida pouco usada, resultando ser de pouco interesse saber se ela é um determinado número ou outro próximo a ele, adotaremos, em nossos trabalhos, o uso da moda bruta.

Referências

ARAÚJO, Carla B. Z.; DAL MORO, Ederly L.; FIGUEIRA, Kátia C.N. Trabalhos

Monográficos: normas técnicas e padrões. Campo Grande, MS: Editora da UNIDERP, 2002.

BARBOSA, Ruy Madsen. Estatística Elementar: estatística descritiva. 6.ed. São Paulo: Nobel, s.d., p.101.

CRESPO, Antonio Arnot. Estatística Fácil. 18.ed. São Paulo: Saraiva, 2005 Outras fontes de consulta

NAZARETH, Helenalda Resende de Souza. Curso básico de estatística. 12. ed. São Paulo: Ática, 2003.

TEIXEIRA, Daniel Mandim. Estatística Descomplicada.3.ed. Brasília,DF:VEST-COM, 1995.

Respostas:

1. a)Obs. As tabelas foram feita nas horizontal para economia de espaço.

Para o trabalho é mais prático faze-las na vertical. Para determinar as frequência relativa basta que cada fi ou Fi seja dividida por n=

fi

e fazer os devidos arredondamentos. A média é obtida fazendo

n fixi

a) b)

Classes 1 2 3 4 1 I---4 4 I----7 7 I----10 10 I--- 13 xi 2,5 5,5 8,5 11,5 fi 8 12 5 4 Fi 8 20 25 29 fixi 20 66 42,5 46 c) d) Classes 1 2 3 4 5 12 I --- 16 16 I--- 20 20 I---24 24I--- 28 28 I---32 xi 14 18 22 26 30

fi 3 9 5 7 5

Fi 3 12 17 24 29 fixi 42 162 110 182 150

Classes 1 2 3 4 1I--- 2 2 I--- 3 3 I--- 4 4I--- 5 xi 1,5 2,5 3,5 4,5 fi 6 7 4 7 Fi 6 13 17 24 fixi 9 17,5 14 31,5

Classes 1 2 3 4 5 6 

130 I--- 140 140 I---150 150 I--- 160 160 I---170 170 I--- 180 180 I--- 190 xi 135 145 155 165 175 185

(10)

Média= 7 , 161 ... 66 , 161 24 3880

2. Como os dados não estão organizados em intervalos de classe basta que se determine AA: a)1 b) 31 c) 5 d) 20

fi 3 5 1 6 6 3 24

Fi 3 8 9 15 21 24

Referências

Documentos relacionados

[r]

A Vector Network Analyser is used to generate the transmitted signal and to collect the received signals, being both in the frequency range of 100 MHz to 3 GHz.. Figure 3.4:

Assim como a Intemet, a Intranet também tem seu papel fundamental nas organizações parao gerenciamento dos sistemas empresariais. Em verdade a intranet é o

Em estudos mais aprofundados, tem-se a análise dinâmica não linear geométrica de estruturas laminadas modeladas com elementos tridimensionais de barra considerando o efeito

O pagamento deverá ser efetuado no setor financeiro da Escola, no prazo de 48h antes da realização da prova de Recuperação Paralela impreterivelmente, para melhor planejamento

Os roedores (Rattus norvergicus, Rattus rattus e Mus musculus) são os principais responsáveis pela contaminação do ambiente por leptospiras, pois são portadores

A irradiação de alimentos possui inúmeras vantagens, dentre elas podemos elencar: o processo é a frio; os raios gama tem alto poder de penetração; ocorre um

5.13 Para a 3ª Etapa – Entrevista, serão convocados os 3 (três) candidatos com maior pontuação, para cada vaga, ou todos se em menor número, e desde que não eliminados, que