• Nenhum resultado encontrado

Cálculos Estatísticos

N/A
N/A
Protected

Academic year: 2021

Share "Cálculos Estatísticos"

Copied!
16
0
0

Texto

(1)

Cálculos Estatísticos

A palavra “estatística”, de origem latina, significou por muito tempo “ciência dos negócios do Estado”. Os que governavam, sentindo necessidade de informações, organizavam departamentos que tinham a responsabilidade de fazer essas investigações.

As sociedades modernas acumulam grande quantidade de dados numéricos relativos a eventos sociais, econômicos, científicos, esportivos etc. Desse modo notamos que o uso da pesquisa é bastante comum nas várias atividades humanas.

Exemplos:

1º) O índice de analfabetismo no Brasil.

2º) A mortalidade infantil no Nordeste brasileiro.

3º) A porcentagem de crianças vacinadas na última campanha de vacinação.

4º) A pesquisa realizada pelas indústrias, entre os consumidores, para o lançamento de um novo produto.

5º) As pesquisas eleitorais, fornecendo elementos para que os candidatos direcionem suas campanhas.

6º) As pesquisas utilizadas pelas emissoras de TV, mostrando a preferência dos espectadores, para organizar sua programação.

A realização de uma pesquisa envolve muitas etapas como: a escolha da amostra, a coleta e a organização dos dados, o resumo e a apresentação desses dados, e também a interpretação dos resultados para a obtenção de conclusões e tomada de decisões razoáveis. Todas essas etapas são trabalhadas com métodos científicos pela Estatística.

O tratamento estatístico de um conjunto de dados pode envolver dois processos distintos, isto é, a descrição dos dados e o estabelecimento de conclusões sobre a população a partir dos dados obtidos por amostragem. Para tanto, temos:

Estatística Descritiva: utiliza métodos numéricos e gráficos para mostrar os padrões de

comportamento dos dados, para resumir a informação contida nesses dados e para apresentar a informação de forma conveniente.

(2)

ARREDONDAMENTO DE DADOS

De acordo com a Fundação IBGE (Instituto Brasileiro de Geografia e Estatística), o arredondamento é feito da seguinte forma:

a) Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, ou 4, fica inalterado o último algarismo a permanecer.

Exemplo: aproximação de uma casa decimal: 53,24 passa a 53,2.

b) Quando o primeiro algarismo a ser abandonado é 6, 7, 8 ou 9, aumenta-se de uma unidade o algarismo a permanecer.

Exemplos: aproximação de uma casa decimal: 42,87 passa a 42,9 25,08 passa a 25,1

53,99 passa a 54,0

c) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:

• Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer.

Exemplos: aproximação de uma casa decimal: 2,352 passa a 2,4 25,6501 passa a 25,7

76,25002 passa a 76,3

• Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a ser conservado só será aumentado de uma unidade se for ímpar.

Exemplos: aproximação de uma casa decimal: 24,75 passa a 24,8 24,65 passa a 24,6

24,75000 passa a 24,8 24,6500 passa a 24,6

(3)

POPULAÇÃO E AMOSTRA

População: é o conjunto de todos os elementos envolvidos no fenômeno a ser estudado.

Amostra: é o conjunto de elementos retirados da população para a realização do estudo. É,

portanto, um subconjunto da população. Exemplos:

1º) Queremos obter informações sobre a audiência de certo programa de TV, na Grande São Paulo.

População: é o conjunto de todos os domicílios da Grande São Paulo que possuem TV.

Amostra: é o conjunto dos domicílios que serão visitados.

2º) Estudar a procedência dos candidatos a uma certa universidade.

População: conjunto de todos os candidatos à referida universidade. Amostra: conjunto dos candidatos que serão entrevistados.

3º) Queremos fazer um estudo sobre a idade dos alunos do curso de Publicidade e Propaganda de uma determinada universidade.

População: todos os alunos do curso de Publicidade e Propaganda.

Amostra: uma classe do primeiro ano do curso de Publicidade e Propaganda.

Quando são obtidos dados de toda uma população, dizemos que foi feito um recenseamento, e a este conjunto de dados damos o nome de censo.

Quando os dados são obtidos de parte da população, foi feita uma amostragem.

A Escolha da Amostra

Os métodos de escolha da amostra devem garantir a representatividade do grupo. É necessário escolher, no mínimo, 10% do número total dos elementos da população e garantir por meio de um critério de seleção, que nenhum elemento tenha maior chance de ser escolhido do que outro. Desse modo, podemos recorrer a diferentes formas de amostragem: amostragem aleatória simples, amostragem sistemática e amostragem estratificada proporcional.

Vejamos o procedimento através de dois exemplos.

(4)

oitocentas pessoas. Vamos escolher uma amostra com no mínimo oitenta pessoas (10% de 800), selecionadas através de:

a) Amostragem Aleatória Simples: em primeiro lugar, elaboramos uma lista com os oitocentos nomes dos elementos da população numerados de 1 a 800, para serem submetidos a um sorteio. Bolas ou cartões, também numerados de 1 a 800, são colocados em uma urna e bem misturados. Em cada etapa do sorteio, todo número ainda não escolhido tem a mesma probabilidade de ser sorteado.

Esse processo não é muito prático para grandes populações, quando podemos então trabalhar com uma numeração de 0 a 9, sorteando os números por meio de blocos de três algarismos e tomando o cuidado de repor na urna todo algarismo dela retirado. Como temos dez algarismos, cada um deles tem 1/10 de probabilidade de aparecer em determinada posição. Sempre que um bloco de algarismos indicar um elemento já selecionado, ou um elemento que não exista na população, será descartado.

Suponhamos que os seguintes algarismos foram obtidos no sorteio: 2 4 3 5 6 4 7 2 0 0 3 5 8 1 1 0 0 5

1 9 8 6 4 3 5 2 4 7 8 9 7 7 6 5 4 2 2 3 0 1 2 1 1 6 7 8 9 1 0 3 4 5 6 7 2 2 8 8 1 9 0 0 6 0 7 2 1 0 5 6 4 3

Agrupando-os em blocos de três, teremos os números:

243 564 720 035 811 005 198 643 524 789 776 542 230 121 167 891 034 567 228 819 006 072 105 643

Observem que devemos descartar 811, 891 e 819, porque não pertencem à população, e 643 porque já foi selecionado.

Continuamos o sorteio, até completarmos os 80 elementos da amostra.

b) Amostragem Sistemática: sorteamos um número de 1 a 10, ao acaso. Supondo que tenha sido obtido o número 6, ele será o primeiro elemento da amostra e os demais serão determinados em intervalos de dez unidades. Nossa amostra, então, será:

6 16 26 36 46 56 66 76 86 96 106 . . . 796

Este tipo de amostragem é simples de ser realizado e, aconselhável no caso de amostras muito grandes.

(5)

idade. Existem 120 crianças na faixa de 7 anos de idade distribuídas em cinco classes, do seguinte modo: a primeira série A tem 20 alunos com 7 anos, a primeira B tem 15, a C tem 35, a D, 30 e a E tem 20. Vamos escolher uma amostra com no mínimo 12 crianças (10% de 120), selecionadas através de:

c) Amostragem Estratificada Proporcional: sorteamos os nomes das crianças em quantidades proporcionais ao número de crianças com 7 anos de cada classe, que constituem os estratos da amostra. Vamos agora determinar a porcentagem de crianças com 7 anos, em cada classe, em relação à população (120 crianças).

A:16,7% B: b 12,5%

120 100% 120 100%

20 a 15 b

De modo análogo, determinamos as porcentagens para as classes C, D e E, obtendo: C: c = 29,2% D: d = 25% E: e = 16,7%

Para calcularmos quantas crianças de cada classe serão sorteadas, para uma amostra de 12 crianças, fazemos:

A: 16,7% de 12 = 0,167 . 12 = 2,004 = 2 B: 12,5% de 12 = 0,125 . 12 = 1,5 = 2

C: 29,2% de 12 = 0,292 . 12 = 3,504 = 3 (neste caso, arredondamos para 3, ao invés de 4, porque o total de crianças da amostra é 12).

D: 25% de 12 = 0,25 . 12 = 3

E: 16,7% de 12 = 0,167 . 12 = 2,004 = 2

Deste modo, obtivemos a quantidade de elementos de cada estrato e o total da amostra. ORGANIZAÇÃO DE DADOS

Dado um conjunto de dados, vamos estudar como devemos “tratar” os valores, numéricos ou não, a fim de extrair informações a respeito de uma ou mais características de interesse.

Suponhamos, por exemplo, que um questionário foi aplicado a alunos do 1º ano de uma escola fornecendo as seguintes informações:

(6)

Id: identificação do aluno Turma: A ou B

Sexo: feminino (F) ou masculino (M) Idade: em anos

Alt: altura em metros Peso: em quilogramas Filhos: nº de filhos na família

Fuma: hábito de fumar: sim (S) ou não (N)

Toler: tolerância ao cigarro: (I) indiferente; (P) incomoda pouco; (M) incomoda muito Exerc.: horas de atividade física, por semana

Cine: nº. de vezes que vai ao cinema por semana

Op Cine: opinião a respeito das salas de cinema na cidade: (B) regular a boa; (M) muito boa TV: horas gastas assistindo TV, por semana

Op TV: opinião a respeito da qualidade da programação na TV: (R) ruim; (M) média; (B) boa; (N) não sabe.

O conjunto de informações, após a tabulação do questionário ou pesquisa de campo, é denominado de tabela de dados brutos e contém os dados da maneira que foram coletados inicialmente.

Cada uma das características perguntadas aos alunos, tais como o peso, a idade, a altura, etc. é denominada de variável e, como podemos observar, tem naturezas diferentes quanto aos possíveis valores que podem assumir.

(7)

TIPOS DE VARIÁVEIS

Existem dois tipos de variáveis: quantitativas (variáveis numéricas) e qualitativas (variáveis não numéricas).

Variáveis Qualitativas

Seus valores representam uma qualidade (ou atributo) do indivíduo pesquisado. Exemplos: sexo, turma, estado civil, grau de instrução, hábito de fumar etc. Dentre as variáveis qualitativas, ainda existem dois tipos:

Variável Qualitativa Nominal

Não existe ordenação em seus possíveis resultados. Exemplos: sexo, turma, hábito de fumar.

Variável Qualitativa Ordinal

Existe uma certa ordem em seus possíveis resultados.

Exemplos: tamanho (P, M, G); classe social (baixa, média, alta); grau de instrução (1º grau, 2º grau, grau superior); estado civil.

Variáveis Quantitativas

Seus valores são numéricos resultantes de uma contagem ou mensuração. Exemplos: número de filhos, salário, peso, altura etc..

Dentre as variáveis quantitativas ainda existem dois tipos:

Variáveis Quantitativas Discretas

Seus possíveis valores formam um conjunto finito ou enumerável de números que resultam frequentemente de uma contagem.

Exemplos: número de filhos, idade (em anos), cine (número de vezes que vai ao cinema por semana).

Variáveis Quantitativas Contínuas

Seus possíveis valores formam um intervalo de números reais que resultam normalmente de uma mensuração.

(8)

Exemplos: peso, altura, salário.

ESQUEMA

(9)

INFORMACOES DE QUESTIONARIO ESTUDANTIL

Id Turma Sex o

Idade Alt Peso Filho Fuma Toler Exerc Cine OpCine TV OpTV

1 A F 17 1,60 60,5 2 Não P 0 1 B 16 R 2 A F 18 1,69 55,0 1 Não M 0 1 B 7 R 3 A M 18 1,85 72,8 2 Não P 5 2 M 15 R 4 A M 25 1,85 80,9 2 Não P 5 2 B 20 R 5 A F 19 1,58 55,0 1 Não M 2 2 B 5 R 6 A M 19 1,76 60,0 3 Não M 2 1 B 2 R 7 A F 20 1,60 58,0 1 Não P 3 1 B 7 R 8 A F 18 1,64 47,0 1 Sim I 2 2 M 10 R 9 A F 18 1,62 57,8 3 Não M 3 3 M 12 R 10 A F 17 1,64 58,0 2 Não M 2 2 M 10 R 11 A F 18 1,72 70,0 1 Sim I 10 2 B 8 N 12 A F 18 1,66 54,0 3 Não M 0 2 B 0 R 13 A F 21 1,70 58,0 2 Não M 6 1 M 30 R 14 A M 19 1,78 68,5 1 Sim I 5 1 M 2 N 15 A F 18 1,65 63,5 1 Não I 4 1 B 10 R 16 A F 19 1,63 47,4 3 Não P 0 1 B 18 R 17 A F 17 1,82 66,0 1 Não P 3 1 B 10 N 18 A M 18 1,80 85,2 2 Não P 3 4 B 10 R 19 A F 20 1,60 54,5 1 Não P 3 2 B 5 R 20 A F 18 1,68 52,5 3 Não M 7 2 B 14 M 21 A F 21 1,70 60,0 2 Não P 8 2 B 5 R 22 A F 18 1,65 58,5 1 Não M 0 3 B 5 R 23 A F 18 1,57 49,2 1 Sim I 5 4 B 10 R 24 A F 20 1,55 48,0 1 Sim I 0 1 M 28 R 25 A F 20 1,69 51,6 2 Não P 8 5 M 4 N 26 A F 19 1,54 57,0 2 Não I 6 2 B 5 R 27 B F 23 1,62 63,0 2 Não M 8 2 M 5 R 28 B F 18 1,62 52,0 1 Não P 1 1 M 10 R 29 B F 18 1,57 49,0 2 Não P 3 1 B 12 R 30 B F 25 1,65 59,0 4 Não M 1 2 M 2 R 31 B F 18 1,61 52,0 1 Não P 2 2 M 6 N 32 B M 17 1,71 73,0 1 Não P 1 1 B 20 R 33 B F 17 1,65 56,0 3 Não M 2 1 B 14 R 34 B F 17 1,67 58,0 1 Não M 4 2 B 10 R 35 B M 18 1,73 87,0 1 Não M 7 1 B 25 B 36 B F 18 1,60 47,0 1 Não P 5 1 M 14 R 37 B M 17 1,70 95,0 1 Não P 10 2 M 12 N 38 B M 21 1,85 84,0 1 Sim I 6 4 B 10 R 39 B F 18 1,70 60,0 1 Não P 5 2 B 12 R 40 B M 18 1,73 73,0 1 Não M 4 1 B 2 R 41 B F 17 1,70 55,0 1 Não I 5 4 B 10 B 42 B F 23 1,45 44,0 2 Não M 2 2 B 25 R 43 B M 24 1,76 75,0 2 Não I 7 0 M 14 N 44 B F 18 1,68 55,0 1 Não P 5 1 B 8 R 45 B F 18 1,55 49,0 1 Não M 0 1 M 10 R 46 B F 19 1,70 50,0 7 Não M 0 1 B 8 R 47 B F 19 1,55 54,5 2 Não M 4 3 B 3 R 48 B F 18 1,60 50,0 1 Não P 2 1 B 5 R 49 B M 17 1,80 71,0 1 Não P 7 0 M 14 R 50 B M 18 1,83 86,0 1 Não P 7 0 M 20 B

(10)

DISTRIBUIÇÃO DE FREQUÊNCIAS

A partir da tabela de dados brutos (Tabela 1), vamos construir uma nova tabela com as informações resumidas, para cada variável, denominada tabela de frequência, que conterá os valores da variável e suas respectivas contagens, as quais são denominadas frequências absolutas ou simplesmente, frequências.

No caso de variáveis qualitativas ou quantitativas discretas, a tabela de frequência consiste em listar os valores possíveis da variável, numéricos ou não e fazer a contagem na tabela de dados brutos do número de suas ocorrências.

Notação: ni → frequência do valor i n → frequência total = Σni

Para efeito de comparação com outros grupos ou conjuntos de dados, é conveniente trabalharmos com a frequência relativa, definida por fi = ni/n.

Exemplos:

Tabela de Frequência para a Variável Sexo (extraída da Tabela 1): Sexo: variável qualitativa nominal.

Sexo

ni

fi=ni/n

F

i .

100

(%)

F

37

0,74

74

M

13

0,26

26

Total

n=50

1,00

100

Tabela 2: Variável Sexo

Note que, para variáveis cujos valores possuem ordenação natural (qualitativas ordinais e quantitativas em geral), incluímos na tabela de frequência uma coluna contendo as frequências acumuladas (fac) (quando o número de valores i for maior do que 2). A frequência acumulada até um certo valor é obtida pela soma das frequências de todos os valores da variável, menores ou iguais ao valor considerado.

(11)

Tabela de Frequência para a Variável Toler (extraída da Tabela 1):

Toler: variável qualitativa ordinal.

Toler

n

i

fac

fi=ni/n

f i.100 (%)

Fac.100 (%)

I

10

10

0,20

20

20

P

21

31

0,42

42

62

M

19

50

0,38

38

100

Total n = 50

1,00

100

Tabela 3: Variável Toler

Tabela de Frequência para a Variável Idade (extraída da Tabela 1):

Idade

ni

fac

fi=ni/n

fi.100(%)

fac(%)

17

9

9

0,18

18

18

18

22

31

0,44

44

62

19

7

38

0,14

14

76

20

4

42

0,08

8

84

21

3

45

0,06

6

90

22

0

45

0,00

0

90

23

2

47

0,04

4

94

24

1

48

0,02

2

96

25

2

50

0,04

4

100

Total

n = 50

1,00

100

Tabela 4: Variável Idade

Idade: variável quantitativa discreta. Observe através da fac que 90% dos alunos têm idades até 21 anos.

(12)

A variável Peso, classificada como quantitativa contínua, apresenta valores que podem ser qualquer número real num certo intervalo.

Pela Tabela 1, verificamos que os valores variam entre 44,0 kg e 95,0 kg e como existe um grande número de valores diferentes, vamos construir faixas ou classes de valores e contar o número de ocorrências em cada faixa.

Não existe uma regra formal para determinar o número de faixas ou classes a serem utilizadas. Entretanto, deve-se observar que com um pequeno número de classes, perde-se informação, e com um número grande de classes, o objetivo de resumir os dados fica prejudicado. No geral, é conveniente trabalharmos com 5 a 8 faixas de mesma amplitude, devendo ressaltar que faixas de tamanho desigual podem ser convenientes para representar valores nas extremidades da tabela.

Para a variável Peso, usaremos faixas de amplitude 10 e iniciaremos com 40,0 kg. Tabela de Frequência para a Variável Peso (extraída da Tabela 1):

Peso

n

i

fac

fi=ni/n



f

i

×

100(%)

fac

(%)

Ponto

Médio

40,0

├─

50,0

8

8

0,16

16

16

45,0

50,0

├─

60,0

22

30

0,44

44

60

55,0

60,0

├─

70,0

8

38

0,16

16

76

65,0

70,0

├─

80,0

6

44

0,12

12

88

75,0

80,0

├─

90,0

5

49

0,10

10

98

85,0

90,0

├─

100,0

1

50

0,02

2

100

95,0

Total

n=50

1,00

100

Tabela 5: Variável Peso

Peso: variável quantitativa contínua.

Observe pela fac que 76% dos alunos pesam menos que 70,0 kg e 100 – 88 = 12% têm peso maior ou igual a 80,0 kg.

Na Tabela 5 temos 6 faixas ou classes ou intervalos. Consideremos, por exemplo, a 1ª classe ou intervalo: 40,0 ├─ 50,0, onde temos:

Limite inferior (li): 40,0 Limite superior (ls): 50,0

Ponto Médio (PM) = (li + ls)/2 => (40+50)/2 =45

(13)

que o intervalo é fechado à esquerda e aberto à direita (40,0 faz parte dessa classe, mas 50,0 não; 50,0 está na 2ª classe).

Na Tabela 1, a variável TV (quantitativa discreta) tem valores inteiros entre 0 e 30 e uma tabela representando tais valores e respectivas frequências seria muito extensa e pouco prática. Por esse motivo, trataremos essa variável como quantitativa contínua, criando, por exemplo, faixas de amplitude 6 para representar seus valores.

Tabela de Frequência para a Variável TV (extraída da Tabela1):

TV ni fac fi=ni/n fi ⋅ 100 (%) fac (%)

0 ├─ 6 14 14 0,28 28 28 6 ├─ 12 17 31 0,34 34 62 12 ├─ 18 11 42 0,22 22 84 18 ├─ 24 4 46 0,08 8 92 24 ├─┤30 4 50 0,08 8 100 Total n = 50 1,00 100 Tabela 6: Variável TV

TV: variável quantitativa discreta que foi “tratada” como contínua.

Observe que na última classe, o intervalo é fechado à esquerda e à direita, incluindo portanto, o valor 30, e não tendo assim, que abrir mais uma classe por causa de um único valor. Outra sugestão seria usar uma amplitude maior nessa última classe, por exemplo, 24 ├─ 36 que inclui o valor 30.

GRÁFICOS ESTATÍSTICOS

A organização dos dados em tabelas de frequência proporciona um meio eficaz de estudo

do comportamento de características de interesse.

(14)

através de gráficos. Vamos definir quatro tipos básicos de gráficos: setores ou pizza, colunas ou

barras, histograma e polígono de frequências.

GRÁFICO DE SETORES OU DISCO OU PIZZA OU DIAGRAMA CIRCULAR

Adapta-se muito bem às variáveis qualitativas, mas também pode ser usado para as

variáveis quantitativas discretas.

Fazendo uso do computador para o traçado do gráfico, basta conhecer as porcentagens de

cada valor da variável. Se ao contrário, formos traçar o gráfico com o auxílio de compasso e

transferidor, precisamos determinar a medida em graus, de cada setor correspondente aos

valores da variável, lembrando que o disco todo mede 360°.

Exemplo: Gráfico de Setores para a Variável Toler (Tabela 3)

I: 20%

P:42%

M: 38%

GRÁFICO DE COLUNAS OU BARRAS

Adapta-se melhor às variáveis discretas ou qualitativas ordinais.

Utiliza o plano cartesiano com os valores da variável no eixo das abscissas e as

frequências ou porcentagens no eixo das ordenadas.

(15)

HISTOGRAMA

É utilizado para variáveis quantitativas contínuas.

Consiste em retângulos contíguos ou adjacentes onde a base, colocada no eixo das

abscissas, corresponde aos intervalos das classes e a altura, colocada no eixo das ordenadas é

dada pela frequência absoluta ou relativa das classes.

Observação: a área de um histograma é proporcional à soma das frequências absolutas.

No caso de trabalharmos com as frequências relativas, a área será igual à constante de

proporcionalidade.

Exemplo: Histograma para a Variável Peso (Tabela 5)

POLÍGONO DE FREQUÊNCIAS

É também utilizado para variáveis quantitativas contínuas.

Para construir o polígono de frequências, admitem-se como representantes de cada classe

os pontos médios de cada intervalo que as definem. Após obter os pontos (ponto médio,

frequência correspondente) em relação a cada intervalo, estes são ligados entre si por meio de

segmentos de retas, sendo que o primeiro e o último deles são ligados ao eixo das abscissas, na

metade de classes hipotéticas, imediatamente anterior à primeira e posterior à última.

(16)

Exemplo: Polígono de Frequências para a Variável Peso (Tabela 5)

Referências

Documentos relacionados

A Tabela 2 mostra as variáveis utilizadas no planejamento fatorial, suas codificações e os níveis reais para cada variável e na Tabela 3 é mostrada a matriz do planejamento fatorial

A amostra foi composta por 3.075 idosos do banco de dados do Projeto Fibra UNICAMP, os quais foram avaliados por meio de questionário sociodemográfico,

Em uma amostra de oito indivíduos, observaram, pelas telerradiografias em norma lateral pré-cirúrgica imediata e pós-cirúrgica tardia, alta correlação entre o movimento do ponto

› Conhecer os principais objectivos da criação das organizações para o desenvolvimento da África Austral (SADC, UA,

controlados. O indutor auxiliar Ls limita a derivada e o pico da corrente de recuperação reversa presente na entrada em condução, enquanto o capacitor auxiliar Ca

Entende-se a Escola como instituição de grande importância nesse processo, visto que é uma instituição por onde todos passam (ou deveriam passar) e onde a população

O objetivo da elaboração deste modelo foi identificar os elementos iniciais sobre a documentação de modelos de fluxo de processos e de objetos do negócio como primeiro passo