• Nenhum resultado encontrado

Aprendendo sobre medidas de dispersão

N/A
N/A
Protected

Academic year: 2021

Share "Aprendendo sobre medidas de dispersão"

Copied!
36
0
0

Texto

(1)

15

Aprendendo

sobre medidas

(2)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Apresentar as medidas de dispersão.

Após o estudo desta aula, você deverá ser capaz de:

1. calcular a variância de dados não agrupados;

2. calcular a variância de dados agrupados; 3. calcular o desvio padrão;

4. calcular o coeficiente de variação.

Para esta aula, é importante que você tenha em mente o cálculo de potência e raiz quadrada, assuntos tratados nas Aulas 3 e 4, respectivamente. Também é importante rever o conceito de média aritmética apresentado na Aula 13, bem como o conceito de porcentagem, visto na Aula 5. Além disso, tenha à mão uma calculadora, para fazer as atividades propostas.

META OBJETIVOS

(3)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

ENTENDENDO TODO O CONJUNTO

Nas Aulas 13 e 14 você aprendeu sobre as medidas de tendência central. Aprendeu a calcular a média aritmética simples e ponderada, a mediana e a moda. Todas essas medidas são valores que representam, de forma resumida (em um único valor), todo um conjunto de dados.

No entanto, tais medidas oferecem pouca informação a respeito da forma como os outros valores estão espalhados pelo conjunto. Quer dizer, os outros valores do conjunto são próximos ou distantes do valor central?

Por isso, fez-se importante pensar em outras medidas que fossem capazes de complementar as informações das medidas de tendência central. Assim, nasceram as medidas de dispersão.

Essas medidas, assim como as de tendência central, são medidas de posição. Elas determinam o quanto os outros dados do conjunto estão perto, ou não, da média aritmética.

(4)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Nesta aula, você aprenderá a calcular a variância, o desvio padrão e o coeficiente de variação, que são medidas de dispersão. Vamos lá?

MEDIDAS DE DISPERSÃO: QUANTO MAIS PERTO MELHOR!

A média aritmética de uma série de dados, embora seja muito

utilizada para representá-la, não pode mostrar a HOMOGENEIDADE ou

HETEROGENEIDADE que há entre os valores que compõem o conjunto.

Isso acontece porque a média é um valor que representa um conjunto de dados, mas podem existir valores dentro do conjunto que estejam bastante distantes da maioria dos números que o compõem. Quando isso acontece, a média acaba sendo um valor bem diferente da maioria dos dados do conjunto.

Como vimos na Aula 13, esses valores distantes interferem no resultado, fazendo com que a média se distancie dos valores mais centrais do conjunto. O mesmo raciocínio vale para as outras medidas de tendência central.

MEDIDAS DE POSIÇÃO

MEDIDAS DE DISPERSÃO

MEDIANA MODA VARIÂNCIA PADRÃODESVIO COEFICIENTE DE VARIAÇÃO MÉDIA ARITMÉTICA MEDIDAS DE TENDÊNCIA CENTRAL

Figura 15.1: Existem dois grupos de medidas de posição: as medidas de tendência central e as medidas de dispersão. As principais medidas de tendência central são a média aritmética, mediana e moda. As principais medidas de dispersão são a variância, o desvio padrão e o coeficiente de variação. HOMOGENEIDADE

Característica, qualidade do que é homogêneo. Homogêneo é o que possui igual natureza e/ou apresenta semelhança de estrutura, função, distribuição etc. Um conjunto homogêneo, por exemplo, apresenta grande unidade, adesão, uniformidade entre seus elementos.

Fonte: Dicionário Houaiss

de Língua Portuguesa

HETEROGENEIDADE

Característica, qualidade do que é heterogêneo. Heterogêneo é o que possui natureza desigual e/ou apresenta diferença de estrutura, função, distribuição etc. Um conjunto heterogêneo é aquele que não possui unidade ou uniformidade. Heterogêneo é o antônimo (oposto) de homogêneo.

(5)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Observe, agora, os conjuntos A, B e C: A: 69, 70, 70, 70, 71.

B: 58, 66, 72, 76, 78. C: 6, 14, 49, 121, 160.

Ao calcular a média aritmética simples de cada um desses conjuntos, encontramos:

Fonte: www.sxc.hu

Figura 15.2: A medidas de dispersão nos informam o quanto os valores de um conjunto de dados estão muito ou pouco espalhados em torno da média aritmética.

ATENÇÃO!

A média aritmética simples é calculada somando-se os valores dos elementos do conjunto e dividindo o resultado pelo número de ele-mentos do conjunto.

Você percebeu que os três conjuntos apresentam a mesma média aritmética? Em todos os conjuntos a média é setenta. Mas, olhando atentamente para cada um deles, você diria que são parecidos?

(6)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Notamos, com facilidade, que o conjunto A é o mais homogêneo dos três, pois os valores se distanciam pouco da média aritmética, que é setenta. Quer dizer, a maioria dos números do conjunto tem valores próximos ao valor da média. Dizemos, neste caso, que os dados desse conjunto se dispersam pouco em torno da média.

Já o conjunto C é mais heterogêneo, já que seus valores são distantes do valor da média encontrada. Os dados desse conjunto se dispersam muito em torno da média.

Assim, concluímos que o conjunto A apresenta dispersão (ou variabilidade) menor do que os conjuntos B e C. Também podemos acreditar que, para o conjunto A, a média é uma boa medida para representá-lo.

A fim de avaliar os valores de uma variável (valores dentro de um conjunto de dados), mostrando seu grau de dispersão (ou variabilidade) em torno de sua média aritmética, a Estatística recorre às medidas de dispersão. As medidas de dispersão mais comuns são:

• variância; • desvio padrão;

• coeficiente de variação; e • amplitude total.

(7)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

VARIÂNCIA

A variância é uma medida de dispersão que tem como objetivo a avaliação de um conjunto de dados, analisando o quanto eles estão dispersos. Para isso, tomamos como referência a média aritmética do conjunto. Ou seja, podemos definir variância como uma medida que representa o quanto os dados estão dispersos (afastados) em relação à média aritmética.

Vamos aprender mais sobre essa medida utilizando um exemplo: Para preencher uma vaga de Técnico em Segurança no Trabalho, o departamento de pessoal de uma indústria química realizou testes com vários candidatos. Vera e Paulo foram os candidatos que obtiveram as melhores notas. A tabela a seguir mostra o desempenho dos dois candidatos nas provas a que se submeteram:

Tabela 15.1: Notas que Vera e Paulo tiraram em cada uma das cinco provas que fizeram e a média aritmética das notas de cada um deles.

Candidato

Assunto Vera Paulo

Conhecimentos de Informática 8,5 9,5 Língua Portuguesa 9,5 9,0 Inglês 8,0 8,5 Matemática 7,0 8,0 Conhecimento Específico 7,0 5,0 Média = 8,0 Média = 8,0

Observe que a média aritmética das notas das provas dos dois candidatos é igual. As duas médias são iguais a oito.

(8)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

No caso de Paulo e Vera, a amostra de notas menos dispersa em relação à média aritmética corresponderá ao melhor desempenho e, portanto, ao merecedor da vaga. Portanto, vamos calcular a variância como critério de desempate.

A variância é representada pelo símbolo s². É preciso seguir alguns passos para encontrá-la. Veja a seguir:

• 1º passo: calcule a diferença entre cada nota e a média aritmética de todas as notas. Faça isso para cada candidato, separadamente.

Cálculo da Vera Cálculo do Paulo 8,5 - 8,0 = 0,5 9,5 - 8,0 = 1,5 9,5 - 8,0 = 1,5 9,0 - 8,0 = 1,0 8,0 - 8,0 = 0,0 8,5 - 8,0 = 0,5 7,0 - 8,0 = -1,0 8,0 - 8,0 = 0,0 7,0 - 8,0 = -1,0 5,0 - 8,0 = -3,0

• 2º passo: calcule o quadrado de cada valor encontrado no passo anterior (você aprendeu a calcular potência na Aula 3, lembra?).

Cálculo da Vera Cálculo do Paulo (0,5)2 = 0,25 (1,5)2 = 2,25

(1,5)2 = 2,25 (1,0)2 = 1,0

(0,0)2 = 0,0 (0,5)2 = 0,25

(-1,0)2 = 1,0 (0,0)2 = 0,0

(-1,0)2 = 1,0 (-3,0)2 = 9,0

• 3º passo: calcule a média aritmética dos valores encontrados no passo anterior. 2 2 0 25 2 25 0 0 1 0 1 0 5 0 9 2 25 1 0 0 25 0 0

s

s

Vera Paulo = + + + + = = + + + , , , , , , , , , , ++9 0 = 5 2 5 , ,

(9)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Os resultados encontrados no terceiro passo são as variâncias de cada um dos conjuntos de notas. Veja que a variância das notas de Vera (0,9) é menor que a de Paulo (2,5), o que significa que as notas de Vera estão mais próximas da média (menos dispersas) do que as de Paulo, ou seja, seu desempenho nas provas foi mais regular e, portanto, Vera deverá ficar com a vaga.

Fonte: www.sxc.hu

Figura 15.3: Para determinar se algo está longe ou perto precisamos de uma referência. No caso das medidas de dispersão essa referência é a média aritmética de um conjunto de dados.

Calculando a variância de um jeito diferente

O que você achou do cálculo da variância? Difícil? Complicado? Bem. Existe uma outra opção para fazer esse cálculo. A segunda maneira de encontrar o valor da variância é chamada de Processo Breve. Vamos aproveitar o exemplo das notas da Vera e do Paulo para calcular a variância por esse outro caminho.

(10)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

O primeiro passo é montar uma tabela para cada candidato, colocando na primeira coluna as notas e na segunda coluna o quadrado do valor dessas notas. No fim da tabela, coloca-se a soma dos valores de cada coluna. Veja a seguir:

Tabela com as notas da Vera Tabela com as notas do Paulo Notas Quadrados das notas Notas Quadrados das notas

8,5 72,25 9,5 90,25

9,5 90,25 9,0 81,0

8,0 64,0 8,5 72,25

7,0 49,0 8,0 64,0

7,0 49,0 5,0 25,0

Total: 40 Total: 324,5 Total: 40 Total: 332,5

O próximo passo é diminuir a razão entre o total da segunda coluna e o número de notas, do quadrado da razão entre o total da primeira coluna e o número de notas.

Fonte: www.sxc.hu

Figura 15.4: Existe mais de uma maneira de encontrar a variância de um conjunto de dados. Escolha o caminho que achar mais fácil.

(11)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Vamos montar a equação devagar, usando as notas da Vera para entender:

• Razão, na linguagem matemática, significa fração. Ou seja, no caso do exemplo das notas da Vera, a razão entre o total da segunda coluna (324,5) e o número de notas (5) é:

324 5 5

,

• O quadrado (potência de 2) da razão entre o total da primeira coluna (40) e o número de notas (5) é:

2

40

5





• Então, diminuir a razão entre o total da segunda coluna e o número de notas, do quadrado da razão entre o total da primeira coluna e o número de notas; quer dizer:

324 5 5 2

40

5

,





• A variância das notas de Vera é:

2 2 2 324 5 5 64 9 64 9 64 0 9

40

5

8

s

= −

= − = − =





, , , ,

(12)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

A variância das notas de Vera é 0,9, o mesmo valor encontrado na seção sobre variância.

Agora é a sua vez. Utilize o espaço a seguir para calcular a variância das notas do Paulo. Aproveite que a tabela com o quadrado das notas já está montada. O resultado você já sabe: é o mesmo da seção anterior. Mas não deixe de tentar encontrá-lo aqui, calculando da maneira que acabou de aprender.

Fonte: www.sxc.hu

Kriss Szkirlatowski

Até aqui você aprendeu a calcular a variância de duas maneiras diferentes. Usando qualquer uma delas você chegará ao mesmo resultado. No entanto, os cálculos foram feitos para um conjunto de dados não agrupados. Na próxima seção, você verá como é feito o cálculo da variância quando os dados estão agrupados.

Fonte: www.sxc.hu

(13)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Variância de dados agrupados

A esta altura do nosso curso, você já deve ter percebido que quando os dados se apresentam agrupados (em freqüências ou em classes), a forma de encontrar qualquer uma das medidas de posição é diferente do cálculo para dados não agrupados, não é mesmo? Nesta seção, veremos como encontrar a variância para dados que estão agrupados.

Variância de dados agrupados sem intervalos de classe

Dados agrupados sem intervalos de classe são os dados que en-contramos agrupados em freqüências, ou seja, eles estão agrupados pelo

Atende ao Objetivo 1 Um grupo de amigos da mesma turma do curso de Segurança no Trabalho estava reunido estudando para uma prova quando surgiu uma dúvida: qual o número de equipamentos de segurança que devem ser utilizados por um trabalhador da indústria do setor alimentício? Ninguém se entendeu e cada um deu uma resposta diferente. As respostas que surgiram foram: 8, 10, 11, 15, 16, 18.

Um dos amigos teve uma idéia e disse: vamos aproveitar esses números e estudar para a prova de estatística? Que tal se nós calcularmos a variância desses valores?

Todos concordaram e resolveram calcular. Que valor eles encontraram?

Lembre-se de que existem duas maneiras de calcular o valor. Você pode escolher qual delas usar, mas seria interessante que tentasse fazer dos dois jeitos, assim testaria se aprendeu o cálculo de ambos.

(14)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Observe a Tabela 15.2. Ela foi montada a partir de um levantamento feito pela secretaria municipal de obras de Engenhópolis. A intenção da pesquisa era verificar a quantidade de multas que as trinta empresas de construção civil desse município receberam, no mês de janeiro, devido a problemas com as condições de trabalho dos empregados.

Tabela 15.2: Distribuição de freqüência relativa à quantidade de multas que 30 empresas do município de Engenhópolis receberam no mês de janeiro. A segunda coluna apresenta a quantidade de empresas que receberam a quantidade de multas relacionadas na primeira coluna.

Empresas multadas no mês de janeiro Número de multas Quantidade de empresas

(freqüência) 0 2 1 6 2 12 3 7 4 3 Total 30 Fonte: www.sxc.hu

Figura 15.5: As empresas, inclusive aquelas do ramo da construção civil, são multadas pelo Ministério do Trabalho quando descumprem a legislação referente à segurança no trabalho.

(15)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Para calcular a variância dos valores encontrados na Tabela 15.2 é preciso levar em consideração o fato de que eles estão agrupados em freqüências.

Para facilitar a organização dos cálculos é importante montar uma tabela auxiliar. Para isso, basta criar mais duas colunas na tabela anterior. A terceira coluna será o resultado da multiplicação da primeira coluna pela segunda. A quarta coluna é o resultado da multiplicação do quadrado da primeira coluna pela segunda coluna. Veja como fica a nova tabela. A última linha da tabela apresenta a soma de cada coluna.

Tabela 15.3: Auxiliar para cálculo da variância. Foram inseridas mais duas colunas na Tabela 15.2. A terceira coluna é o resultado da primeira multiplicada pela segunda. A quarta coluna é o resultado do quadrado da primeira multiplicado pela segunda.

Empresas multadas no mês de janeiro

Multas Freqüência FreqüênciaMultas x (Multas)² x Freqüência

0 2 0 0 1 6 6 6 2 12 24 48 3 7 21 63 4 3 12 48 Total 30 63 165

Para encontrar a variância (s²), você tem que calcular a diferença entre a razão do total da quarta coluna pelo total da segunda coluna e o quadrado da razão entre o total da terceira coluna pelo total da segunda coluna. Não é difícil. Veja como fica a equação:

2 2

4

2

3

2

s

coluna

coluna

a a coluna coluna a a = −





Substituindo a fórmula pelos valores da tabela, temos:

s²=165−  30

63 30

(16)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Esse resultado significa que a variância dos valores (as multas recebidas pelas trinta empresas) da Tabela 15.2 é 1,09.

Variância de dados agrupados em intervalos de classe

O cálculo da variância com intervalos de classe é parecido com o anterior (agrupados em freqüências), mas possui algumas particularidades. Veja o exemplo adiante e compare as diferenças com a seção anterior.

A partir das estaturas (alturas) de quarenta alunos de uma das turmas de um curso preparatório para concursos, foi montada a seguinte tabela:

Tabela 15.4: Estatura, em centímetros, dos quarenta alunos do curso. As estaturas estão agrupadas em seis classes. A terceira coluna apresenta a quantidade de alunos com alturas encontradas dentro do referido intervalo de classe (segunda coluna).

Estatura dos alunos da turma

Classes Estatura em centímetros (intervalo de classes) Número de alunos (freqüência)

1 150 154 4 2 154 158 9 3 158 162 11 4 162 166 8 5 166 170 5 6 170 174 3 Total 40

A partir da Tabela 15.4 é possível montar outra tabela para facilitar o cálculo da variância.

Fonte: www.sxc.hu

Figura 15.6: Quando os dados de um conjunto se encontram agrupados, fica um pouco mais

(17)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

A nova tabela deverá possuir mais três colunas. A quarta coluna deve apresentar o ponto médio de cada intervalo de classe (média aritmética entre o limite inferior e o limite superior de cada intervalo de classe). A quinta coluna é o resultado da multiplicação da terceira coluna (freqüência) pela quarta coluna (ponto médio). Já a sexta coluna vem com o resultado da multiplicação da terceira coluna pelo quadrado da quarta. A última linha da tabela apresenta a soma (total) da terceira, quinta e sexta colunas.

Veja, a seguir, como fica a nova tabela:

Tabela 15.5: Auxiliar para cálculo da variância de dados agrupados em intervalos de classes. A Tabela 15.4 foi acrescida de três colunas. A quarta coluna é o ponto médio dos intervalos de classes. A quinta coluna é o resultado da terceira coluna multiplicada pela quarta. A sexta coluna é o resultado da terceira coluna multiplicada pelo quadrado da quarta.

Estatura dos alunos da turma

Classe Intervalos de classes (freqüência)N° alunos médioPonto Freqüência × Ponto médio Freqüência × (Ponto médio)² 1 150 154 4 152 608 92.416 2 154 158 9 156 1.404 219.024 3 158 162 11 160 1.760 281.600 4 162 166 8 164 1.312 215.168 5 166 170 5 168 840 141.120 6 170 174 3 172 516 88.752 Total 40 6.440 1.038.080

Para calcular a variância, é preciso diminuir a razão entre a soma da sexta coluna pela soma da terceira coluna do quadrado da razão entre a soma da quinta coluna pela soma da terceira coluna. Ou seja:

(18)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Substituindo a fórmula pelos valores da tabela, temos:

s s ² . . . ² . . . . . = −  = − 1 038 080 40 6 440 40 1 038 080 40 41 473 600 1 60 2 00 25 952 25 921 31 s s ² . . ² = − =

Quer dizer, então, que a variância das alturas dos alunos daquela turma é 31.

Você deve ter percebido que no cálculo da variância alguns números são elevados ao quadrado, não é mesmo? Esse recurso, utilizado para fazer o cálculo, gera um problema se os dados analisados se apresentarem em unidades de medidas. Isso acontece porque unidades de medida podem ser elevadas à potência, e isso modifica o resultado – metro (m)

é diferente de metro quadrado (m2), que por sua vez é diferente de metro

cúbico (m3).

Por exemplo: imagine que você está calculando a variância do conjunto das estaturas (alturas) dos seus melhores amigos. A unidade usada para medir estaturas é o centímetro. Assim como é feito para calcular a variância – elevar os valores ao quadrado –, a unidade de medida também será elevada ao quadrado. E, como você já deve saber, centímetro é diferente de centímetro quadrado.

Para resolver esse problema e deixar o cálculo na mesma unidade dos dados, é só tirar a raiz quadrada da variância (operação inversa da potência de dois; lembra-se da Aula 4?). Só que o resultado encontrado não é mais a variância. Ele agora é chamado de desvio padrão. O desvio padrão é o nosso próximo assunto desta aula.

(19)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão MULTIMÍDIA

Você já imaginou um mundo sem as unidades de medidas? Como iríamos comprar o sal, o açúcar, o leite e tantos outros alimentos que fazem parte das refeições “nossas de cada dia”? Como medir com precisão se as medidas tivessem de ser feitas com polegadas, braçadas ou pés? Cada pessoa tem um polegar, um braço ou pé diferente, ou seja, as medidas poderiam ser de qualquer tamanho, não é verdade? Para resolver esses problemas, foi criado o Sistema Internacional de Medidas, que regulamentou e unificou as medições. Se você quiser se informar mais sobre o assunto, vá até o endereço http://www.inmetro.gov.br/ consumidor/unidLegaisMed.asp. É uma página do site do INMETRO (Instituto Nacional de Metrologia, Normalização e Qualidade Industrial). Nela você encontrará um link para o Sistema Internacional de Unidades de Medidas, com o histórico de sua criação e a explicação sobre todas as unidades e grandezas.

Fonte: www.sxc.hu

Sanja Gjenero

Atende ao Objetivo 2 Em determinado setor de uma siderúrgica, existem seis equipamentos de grande porte. Nesse setor trabalham vinte e cinco operários em turnos variados. Para evitar que mais de um

(20)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

DESVIO PADRÃO

O desvio padrão também é uma medida de dispersão. Assim como a variância, ele dá a noção de como os valores de determinado conjunto estão dispersos em relação a sua média aritmética. Quer dizer, o desvio padrão nos informa a distância média em que os valores de determinado conjunto de dados estão em relação à média desse conjunto.

Quantidade de trabalhadores que utilizam cada equipamento

Equipamento utilizam o equipamento (freqüência)Número de trabalhadores que

1 2 2 5 3 8 4 6 5 3 6 1 Total 25

Utilizando a tabela anterior, calcule a variância dos dados. Para ajudar nos cálculos, preencha a tabela auxiliar a seguir.

Equipamento Freqüência 1ª coluna x 2ª coluna (1ª coluna)coluna2 x 2ª

1 2 2 2 2 3 4 5 6 Total 25

(21)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Quanto maior o valor do desvio padrão, maior é a dispersão dos dados de um conjunto em relação a sua média aritmética. Quando o valor do desvio padrão é igual a zero, significa dizer que os valores do conjunto são iguais à média.

O desvio padrão é representado pela letra grega σ (sigma). Ele é a raiz quadrada da variância. Portanto, você já pode calcular o desvio padrão sem problemas, tanto para dados agrupados quanto para não agrupados, porque já sabe calcular a variância.

Lembra-se do Paulo e da Vera, que foram apresentados na seção sobre variância? Naquele exemplo, foi calculada a variância das notas das provas de cada um deles. A variância das notas de Vera era 0,9, enquanto a variância das notas do Paulo foi 2,5.

Se o desvio padrão é a raiz quadrada da variância, temos:

s s _ , , _ , , Vera Paulo = ≅ = ≅ 0 9 0 949 2 5 1 58

Observe que, pelo cálculo do desvio padrão, Vera continua com desempenho melhor que o de Paulo, pois seu desvio padrão é menor que o dele. Esse resultado significa que as notas de Vera têm uma distância média, em relação à média

aritmética de todas as notas (que era oito, lembra?), de 0,9. Essa distância é menor que a encontrada para as notas de Paulo, ou seja, as notas dela são mais homogêneas do que as dele.

(22)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Agora, vamos a um exemplo com dados agrupados para que você veja como é fácil!

Imagine que um grupo de jovens futuros administradores de empresas realizou uma pesquisa com sessenta e quatro funcionários do setor financeiro de uma grande indústria farmacêutica. Na entrevista, eles perguntaram o valor atual do salário de cada um dos entrevistados. O grupo de alunos, que já teve aulas de estatística, organizou os dados em uma tabela de distribuição de freqüência. Veja como ficou:

Tabela 15.6: Salários dos funcionários do setor financeiro. Os salários, em reais, estão agrupados em classes. A coluna da direita apresenta o número de funcionários com salários encontrados dentro do intervalo de classes correspondente.

Salário dos funcionários do setor financeiro Classe Salário em reais (intervalo de

classes) com salário nesse intervalo Número de funcionários (freqüência) 1 450,00 550,00 8 2 550,00 650,00 10 3 650,00 750,00 11 4 750,00 850,00 16 5 850,00 950,00 13 6 950,00 1.050,00 5 7 1.050,00 1.150,00 1 Total 64

Vamos aproveitar a tabela que os alunos montaram e calcular o desvio padrão desses dados em relação a sua média?

Primeiro, devemos calcular a variância; para isso, como você já aprendeu, devemos acrescentar, na Tabela 15.6, três colunas:

• uma coluna para os valores do ponto médio de cada intervalo de classe;

• outra coluna com o resultado da multiplicação da freqüência pelo ponto médio; e

• a última coluna com a multiplicação da freqüência pelo quadrado do ponto médio.

(23)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

É importante colocar, na última linha da nova tabela, a soma dos valores da terceira, da quinta e da sexta colunas. Agora, temos a Tabela 15.7.

Tabela 15.7: Auxiliar com o salário dos funcionários do setor financeiro. Foram acrescentadas à Tabela 15.6 mais três colunas. A quarta coluna é o ponto médio de cada intervalo de classe (média aritmética entre os limites do intervalo). A quinta coluna é o resultado das freqüências vezes os pontos médios. A sexta coluna é o resultado das freqüências vezes os quadrados dos pontos médios.

Salário dos funcionários do setor financeiro

Classe (intervalo de classes)Salário em reais Freqüência médioPonto Freqüência × Ponto médio Freqüência × (Ponto médio)² 1 450,00 550,00 8 500 4.000 2.000.000 2 550,00 650,00 10 600 6.000 3.600.000 3 650,00 750,00 11 700 7.700 5.390.000 4 750,00 850,00 16 800 12.800 10.240.000 5 850,00 950,00 13 900 11.700 10.530.000 6 950,00 1.050,00 5 1.000 5.000 5.000.000 7 1.050,00 1.150,00 1 1.100 1.100 1.210.000 Total 64 48.300 37.970.000

A variância é calculada pela seguinte fórmula: 2 2

6

3

5

3

s

coluna

coluna

a a coluna coluna a a = −





(24)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Agora é só substituir os valores da tabela na fórmula. Assim, temos: s s ² . . . ² . . . = −  = −  37 970 000 64 48 300 64 37 970 000 64 48 300 64 2   = − = − = 2 593 281 25 754 6875 593 281 25 569 553 22 2 s s s ² . , ( , )² ² . , . , ² 33 728 03. ,

A variância dos salários vale, portanto, 23.728,03.

Como foi dito anteriormente, o desvio padrão é a raiz quadrada da variância. Então: Fonte: www.sxc.hu Pontus Endenberg Vince Varga Przemyslaw Szczepanski Jay Simmons σ σ σ

O desvio padrão dos salários vale R$ 154,00.

s s s = = = . , 23 728 03 154

(25)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Digamos que você queira comparar o desvio padrão encontrado no exemplo da Vera e do Paulo da seção sobre variância com o desvio padrão encontrado no exemplo anterior (dos salários). Você acha que seria possível?

É difícil imaginar que possamos comparar notas de provas com dinheiro, não é verdade? E como foi explicado, o resultado do desvio padrão sai com a mesma unidade dos dados analisados. Por isso, houve a necessidade de se criar uma medida de dispersão que possibilitasse a comparação de conjuntos de dados diferentes. Essa medida é chamada de coeficiente de variação e será apresentada na próxima seção.

Atende ao Objetivo 3 Uma turma de trinta e sete alunos realizou prova de Português e Literatura. Cada prova era composta por 130 questões. A professora da disciplina montou uma tabela de distribuição de freqüência de dados agrupados em intervalos de classe, com o número de questões corretas de cada aluno. Veja:

Notas da prova de Português e Literatura Classe (intervalo de classe)Questões corretas Número de alunos (freqüência)

1 30 50 2 2 50 70 8 3 70 90 12 4 90 110 10 5 110 130 5 Total 37

ATIVIDADE 3

(26)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

COEFICIENTE DE VARIAÇÃO

Como você pode conferir na seção anterior, o desvio padrão e a variância são expressos com as mesmas unidades dos dados sobre os quais foram calculados. Por exemplo, o cálculo do desvio padrão no exemplo do salário dos funcionários foi dado em reais, pois os dados estavam em reais.

O problema é que não podemos comparar o valor encontrado no caso dos salários (σ = R$ 154,00), por exemplo, com o desvio padrão calculado sobre dados que estão em centímetros. Anteriormente,

calculamos a variância das estaturas dos alunos de uma turma (s2 =

31), lembra? O desvio padrão do valor encontrado é a raiz quadrada desse valor, ou seja, σ = 5,57 cm. Não é possível dizer que R$ 154,00 é maior que 5,57 cm, porque os valores estão em unidades diferentes (reais e centímetros).

Com base na tabela montada pela professora, calcule o desvio padrão do número de questões que cada aluno acertou. Aproveite a tabela a seguir para ajudar no cálculo.

Classe Questões corretas (intervalo de

classe)

N° de alunos

(Freqüência) médioPonto Freqüência × Ponto médio Freqüência × (Ponto médio)² 1 30 50 2 2 50 70 8 3 70 90 12 4 90 110 10 5 110 130 5 Total 37

(27)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

É para driblar essa limitação que surgiu outro tipo de variável, chamada de coeficiente de variação. O coeficiente de variação mostra a dispersão dos dados em relação à média de um conjunto, assim como a variância e o desvio padrão. A grande diferença é que o valor do coeficiente de variação é representado em porcentagem e, portanto, pode ser comparado (lembra-se da Aula 5?).

Então, sempre que quiser comparar conjuntos diferentes, mesmo representados em unidades diferentes, você deverá utilizar essa medida de dispersão.

O coeficiente de variação é a razão entre o desvio padrão e a média aritmética do conjunto. Ao multiplicarmos esse resultado por 100, encontramos o valor em porcentagem.

Vamos entender, na prática, o que foi explicado? Volte ao exemplo

Figura 15.9: Não é possível comparar dados que não estejam representados na mesma unidade.

(28)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

ESTATURA DOS ALUNOS DA TURMA Classe Intervalos de classes (freqüência)N° alunos médioPonto Freqüência × Ponto

médio Freqüência × (Ponto médio)² 1 150 154 4 152 608 92.416 2 154 158 9 156 1.404 219.024 3 158 162 11 160 1.760 281.600 4 162 166 8 164 1.312 215.168 5 166 170 5 168 840 141.120 6 170 174 3 172 516 88.752 Total 40 6.440 1.038.080

O primeiro passo é calcular a média aritmética das estaturas, que você aprendeu na Aula 13. Como os dados estão agrupados em intervalos de classe, a média será encontrada ao multiplicarmos cada ponto médio por sua respectiva freqüência. Somamos esses valores e dividimos pela soma de todas as freqüências, como na equação:

x= × + × + × + × + × + × + + + (4 152) (9 156) (11 160) (8 164) (5 168) (3 172) 4 9 11 8++ + = + + + + + = = 5 3 608 1 404 1 760 1 312 840 516 40 6 440 40 161 x x x . . . .

O desvio padrão já foi calculado, lembra? Ele é igual a 5,57 cm. Sabendo os valores da média aritmética e do desvio padrão fica fácil calcular o coeficiente de variação, que representaremos por CV:

CV X CV = × = × s 100 5 57 161 100 ,

(29)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Quer dizer, então, que o coeficiente de variação das estaturas dos alunos é 3,5% (valor aproximado).

Se você calcular o valor da média aritmética dos salários dos funcionários do exemplo da seção sobre variância, verá que ela é igual a 182,8. Já sabemos que o desvio padrão é R$ 154,00. Vamos, agora, calcular o coeficiente de variação:

CV X CV CV CV = × = × = × = s 100 154 182 8 100 0 8424 100 84 2 , , ,

Neste caso, o coeficiente de variação dos salários dos funcionários é 84% (valor aproximado).

Com esses resultados, podemos, então, comparar a dispersão dos dados em relação à média, nas diferentes situações apresentadas. A dispersão dos valores dos salários em relação ao salário médio é de 84%, enquanto a dispersão das estaturas é de 3,5%. Ou seja, podemos afirmar que os dados do conjunto das estaturas dos alunos são mais homogêneos (menos dispersos) do que o conjunto com os valores dos salários.

SAIBA MAIS...

SAIBA MAIS...

A amplitude da dispersão

(30)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

Além das medidas de dispersão que você aprendeu nesta aula, existe outra medida chamada de amplitude total. Você deve se lembrar do conceito de amplitude total que foi apresentado na Aula 7.

Para encontrar a amplitude total, você deve calcular a diferença entre o maior e o menor valor de um conjunto de dados. Assim, quanto maior a amplitude total, maior será a dispersão dos dados do conjunto.

É uma medida bem simples, você não acha? A amplitude total, assim como a variância, o desvio padrão e o coeficiente de variação, indica, de maneira aproximada, a dispersão ou variabilidade dos dados em um conjunto.

No entanto, a amplitude total não é uma medida de dispersão muito utilizada. Isto porque ela só leva em consideração os valores extremos do conjunto (o maior e o menor), e ignora os valores intermediários. Imagine um conjunto com os seguintes valores: 2, 57, 57, 57, 58, 59, 60, 60, 62, 63, 63, 63, 100. A amplitude total desse conjunto é noventa e oito (100 – 2 = 98). Se você observar, verá que apenas os dois valores extremos do conjunto são distantes dos outros dados. Na verdade, a maioria dos dados do conjunto (os outros onze valores) se concentra entre valores que vão de 57 a 63, ou seja, não estão muito dispersos, não é mesmo?

Atende ao Objetivo 4

Atende ao Objetivo 4 Na disciplina Biossegurança do curso Segurança no Trabalho, a média aritmética das notas de todas as provas do primeiro semestre foi de 7,8 pontos e o desvio padrão foi igual a 0,80. Já na disciplina Psicologia do Trabalho do mesmo curso, a média aritmética de todas as notas foi igual a 7,3, enquanto o desvio padrão foi de 0,76.

Em qual das duas disciplinas houve maior grau de dispersão?

(31)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão Atende ao Objetivo 4 Na tabela a seguir, você encontra a média aritmética e o desvio padrão das estaturas dos alunos de turmas do curso de Engenharia. Analisando os valores apresentados na tabela, diga qual das duas turmas (Mecânica ou Eletrotécnica) é mais homogênea em relação à altura dos alunos?

Turmas Número de alunos Média da altura dos alunos da classe Desvio padrão

Mecânica 85 160,6 cm 5,97 cm

Eletrotécnica 125 161,9 cm 6,01 cm

ATIVIDADE 5

RESUMINDO...

• As medidas de dispersão são utilizadas para determinar a homogeneidade ou hete-rogeneidade dos dados de determinado conjunto. Ou seja, elas demonstram o quanto os valores estão espalhados em torno da média aritmética.

• As medidas de dispersão mais comuns são: a variância, o desvio padrão, o coeficiente de variação e a amplitude total.

• A variância é uma medida que representa o quanto os dados de determinado conjunto estão dispersos (afastados) em relação à média aritmética.

• O desvio padrão nos informa a distância média em que os valores de determinado conjunto de dados estão em relação à média. O desvio padrão é a raiz quadrada da variância.

• O coeficiente de variação mostra a dispersão dos dados em relação ao termo médio de um conjunto: o coeficiente de variação é representado em % e, portanto, pode ser comparado com outros coeficientes de situações distintas.

(32)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão ATIVIDADE 1

Vamos resolver passo a passo:

1º passo – Calcular a média aritmética dos valores:

8 10 11 15 16 18 6

78 6 13

+ + + + + = =

2º passo – Calcular a dispersão (diferença) dos elementos (valores) em relação à média: 1º elemento: 8-13=-5 2º elemento: 10-13=-3 3º elemento: 11-13=-2 4º elemento: 15-13=2 5º elemento: 16-13=3 6º elemento: 18-13=5

3º passo – Calcular a soma dos quadrados dos valores encontrados anteriormente:

(-5)2+(-3)2+(-2)2+22+32+52 = 25+9+4+4+9+25=76

4º passo – Dividir o valor encontrado no passo anterior pelo número de elementos do conjunto (que é 6): 76÷6=12,67

Assim, a variância desse conjunto de dados vale 12,67.

Vejamos outra forma de calcular a variância de dados não agrupados com o uso do Pro-cesso Breve:

Monte a seguinte tabela:

Valores dos elementos Quadrados dos valores dos elementos

8 64 10 100 11 121 15 225 16 256 18 324 Total: 78 Total: 1.090

RESPOSTAS DAS ATIVIDADES

(33)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão

A variância é a diferença entre a razão do total da segunda coluna e o número de elementos e o quadrado da razão da primeira coluna e o número de elementos. Ou seja:

s s s s ² . ² . . ² . . ² = −  = − = − = 1 090 6 78 6 1 090 6 6 084 36 6 540 6 084 36 45 2 66 36 12 67 = , ATIVIDADE 2

Preenchendo a tabela auxiliar, temos:

Equipamento Freqüência 1ª coluna x 2ª coluna (1ª coluna)coluna2 x 2ª

1 2 2 2 2 5 10 20 3 8 24 72 4 6 24 96 5 3 15 75 6 1 6 36 Total 25 81 301

Para calcular a variância de dados agrupados sem intervalo de classes, usamos a seguinte fórmula: 2 2

4

2

3

2

s

coluna

coluna

a a coluna coluna a a = −





s s ² ² . = −  = − 301 25 81 25 301 25 6 561 625 2

(34)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão s s s = = = 2 479 33 21 89

s

, , ATIVIDADE 3

Preenchendo a tabela auxiliar, encontramos:

Classe Questões corretas (intervalo de classe) N° de alunos

(freqüência) médioPonto

Freqüência × Ponto médio Freqüência × Ponto médio² 1 30 50 2 40 80 3.200 2 50 70 8 60 480 28.800 3 70 90 12 80 960 76.800 4 90 110 10 100 1.000 100.000 5 110 130 5 120 600 72.000 Total 37 400 3.120 280.800

Para encontrar o desvio padrão, primeiro temos que calcular a variância. Para calcular a variância de dados agrupados em intervalo de classes, usamos a seguinte fórmula:

2 2

6

3

5

3

s

coluna

coluna

a a coluna coluna a a = −





= 280 800. −  .  37 3 120 37 2 s2= 7.589,19-(84,32) 2 s2= 7.589,19-7.109,86 s2= 479,33

Portanto, o desvio padrão é: σ

σ σ

(35)

la 1 5 • A p re n d e n d o s o b re m e d id as d e d is p e rs ão ATIVIDADE 4

Como foram dados os valores da média e do desvio padrão, podemos calcular o coeficiente de variação em cada caso e comparar os valores. Quanto maior o coeficiente de variação, mais disperso é o conjunto em relação à média.

Coeficiente de variação (CV) da disciplina Biossegurança:

CV desvio CV CV = × = × = _ , , , % 100 0 80 7 8 100 10 2

Coeficiente de variação (CV) da disciplina Psicologia do Trabalho:

CV desvio CV CV = × = × = _ , , , % 100 0 76 7 3 100 10 4

A disciplina que apresentou a maior dispersão foi aquela com o maior coeficiente de variação: Psicologia do Trabalho.

ATIVIDADE 5

O grupo mais homogêneo é o que apresenta os dados menos dispersos em relação à média; portanto, é o que apresenta o menor coeficiente de variação.

Coeficiente de variação (CV) da turma de Mecânica:

CV desvio CV CV CV = × = × = = _ , , , , % 100 5 97 160 6 100 0 0372 3 72 padrão média padrão média padrão média

(36)

Coeficiente de variação (CV) da turma de Eletrotécnica: CV desvio CV CV CV = × = × = = _ , , , , % 100 6 01 161 9 100 0 0371 3 71

A turma mais homogênea, ou seja, que apresentou a menor dispersão, foi aquela com o menor coeficiente de variação: Eletrotécnica.

padrão média

REFERÊNCIAS BIBLIOGRÁFICAS

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística básica. 5. ed. São Paulo: Saraiva, 2003.

MAGALHÃES, Marcos N.; LIMA, Antonio C. P. Noções de probabilidade

e estatística. 6. ed. São Paulo: EDUSP, 2005.

MARTINS, Gilberto A. Estatística geral e aplicada. 3. ed. São Paulo: Atlas, 2005.

MILONE, Giuseppe. Estatística geral e aplicada. São Paulo: Thomson Learning, 2003.

Referências

Documentos relacionados

Detectadas as baixas condições socioeconômicas e sanitárias do Município de Cuité, bem como a carência de informação por parte da população de como prevenir

Excluindo as operações de Santos, os demais terminais da Ultracargo apresentaram EBITDA de R$ 15 milhões, redução de 30% e 40% em relação ao 4T14 e ao 3T15,

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

5.2 Importante, então, salientar que a Egrégia Comissão Disciplinar, por maioria, considerou pela aplicação de penalidade disciplinar em desfavor do supramencionado Chefe

No geral, os clones CV-04, CV-10, CV-11 e CV-12 apresentaram elevada eficiência de absorção de P do solo (Tabela 2), levando a inferir que possuem valores inferiores de

Para preparar a pimenta branca, as espigas são colhidas quando os frutos apresentam a coloração amarelada ou vermelha. As espigas são colocadas em sacos de plástico trançado sem

A tem á tica dos jornais mudou com o progresso social e é cada vez maior a variação de assuntos con- sumidos pelo homem, o que conduz também à especialização dos jor- nais,

Com relação ao nível de desempenho técnico-tático das equipes de voleibol nas categorias de formação, considerando o sexo dos jogadores, as evidências