• Nenhum resultado encontrado

WILLIAM JOSÉ FERREIRA MARCELO DO NASCIMENTO SOUSA BENEDITO DO CARMO BATISTA GUIA DE ESTUDOS Nº 1 ESTATÍSTICA APLICADA À EDUCAÇÃO

N/A
N/A
Protected

Academic year: 2021

Share "WILLIAM JOSÉ FERREIRA MARCELO DO NASCIMENTO SOUSA BENEDITO DO CARMO BATISTA GUIA DE ESTUDOS Nº 1 ESTATÍSTICA APLICADA À EDUCAÇÃO"

Copied!
49
0
0

Texto

(1)

MARCELO DO NASCIMENTO SOUSA

BENEDITO DO CARMO BATISTA

GUIA DE ESTUDOS Nº 1

ESTATÍSTICA APLICADA À EDUCAÇÃO

Paracatu-MG Faculdade FINOM

(2)

Virgílio Eustáquio da Silva Presidente

Alcides Diniz da Silva Conselheiro

Gilberto Batista Diniz Conselheiro

FACULDADE DO NOROESTE DE MINAS – FINOM

Prof. Dsc. William José Ferreira Diretor Geral

Adm. Ananere da Silva Cruz Resende Diretora Administrativa-Financeira

Prof. Msc. Rilson Raimundo Pereira Diretor Acadêmico

CORPO EDITORIAL

Prof. Dsc. William José Ferreira

Prof. Msc. Marcelo do Nascimento Souza Prof. Esp. Benedito do Carmo Batista Prof. Msc. Rilson Raimundo Pereira

Profa. Msc. Maria Célia da Silva Gonçalves Prof. Esp. Anthonius Carneiro da Paixão

Revisão Ortográfica: Prof. Esp. Anthonius Carneiro da Paixão

Dados Internacionais de Catalogação na Publicação (CIP)

Ferreira, José William.

Estatística aplicada à educação / William José Ferreira, Marcelo do Nascimento Sousa, Benedito do Carmo Batista. – Paracatu: Faculdade FINOM, 2008.

46 p. : il. – (Guia de Estudos ; n. 1) ISBN 978-85-61515-00-3

1 Estatística. 2. Estatística – Análise – Educação. I. Sousa, Marcelo do Nascimento. II. Batista, Benedito do Carmo. III. Título.

(3)

PREFÁCIO... 1. INTRODUÇÃO... 1.1. Definições... 1.2. População e Amostra... 1.3. Variáveis... 2. SÉRIES ESTATÍSTICAS... 2.1. Classificação das Séries Estatísticas... 3. MÉTODOS GRÁFICOS... 3.1. Tipos de gráficos... 3.2. Gráfico de linha... 3.3. Gráfico de barras (ou colunas)... 3.4. Gráfico de setores... 3.5. Exemplos dos Gráficos... 4. DISTRIBUIÇÃO POR FREQÜÊNCIAS... 4.1. Definições... 5. MEDIDAS DE POSIÇÃO... 5.1. Média aritmética ( X )... 5.2. Moda (Mo)... 5.3. Mediana (Md)... 5.5. Dados Tabulados não Agrupados... 5.5.1. Média Aritmética ( X )... 5.5.2. Moda (Mo)... 5.5.3. Mediana (Md)... 5.6. Dados Tabulados Agrupados... 5.6.1. Média Aritmética ( X )... 5.6.2. Moda (Mo)... 5.6.3. Mediana (Md)... 6. MEDIDAS SEPARATRIZES... 6.1. Quartis... 6.2. Decis... 6.3. Percentis...

(4)

7.1 Amplitude ou intervalo total... 7.2 Desvio médio... 7.3. Variância e desvio-padrão... 7.4. Coeficiente de variação... 8. MEDIDAS DE ASSIMETRIA E CURTOSE... 8.1. Medida de Assimetria... 8.2. Medida de Curtose... 9. EXERCÍCIOS... 10. REFERÊNCIAS BIBLIOGRÁFICAS...

(5)

A Faculdade do Noroeste de Minas (FINOM) vem traçando objetivos a cada ano e, passo a passo, cumprindo e alcançando sua trajetória na formação de profissionais, contribuindo para a educação em nosso país. Neste momento, a Instituição dá mais um passo nesse sentido.

Através da publicação do livro Guia de Estatística Aplicada à Educação e da fundação da Editora FINOM, os autores demonstram suas preocupações com o futuro dos nossos educadores e alunos. Com este Guia, colocam à disposição dos docentes que trabalham na formação de professores e de respectivos alunos uma fonte com informações importantes e específicas, aplicada à área educacional. Um professor somente pode contribuir para a melhoria da educação de seus alunos, a partir do momento em que conhece os dados estatísticos da comunidade onde aplica seus conhecimentos e este Guia tem esta importante missão, que é a de orientar nessa direção.

Por que ressaltamos a sua importância no contexto educacional? É através da estatística que descrevemos, analisamos, induzimos ou estimamos dados sobre aspectos que influenciam a vida da população, empresas e mesmo nossas casas, através de tomadas de posições, sempre com base em dados passados. É, também, o meio pelo qual os cientistas se guiam para indicarem possíveis caminhos em busca de melhores soluções do que aquelas vividas no passado. A educação de hoje não é um desafio do futuro, como se ouve todos os dias das autoridades e dos educadores, mas de agora, porque a responsabilidade com o presente é uma constante. Cada autoridade e cada educador deve agir em seu tempo, com responsabilidade, e não apenas assistindo esse tempo passar, para que uma efetiva mudança ocorra. Isso é o que os autores deste guia estão fazendo, participando de maneira efetiva com o presente da educação, contribuindo para uma justiça social, cujo resultado é a liberdade e a independência de cada cidadão.

Este guia de estudos é o primeiro da Editora FINOM, portanto representa um marco na história da Instituição, uma vez que concretiza um antigo sonho dos seus gestores: produzir publicações acadêmicas de qualidade, capazes de promover o conhecimento que leva à aquisição dos saberes e, conseqüentemente, à transformação da sociedade.

Desta forma, acreditamos que o guia de estudos Estatística Aplicada à Educação irá contribuir, de maneira decisiva, para o estudo do assunto graças a sua linguagem clara, simples e direta, constituindo-se numa excelente fonte de consulta para educadores e demais profissionais da Educação.

(6)

dessa Instituição é uma honra e um grande desafio escrever o prefácio deste guia de estudos dos professores William José Ferreira, Marcelo do Nascimento Souza e Benedito do Carmo Batista, jovens educadores que se preocupam em oferecer um caminho na área da estatística, aos professores e alunos que se interessam por esse assunto.

Virgílio Eustáquio da Silva Presidente do Centro Brasileiro de Educação e Cultura (CENBEC)

Ananere da Silva da Cruz Rezende Diretora Administrativa-Financeira da Faculdade do Noroeste de Minas (FINOM)

(7)

1. INTRODUÇÃO

O entendimento dos conceitos básicos de estatística é fundamental para o estudo, interpretação e análise em todas as áreas do conhecimento. Desta forma, não é diferente no campo educacional. Para se compreender o desenvolvimento e prever novas estratégias de atuação, o educador deve possuir informações suficientes para tomada de decisões.

Sendo assim, apresenta-se neste guia os conceitos introdutórios e básicos para o estudo da estatística e sua aplicação na área educacional. Ao final do estudo deste conteúdo objetiva-se que o aluno objetiva-seja capaz de compreender as técnicas da estatística e aplicar objetiva-seus conceitos nas pesquisas da área educacional.

Pretende-se também iniciar uma série de publicações na Faculdade do Noroeste de Minas (FINOM) denominada Guia de Estudos, estimulando os professores e pesquisadores da FINOM a publicarem os conhecimentos e experiências adquiridos em sala de aula compartilhando-os, desta forma, com nossos alunos e facilitando cada vez mais o processo de ensino e aprendizagem.

Este material não objetiva substituir livros e aulas expositivas que são fundamentais para a consolidação do conhecimento, mas ser facilitador, substituindo materiais xerocopiados e apostilas muitas vezes inadequadas e desestimulantes para os estudantes.

Por fim, gostaríamos de agradecer o apoio de toda a direção da Faculdade FINOM na publicação deste material e especialmente ao Dr. Virgílio Eustáquio da Silva, Digníssimo Presidente do Centro Brasileiro de Educação e Cultura (CENBEC), entidade mantenedora da Faculdade FINOM por seu idealismo, persistência, luta, dedicação e por jamais deixar de acreditar na educação como único objeto transformador da sociedade e como agente propulsora da dignidade das pessoas de um país.

William José Ferreira Marcelo do Nascimento Sousa

Benedito do Carmo Batista

(8)

1.1. Definições

Serão apresentadas a seguir algumas definições básicas cujo entendimento é fundamental para a continuidade dos tópicos seguintes.

Definição 1: A Estatística trata dos métodos científicos para coleta, organização, descrição, análise e interpretação (conclusão) dos dados experimentais visando a tomada de decisões. “Estatística”, palavra de origem latina, significou por muito tempo “ciência dos negócios do Estado”.

A Estatística pode ser dividida basicamente em 3 etapas:

- 1ª etapa: Coleta de dados a partir de uma amostra escolhida da população. Para esta primeira etapa estudaremos as técnicas de Amostragem.

- 2ª etapa: Análise descritiva (ou Estatística Dedutiva), que envolve a parte de resumo e interpretação dos dados por meio de tabelas, gráficos e medidas descritivas (quantidades).

- 3ª etapa: Escolha de um possível modelo explicativo para o comportamento do objeto em estudo, afim de se fazer, numa etapa posterior, a análise confirmatória dos dados, conhecida como inferência (ou Estatística Indutiva). Para esta última etapa faz-se necessário a linguagem das probabilidades, para o esclarecimento de conclusões.

Definição 2: Estatística Descritiva é aquela que tem por objetivo descrever e analisar determinada população, sem pretender tirar conclusões de caráter mais genérico.

Definição 3: Estatística Indutiva é a parte da estatística que, baseando-se em resultados obtidos de uma amostra da população, procura induzir ou estimar as leis do comportamento da população da qual a amostra foi retirada.

1.2. População e Amostra

Ao se coletar dados sobre as características de um conjunto de elementos, como por exemplo, os brinquedos produzidos por uma indústria, os carros que passam por um determinado farol ou as preferências da população sobre candidatos a uma determinada eleição, nem sempre é possível considerar todos os elementos, ou seja, toda a população ou universo. Considera-se, então, apenas uma pequena parte do todo, chamada amostra. No caso da eleição, a população é formada por todos os cidadãos com direito a voto e a amostra é formada pelos eleitores que serão entrevistados.

Definição 4: População estatística é a coleção completa e total dos elementos (pessoas, medidas, itens, etc.) a serem considerados em um estudo estatístico.

(9)

Definição 5: Amostra é um subconjunto de uma população de interesse . O uso de amostras gera grande vantagens para os pesquisadores, pois reduz os custos uma vez que os dados são obtidos por uma pequena fração da amostra e também uma maior rapidez na obtenção de informações, pelo fato de que os dados apurados podem ser sintetizados mais rapidamente em uma amostra do que na população completa.

O procedimento de amostragem é uma das principais etapas para a tomada de decisões e consiste em técnicas de escolhas dos elementos da população que irão compor a amostra. Existem dois métodos de amostragem:

1) Amostragem Probabilística: quando todos os elementos da população possuem uma determinada probabilidade de serem selecionados.

2) Amostragem não probabilística: quando não se conhece a chance de um determinado objeto pertencer à amostra.

Nos estudos estatísticos a utilização de amostras probabilísticas é a melhor recomendação para se garantir uma melhor representatividade das amostras, pois o acaso será o único responsável por eventuais discrepâncias entre a amostra e a população. Os principais tipos de amostragem probabilísticas serão apresentadas a seguir:

1) Amostra aleatória simples: Neste tipo de amostragem os elementos são tirados ao acaso, sendo que cada um tem a mesma chance de ser sorteado. Estes sorteios são feitos com uso de fichas ou com auxílio de números aleatórios.

2) Amostragem Estratificada: Utilizada no caso de população heterogênea das quais podemos tirar subpopulações ou estratos onde se possa ter a máxima homogeneidade possível. As variáveis de estratificação mais comum são: classe social, idade, sexo, profissão ou qualquer outro atributo que revele heterogeneidade dentro da população.

3) Amostra Sistemática: Utilizada quando a população está ordenada segundo algum critério, como fichas em um fichário, lista telefônicas ou quando a amostra é escolhida por um sistema predeterminado. Por exemplo, escolher os itens múltiplos de 5 em um fichário ou entrevistar em uma empresa 1 a cada 10 empregados.

4) Amostragem por Conglomerado: Em alguns casos tem-se uma extrema dificuldade de se identificar os elementos da população. Neste caso os elementos de uma população são identificados por meios de subgrupos ou conglomerados heterogêneos que representam a população global, sendo que uma contagem completa deve ser feita para cada conglomerado. Por exemplo, em uma cidade no levantamento da população, podemos dispor de mapas indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Para obter uma melhor estimativa da quantidade de moradores da cidade, pode–se escolher uma

(10)

amostra de quarteirões e fazer a contagem completa de todos os que residem nos quarteirões sorteados. Outras aplicações são em zonas eleitorais para estimar quem será eleito.

1.3. Variáveis

Definição 6: Variável é, convencionalmente, o conjunto de resultados possíveis de um fenômeno.

Tipos de variáveis: - variável qualitativa (ou categórica); - variável quantitativa (ou numérica).

Definição 7: Variável qualitativa é quando seus valores são expressos por atributos. Tipos de variável qualitativa: - nominal;

- ordinal.

Variável qualitativa nominal: é uma variável que assume com possíveis valores, atributos ou qualidades que não apresentam uma ordem natural de ocorrência. Por exemplo: cor da pele (branca, preta, amarela, vermelha, parda, etc.); tipo de sangue (A, B, AB, O), etc.

Variável qualitativa ordinal: é uma variável que assume com possíveis valores, atributos ou qualidades que têm uma ordem natural de ocorrência. Por exemplo: grau de instrução, estado civil, sexo (masculino, feminino), etc.

Definição 8: Variável quantitativa é quando seus valores são expressos em números, por exemplo: salários dos operários, idade dos alunos de uma escola, peso, altura, número de filhos por família, etc.

Tipos de variável quantitativa: - discreta; - contínua.

- Variável quantitativa discreta: é uma variável que só pode assumir valores pertencentes a um conjunto enumerável, ou seja, só assume valores inteiros.

- Variável quantitativa contínua: é uma variável que pode assumir qualquer valor dentro de dois limites, ou seja, pode assumir valores “quebrados” (decimais).

2. SÉRIES ESTATÍSTICAS

Definição 9: Série Estatística é um tipo muito comum de tabelas. A Série Estatística constitui uma sucessão de dados relativos a uma ou mais variáveis.

(11)

a) corpo - conjunto de linhas e colunas que contém informações sobre a variável em estudo;

b) cabeçalho - parte superior da tabela que especifica o conteúdo das colunas; c) coluna indicadora - parte da tabela que especifica o conteúdo das linhas; d) linhas - retas imaginárias que facilitam a leitura, no sentido horizontal, de dados

que se inscrevem nos seus cruzamentos com as colunas; e) casa ou célula - espaço destinado a um só número;

f) título - conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela.

Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas e as chamadas, colocadas, de preferência, em seu rodapé.

Exemplo:

Número de vagas na graduação presencial oferecidas no vestibular em instituições públicas do Brasil

Ano Instituições Públicas

1994 177.453 1996 183.513 1998 205.725 2000 237.982 2002 263.572 Fonte: MEC/INEP/DAES

2.1. Classificação das Séries Estatísticas

Conforme varie um dos elementos da série, podemos classificá-la em histórica, geográfica e específica.

a) Séries históricas, cronólogicas ou temporais

Quando a variável for o tempo, como por exemplo: dias, meses, anos, etc. Exemplo:

Número de vagas na graduação presencial oferecidas no vestibular em instituições públicas do Brasil

Ano Instituições Públicas

1994 177.453

1996 183.513

1998 205.725

(12)

2002 263.572 Fonte: MEC/INEP/DAES

b) Séries geográficas, espaciais ou territoriais

Quando a variável for o local, como por exemplo: municípios, estados, países, etc. Exemplo:

Número de concluintes em cursos de graduação presenciais, em instituições federais - 2002 Regiões Concluintes Norte 7.387 Nordeste 20.292 Sudeste 22.261 Sul 12.462 Centro-Oeste 8.883 Fonte: MEC/INEP/DAES

c) Séries específicas ou categóricas

Quando a variável for a espécie ou a categoria, como por exemplo: tipos de instituições (municipal, estadual e federal), grau de escolaridade, nível social, etc.

Exemplo:

Número de instituições públicas de ensino superior no Brasil - 2002 Instituições Quantidade Federal 73 Estadual 65 Municipal 57 Fonte: MEC/INEP/DAES

c) Séries conjugadas - tabela de dupla entrada

São séries estatísticas que apresentam duas variáveis, podendo-se ter as seguintes combinações: geográfica-histórica, geográfica-específica e histórica-específica.

Exemplo:

Número de concluintes do ensino superior por categoria de instituição - 1998 a 2002

Ano Instituições Públicas Instituições Privadas

1998 105.360 195.401

1999 112.451 212.283

(13)

2001 132.616 263.372

2002 151.101 315.159

Fonte: MEC/INEP/DAES

3. MÉTODOS GRÁFICOS

O gráfico é uma forma de apresentar dados estatísticos que tem como objetivo facilitar a compreensão do fenômeno, por meio de um impacto visual de fácil entendimento do objeto em estudo, o que permite ao pesquisador visualizar os dados numéricos com imagens, aumentando assim a compreensão dos fenômenos em estudo.

3.1. Tipos de gráficos

Existem vários tipos de gráficos, os mais usados são: - Gráfico de linha;

- Gráfico de barras ou colunas;

- Gráfico de setores (ou gráfico de Pizza).

3.2. Gráfico de linha

Sempre que as categorias utilizadas representarem um intervalo de tempo, assim como acontece com os dados do exemplo 1, figura a, os mesmos podem ser descritos também por meio de um gráfico de linha. Um gráfico de linha retrata as mudanças nas quantidades com respeito ao tempo através de uma série de segmentos de reta.

3.3. Gráfico de barras (ou colunas)

O gráfico de barras representa, por meio de uma série de barras, quantidades para diferentes categorias de dados. O gráfico de barras está apresentado no exemplo 1, figura b. Observação: O gráfico de barras, quando as barras estão dispostas no sentido vertical, também é chamado de gráfico de colunas.

3.4. Gráfico de setores

O gráfico de setores, também conhecido como gráfico de Pizza é uma gráfico particularmente apropriado para representar as divisões de um montante total. Este tipo de gráfico encontra-se no exemplo 2.

Observação: O gráfico de setores somente poderá ser elaborado quando existe apenas uma variável.

(14)

3.5. Exemplos dos Gráficos

Exemplo 1: Evolução do número de instituições privadas de ensino superior no Brasil no período de 1980 a 1998, segundo dados do MEC/INEP/SEEC.

Ano Nº de instituições 1980 682 1981 617 1982 614 1983 615 1984 609 1985 626 1986 592 1987 613 1988 638 1989 682 1990 696 1991 671 1992 666 1993 652 1994 633 1995 684 1996 711 1997 689 1998 764

A partir dos dados acima, apresenta-se abaixo: a) um gráfico de linha;

b) um gráfico de barras (ou colunas);

(15)

Evolução do número de instituições privadas de ensino superior no Brasil no período de 1980 a 1998 550 600 650 700 750 800 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 Ano N ú m e ro d e i n s ti tu iç õ e s p ri v a d a s d e e n s in o s u p e ri o r b) Gráfico de Barras:

Evolução do número de instituições privadas de ensino superior no Brasil no período de 1980 a 1998 550 600 650 700 750 800 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 Ano N ú m e ro d e i n s ti tu iç õ e s p ri v a d a s d e e n s in o s u p e ri o r

Exemplo 2: Distribuição de instituições privadas de ensino superior no Brasil por regiões, no ano de 1998, segundo dados do MEC/INEP/SEEC.

Região Nº de instituições % BRASIL 764 100,00 Norte 28 3,66 Nordeste 80 10,47 Sudeste 487 63,74 Sul 93 12,17 Centro-Oeste 76 9,95

(16)

A partir dos dados acima, apresenta-se abaixo um gráfico de setores.

Distribuição de instituições privadas de ensino superior no Brasil, segundo as Regiões - 1998 Norte 4% Nordeste10% Sudeste 64% Sul 12% Centro-Oeste 10%

4. DISTRIBUIÇÃO POR FREQÜÊNCIAS

4.1. Definições

Definição 10: Dados brutos são originados diretamente da coleta de dados, não organizados numericamente.

Exemplo: Notas de 10 alunos em matemática

9 8 7 5 6 8 9 4 7 6

Definição 11: Rol é um conjunto de dados dispostos em ordem crescente ou decrescente. Exemplo: Altura dos alunos de uma determinada escola (cm)

146 148 149 150 150 151 151 151 152 152 153

154 155 155 155 155 156 158 158 159 160 161

162 162 164 164 167 169

Definição 12: Amplitude Total é a diferença entre o maior e o menor valor observados. Exemplo: AT = 169 - 146 = 23

(17)

Definição 13: Distribuição de freqüência é uma série que estabelece correspondência entre grupos de valores da variável (classes) e o número de vezes que a variável aparece em cada grupo (freqüência).

Exemplo:

Classes Freqüência (fi)

146 |--- 150 3 150 |--- 154 8 154 |--- 158 6 158 |--- 162 5 162 |--- 166 4 166 |--- 170 2 Somatório (Σ) 28

Definição 14: O Número de Classes é dado por K=1+ n , sendo n a quantidade de elementos do rol, no caso 28, ou seja o número total de observações. Outra maneira para se calcular o número de classes é dada pela fórmula de Sturges, que é: K=1+3,3logn. Para solução dos exercícios, será utilizada a fórmula dada por K=1+ n .

Exemplo:

K = 1 + 28 = 1 + 5,29 ≅ 6

Definição 15: Os Limites de Classes são os extremos de uma classe, sendo que o menor deles é o limite inferior e o maior é o limite superior.

Exemplo: Na classe do exemplo anterior temos: Limite Inferior → Li = 146

Limite Superior → Ls = 150

É importante destacar que nesta classe (146 |--- 150) serão compreendidos todos os valores entre 146 e 150, inclusive o 146 e exclusive o 150.

Definição 16: A Amplitude de Classe ou Intervalo de Classe é a diferença entre os limites. Exemplo: Ac ou h = 3,83 4 6 23 ≅ = = K AT

A partir dos conceitos definidos, a distribuição de freqüência utilizando-se os dados apresentados na definição do Rol, será da seguinte forma:

(18)

Estaturas dos alunos de uma determinada escola (cm)

Estaturas Freqüência (fi)

146 |--- 150 3 150 |--- 154 8 154 |--- 158 6 158 |--- 162 5 162 |--- 166 4 166 |--- 170 2 Somatório (Σ) 28

Definição 17: O Ponto Médio (Xi) é a média aritmética entre o limite inferior (Li) e o limite superior (Ls). Exemplo: Xi= 148 2 296 2 150 146 2 = = + = + Ls Li

Definição 18: Tipos de Freqüência

As freqüências podem ser classificadas da seguinte maneira:

- Freqüência Simples Absoluta (fi): são os valores que realmente representam o número de dados de cada classe.

- Freqüência Relativa Simples (fri): a freqüência relativa simples de uma classe é a razão entre a freqüência simples absoluta dessa classe e a soma ou total das freqüências simples. Assim, a freqüência relativa simples é obtida utilizando a seguinte fórmula: fri=

fi fi

. Normalmente, a freqüência relativa simples é apresentada de forma percentual, o que pode ser obtido facilmente multiplicando-se a fórmula anterior por 100, da seguinte maneira: fri=

fi fi

x100.

- Freqüência Acumulada (Fa): é a soma de cada freqüência com as que lhe são anteriores na distribuição.

- Freqüência Acumulada Crescente (Fac): A Freqüência Acumulada Crescente de uma classe é a soma da freqüência simples absoluta dessa classe com as seguintes.

- Freqüência Acumulada Decrescente (Fad): A Freqüência Acumulada Decrescente de uma classe é a soma da freqüência simples absoluta dessa classe com as das classes anteriores.

(19)

a) Determinar a Amplitude Total a partir do rol ou dados brutos. AT=maior valor observado - menor valor observado.

b) Determinar o número de classes. K=1+ n . c) Determinar a Amplitude ou Intervalo de Classe. h=

K AT

.

d) Elaborar a tabela, acrescentando as freqüências simples, acumuladas e o ponto médio.

A seguir, encontra-se a elaboração completa da tabela de distribuição de freqüência utilizando-se os dados apresentados na definição do Rol.

Estaturas dos alunos de uma determina escola (cm)

Estaturas fi Xi fri(%) fac fad

146 |--- 150 3 148 10,7 3 28 150 |--- 154 8 152 28,6 11 25 154 |--- 158 6 156 21,4 17 17 158 |--- 162 5 160 17,9 22 11 162 |--- 166 4 164 14,3 26 6 166 |--- 170 2 168 7,1 28 2 Somatório (Σ) 28 - 100,0 - -

Representação Gráfica de uma Distribuição de Freqüência:

- Histograma de Freqüência: Um histograma é um diagrama de barras de uma distribuição de freqüência com uma diferença: não há espaços entre as barras. Os intervalos de classe são colocados no eixo horizontal enquanto as freqüências são colocadas no eixo vertical. Segue abaixo o histograma da distribuição de freqüência.

Estaturas dos alunos de uma determina escola (cm)

0 1 2 3 4 5 6 7 8 9 146 |--- 150 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 Estaturas F re q ü ên ci a (f i)

(20)

- Polígonos de Freqüência: O polígono de freqüência é um gráfico de linha de uma distribuição de freqüência. Os eixos de um polígono de freqüência são similares ao do Histograma, exceto que no eixo horizontal são colocados os pontos médios de cada intervalo de classe. Segue abaixo o polígono de freqüência da distribuição.

5. MEDIDAS DE POSIÇÃO

Definição 19: As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. O grande objetivo das medidas de tendência central ou de posição é sintetizar a informação contida nos dados coletados da amostra. Assim, pretende-se substituir um conjunto de obpretende-servações por apenas uma que pretende-seja indicadora da tendência central dos dados. Uma medida de tendência central é realmente expressiva quando existe uma considerável concentração dos dados em torno dela.

Dentre as medidas de tendência central que caracterizam uma amostra, encontram-se : - a média aritmética;

- a moda; - a mediana.

As outras medidas de posição são as separatrizes, que englobam: - a própria mediana;

Estaturas dos alunos de uma determina escola (cm)

0 1 2 3 4 5 6 7 8 9 146 |--- 150 150 |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 Estaturas F re q ü ên ci a (f i)

(21)

- os quartis; - os decis; - os percentis.

Para Dados Não Agrupados

(Quando os dados não estiverem na forma de distribuição de freqüência)

5.1. Média Aritmética ( X )

É o quociente da divisão da soma dos valores (dados, observações) da variável pelo número deles: N x N x x x x X N i i n =

= + + + + = 1 2 3 ... 1 sendo: X = a média aritmética; i x = os valores da variável; N = o número de valores.

Exemplo: Determinar a média aritmética dos seguintes números: 18, 24, 25, 37 e 42. 2 , 29 5 146 5 42 37 25 24 18 = = + + + + = X

Outra média aritmética importante para a área de educação é a média aritmética ponderada. Neste caso os dados apresentam-se com pesos ou freqüências e o cálculo é feito por meio da média ponderada. Desta forma, a média aritmética ponderada de vários números x1, x2, x3, ..., xn, os quais são influenciados respectivamente por pesos p1, p2, p3, ..., pn, é igual

à soma dos produtos dos números pelos respectivos pesos divididos pela soma destes. Assim, a fórmula para a média ponderada pode ser descrita da seguinte maneira:

= = = + + + + + + + + = N i i N i i i n n n p p x p p p p p x p x p x p x p X 1 1 3 2 1 3 3 2 2 1 1 ... ...

Exemplo: Em um determinado concurso público, um certo candidato obteve os seguintes pontos: 1ª Prova - 17; 2ª Prova - 12; 3ª Prova - 15, 4ª Prova - 9; 5ª Prova - 10.

(22)

Sabe-se que a 1ª e a 5ª prova tiveram peso 2, a 2ª e a 4ª prova tiveram peso 1 e a 3ª prova teve peso 3. A partir destas informações, calcular a média final do candidato.

33 , 13 9 120 9 20 9 45 12 34 2 1 3 1 2 2 10 1 9 3 15 1 12 2 17 ≅ = + + + + = + + + + + + + + = x x x x x p X 5.2. Moda (Mo)

A moda de um conjunto de números é o valor que mais aparece em número de vezes. Um conjunto pode não ter moda (amodal), ter duas modas (bimodal) ou ter mais de duas modas (multimodal).

Exemplo 1: Para o conjunto de dados {10, 12, 12, 13, 13, 13, 14, 15, 15}, como o número 13 aparece mais vezes (3 vezes), então a moda (Mo)=13.

Exemplo 2: Para o conjunto de dados {2, 2, 3, 3, 4, 4, 5, 5}, como todos os números aparecem a mesma quantidade de vezes (2 vezes), então não existe a moda, assim a moda (Mo)=amodal.

Exemplo 3: Para o conjunto de dados {5, 6, 6, 7, 8, 9, 9, 10}, como os números 6 e 9 aparecem mais vezes (2 vezes cada), então existem duas modas, assim a moda (Mo)=6 e 9 (bimodal).

Exemplo 4: Para o conjunto de dados {11, 14, 14, 16, 17, 18, 18, 19, 20, 20}, como os números 14, 18 e 20 aparecem mais vezes (2 vezes cada), então existem mais de duas modas, assim a moda (Mo)=14, 18 e 20 (multimodal).

5.3. Mediana (Md)

Colocados os dados em ordem crescente, a mediana é o elemento que ocupa a posição central.

Observação: - Se o nº de elementos for ímpar, então a mediana será exatamente o valor “do meio”.

Exemplo: Considerando o seguinte conjunto de dados {8, 15, 18, 20, 21, 25, 27}, a mediana (Md)=20.

- Se o nº de elementos for par, então a mediana será exatamente a média “dos dois valores do meio”.

Exemplo: Considerando o seguinte conjunto de dados {26, 31, 36, 39, 42, 46}, a

mediana (Md)= 37,5 2 75 2 39 36 = = + .

(23)

Para Dados Agrupados

(Quando os dados estiverem na forma de distribuição de freqüência)

Quando os dados estiverem agrupados, ou seja, na forma de distribuição de freqüências a forma de calcular as medidas de tendência central são diferentes.

5.5. Dados Tabulados não Agrupados

5.5.1. Média Aritmética ( X )

Se os números x1, x2, x3, ..., xn aparecem em números de vezes iguais a f1, f2, f3, ..., fn,

então a fórmula para se calcular a média aritmética será:

= = = N i i N i i i f f x X 1 1 .

Exemplo: Considerando os dados tabulados abaixo, calcular a média aritmética.

xi fi xi fi 12 3 12 x 3 = 36 16 2 16 x 2 = 32 20 4 20 x 4 = 80 22 1 22 x 1 = 22 28 2 28 x 2 = 56 Somatório (Σ) 12 226 83 , 18 12 226 ≅ = X 5.5.2. Moda (Mo)

Nesse caso, a moda é o valor de maior freqüência.

Exemplo: Considerando os dados tabulados abaixo, encontrar a moda.

xi fi 1 4 2 3 3 4 4 5 5 1 6 2 Somatório (Σ) 18 Mo=4

(24)

5.5.3. Mediana (Md)

- Se o número de elementos for ímpar:

xi fi Fac 21 2 2 22 4 6 25 5 11 27 3 14 29 1 15 Somatório (Σ) 15 - EMD= = = + 2 16 2 1 15 8º elemento ⇒ Md=25

- Se o número de elementos for par:

xi fi Fac 10 7 7 12 8 15 15 10 25 18 3 28 20 2 30 Somatório (Σ) 30 - EMD= = 2 30 15º elemento e EMD= +1=15+1= 2 30 16º elemento ⇒ Md= 13,5 2 27 2 15 12 = = +

5.6. Dados Tabulados Agrupados

5.6.1. Média Aritmética ( X )

A fórmula utilizada para o cálculo da média, quando os dados tabulados estão agrupados em classes é:

= = = N i i N i i i f f X X 1 1

, onde Xi é o Ponto Médio.

Exemplo: Considerando os dados agrupados em classe, apresentados abaixo, calcular a média aritmética.

(25)

Classes fi Xi Xifi 3 |--- 6 12 4,5 4,5x12=54 6 |--- 9 18 7,5 7,5x18=135 9 |--- 12 20 10,5 10,5x20=210 12 |--- 15 10 13,5 13,5x10=135 15 |--- 18 5 16,5 16,5x5=82,5 18 |--- 21 3 19,5 19,5x3=58,5 Somatório (Σ) 68 - 675,0 93 , 9 68 675 ≅ = X 5.6.2. Moda (Mo)

Chama-se "classe modal" a classe de maior freqüência e a moda bruta refere-se ao seu ponto médio. Para se calcular a moda quando os dados tabulados estão agrupados em classes pode-se utilizar a fórmula de Czuber, conforme apresentado abaixo:

(

)

(

fant fpost

)

xfmo fant fmo h li Mo + − − + = 2 onde:

li = limite inferior da classe modal; h = intervalo da classe modal;

fmo = freqüência simples da classe modal; fant = freqüência simples da classe anterior; fpost = freqüência simples da classe posterior.

Exemplo: Determinar a moda da distribuição de freqüência abaixo:

Classes fi 5 |--- 10 4 10 |--- 15 8 15 |--- 20 7 20 |--- 25 5 25 |--- 30 3 Somatório (Σ) 27

(

)

(

)

5 10 4 14 20 10 11 16 4 5 10 7 4 8 2 4 8 5 10 = + = + = − + = + − − + = x x x Mo 5.6.3. Mediana (Md)

(26)

Chama-se "classe mediana" a classe que contém a mediana que é o elemento de ordem

2 n

(nesse caso não se faz distinção se n for par ou ímpar). Para o cálculo da mediana utilizada a seguinte fórmula:

(

)

MD ant MD f Fac E hx li Md= + − onde:

li = limite inferior da classe mediana; h = intervalo da classe mediana;

EMD = elemento da classe mediana, calculado da seguinte forma:

2 N EMD = ; Facant = freqüência acumulada crescente anterior da classe mediana;

fMD = freqüência simples da classe mediana.

Exemplo: Determinar a mediana da distribuição de freqüência abaixo:

Classes fi Fac 5 |--- 10 4 4 10 |--- 15 8 12 15 |--- 20 7 19 20 |--- 25 5 24 25 |--- 30 3 27 Somatório (Σ) 27 -

(

)

94 , 15 94 , 5 10 8 5 , 47 10 8 5 , 9 5 10 8 4 5 , 13 5 10+ − = + = + = + ≅ = x x Md 6. MEDIDAS SEPARATRIZES

Definição 20: São medidas que dividem a distribuição em partes eqüipotentes. As principais medidas separatrizes são:

- a mediana (já apresentada anteriormente); - os quartis;

- os decis;

(27)

6.1. Quartis

Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis:

- O primeiro quartil (Q1) : é o valor situado de tal modo na série que uma

quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores.

- O segundo quartil (Q2) : é exatamente o valor da mediana, ou seja, o valor

situado de tal modo na série que deixa metade (50%) dos dados à esquerda dele e a outra metade à direita (Q2=Md).

- O terceiro quartil (Q3): é o valor situado de tal modo na série que as três

quartas partes (75%) dos dados são menores que ele e uma quarta parte restante (25%) é maior.

A seguir serão apresentadas as fórmulas para os cálculos de quartis para o caso de variáveis contínuas e quando os dados não estão agrupados em uma tabela de freqüência. Q1 = 1º Quartil = n x 0,25, indica que 25% das observações estão nele ou abaixo dele e,

75% das observações estão nele ou acima dele.

Q2 = 2º Quartil = Mediana = n x 0,50, indica que 50% das observações estão nele ou abaixo

dele e, 50% das observações estão nele ou acima dele.

Q3 = 3º Quartil = n x 0,75, indica que 75% das observações estão nele ou abaixo dele e,

25% das observações estão nele ou acima dele.

A seguir serão apresentadas as fórmulas para os cálculos de quartis para o caso de variáveis contínuas e com os dados agrupados em uma tabela de freqüência.

Determinação de Q1: C f Fa n li Q Q Q Q . 4 1 1 1 1             − + = em que: 1 Q

(28)

1

Q

Fa : é a freqüência acumulada das classes anteriores à classe que contém Q1;

1

Q

f : é a freqüência da classe que contém Q1;

C: é a amplitude da classe que contém Q1.

Determinação de Q2: C f Fa n li Q Q Q Q . 4 2 2 2 2 2             + = em que: 2 Q

li : é o limite inferior da classe que contém Q2;

2

Q

Fa : é a freqüência acumulada das classes anteriores à classe que contém Q2;

2

Q

f : é a freqüência da classe que contém Q2;

C: é a amplitude da classe que contém Q2.

Determinação de Q3: C f Fa n li Q Q Q Q . 4 3 3 3 3 3             + = em que: 3 Q

li : é o limite inferior da classe que contém Q3;

3

Q

Fa : é a freqüência acumulada das classes anteriores à classe que contém Q3;

3

Q

f : é a freqüência da classe que contém Q3;

C: é a amplitude da classe que contém Q3.

6.2. Decis

Os decis por sua vez, são os dez valores que dividem a série em 10 partes iguais, onde, cada uma delas contém 10% dos dados.

Considerando-se os dados não agrupados em uma tabela, os decis são determinados da seguinte forma:

(29)

D1 = 1º Decil = n x 0,10, indica que 10% das observações estão nele ou abaixo dele e,

90% das observações estão nele ou acima dele.

D8 = 8º Decil = n x 0,80, indica que 80% das observações estão nele ou abaixo dele e,

20% das observações estão nele ou acima dele.

Quando os dados estão agrupados em uma tabela, os decis são determinados pela seguinte equação: C f Fa ixn li D i i i D D D i . 10             + = onde: i D

li : é o limite inferior da classe que contém Di;

i

D

Fa : é a freqüência acumulada das classes anteriores à classe que contém Di;

i

D

f : é a freqüência da classe que contém Di;

C: é a amplitude da classe que contém Di..

6.3. Percentis

Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais, ou seja:

P1, P2, P3, ..., P99, onde P50=Md=Q2=D5, P25=Q1 e P75=Q3

Considerando-se os dados não agrupados em uma tabela, os percentis são determinados da seguinte forma:

P20% = n x 0,20, indica que 20% das observações estão nele ou abaixo dele e, 80% das

observações estão nele ou acima dele.

P65% = n x 0,65, indica que 65% das observações estão nele ou abaixo dele e, 35% das

observações estão nele ou acima dele.

Quando os dados estão agrupados em uma tabela, os percentis são determinados pela seguinte equação:

(30)

C f Fa ixn li P i i i P P P i . 100             + = onde: i P

li : é o limite inferior da classe que contém Pi;

i

P

Fa : é a freqüência acumulada das classes anteriores à classe que contém Pi;

i

P

f : é a freqüência da classe que contém Di;

C: é a amplitude da classe que contém Di.

Exemplo (para dados não agrupados): Em uma classe de 20 alunos as notas, de 0 a 10, em uma prova de matemática foram: 7; 6 ; 3; 8; 10; 2; 9; 9; 6; 8; 5; 2; 0; 1; 7; 4; 4; 6; 8; 5. Determine os quartis, os decis 3 e 6 e os percentis 75% e 95%.

Dados Ordenados (Rol):

0; 1; 2; 2; 3; 4; 4; 5; 5; 6; 6; 6; 7; 7; 8; 8; 8; 9; 9; 10 Quartis:

Q1 = n x 0,25 = 20 x 0,25 = 5ª observação = 3 → 25% das notas foram, no máximo, 3.

Q2 = n x 0,50 = Mediana = 20 x 0,50 = 10ª observação = 6 → 50% das notas foram, no

máximo, 6.

Q3 = n x 0,75 = 20 x 0,75 = 15ª observação = 8 → 75% das notas foram, no máximo,

8.

Decis 3 e 6:

D3 = n x 0,30 = 20 x 0,30 = 6ª observação = 4 → 30% das notas foram, no máximo, 4.

D6 = n x 0,60 = 20 x 0,60 = 12ª observação = 6 → 60% das notas foram, no máximo,

6.

Percentis 75% e 95%:

P75% = n x 0,75 = 20 x 0,75 = 15ª observação = 8 → 75% das notas foram, no máximo,

8.

P95% = n x 0,95 = 20 x 0,95 = 19ª observação = 9 → 95% das notas foram, no máximo,

9.

Exemplo (para dados agrupados): Utilizando-se o mesmo conjunto de dados, do exemplo para dados não agrupados, tem-se:

(31)

Dados Ordenados (Rol):

0; 1; 2; 2; 3; 4; 4; 5; 5; 6; 6; 6; 7; 7; 8; 8; 8; 9; 9; 10 Amplitude Total (AT):

AT = 10 – 0 = 10 Número de Classes (K): 6 47 , 4 1 20 1+ = + ≅ = K

Amplitude de Classe ou Intervalo de Classe (h): 2 6 10 ≅ = = K AT h Distribuição de Freqüência:

Notas de 20 alunos em matemática

Classes Freqüência (fi) Xi fri(%) Fac Fad

0 |-- 2 2 1 10 2 20 2 |-- 4 3 3 15 5 18 4 |-- 6 4 5 20 9 15 6 |-- 8 5 7 25 14 11 8 |-- 10 5 9 25 19 6 10 |-- 12 1 11 5 20 1 Somatório (Σ) 20 - 100 - - Quartis: 4 2 2 2 . 3 3 2 2 . 3 2 5 2 2 . 3 2 4 20 2 1  = + =    + =     − + =             + = Q 4 , 6 5 32 5 2 30 5 2 6 2 . 5 1 6 2 . 5 9 10 6 2 . 5 9 4 40 6 2 . 5 9 4 20 2 6 2 = = + = + = =     + =     − + =             + =             + = x Q 4 , 8 5 42 5 2 40 5 2 8 2 . 5 1 8 2 . 5 14 15 8 2 . 5 14 4 60 8 2 . 5 14 4 20 3 8 3 = = + = + = =     + =     − + =             + =             + = x Q Decis 3 e 6:

(32)

5 , 4 4 18 4 2 16 4 2 4 2 . 4 1 4 2 . 4 5 6 4 2 . 4 5 10 60 4 2 . 4 5 10 20 3 4 3 = = + = + = =     + =     − + =             − + =             − + = x D 2 , 7 5 36 5 6 30 5 6 6 2 . 5 3 6 2 . 5 9 12 6 2 . 5 9 10 120 6 2 . 5 9 10 20 6 6 6 = = + = + = =     + =     − + =             + =             + = x D 2 , 7 5 36 5 6 30 5 6 6 2 . 5 3 6 2 . 5 9 12 6 2 . 5 9 10 120 6 2 . 5 9 10 20 6 6 6 = = + = + = =     + =     − + =             + =             + = x D Percentis 75% e 95%: 4 , 8 5 42 5 2 40 5 2 8 2 . 5 1 8 2 . 5 14 15 8 2 . 5 14 100 1500 8 2 . 5 14 100 20 75 8 % 75 = = + = + = =     + =     − + =             + =             + = x P 10 2 8 2 . 5 5 8 2 . 5 14 19 8 2 . 5 14 100 1900 8 2 . 5 14 100 20 95 8 % 95 = + = =     + =     − + =             + =             + = x P 7. MEDIDAS DE DISPERSÃO

A utilização de uma medida de posição para analisar uma série de dados às vezes não apresenta uma noção satisfatória do comportamento destes dados, devido à variabilidade dos mesmos em torno da média. Sendo assim, utiliza-se medidas de dispersão para avaliar o grau de variabilidade desses valores da série em torno da média.

(33)

A = 10, 10, 10 , 10 , 10 , 10 , 10 ,10 B = 1, 8, 10, 10, 11, 12, 18

C= 1, 2, 10, 10, 10 , 13, 24

Calculando a média aritmética, mediana e moda, desses três conjuntos tem-se

A B C A B C A B C = = 10 unidades Md = Md = Md = 10 unidades Mo = Mo = Mo = 10 unidades X = X X

Observa-se que os três conjuntos de dados (A, B, C) apresentam a mesma média, mediana e moda. No entanto, esses conjuntos são bem diferentes entre si, pois enquanto no conjunto A os dados são homogêneos, os demais são heterogêneos, apresentando uma certa variação, sendo que o conjunto C é o que apresenta uma maior variação dos dados. Conclui-se portanto que as medidas de posição não são capazes de sintetizar e avaliar sozinhas com eficiência a informação da homogeneidade de um conjunto de dados, por isso é necessária a utilização de medidas de dispersão para analisar o comportamento dos dados em torno da medida de posição em estudo.

As medidas de dispersão mais utilizadas são: - Amplitude ou intervalo total;

- Desvio médio; - Variância.

7.1. Amplitude ou Intervalo Total

Amplitude ou intervalo é simbolizada por R, e definida como a diferença entre o maior e o menor valor observado no conjunto de dados.

A=R=maior valor−menor valor Esta é uma medida de dispersão muito limitada, pois sendo uma medida que apenas depende dos valores extremos, é instável, não sendo afetada pela dispersão dos demais valores da amostra.

7.2. Desvio Médio

Para se ter uma boa medida de dispersão deve-se levar em consideração todos os valores do conjunto. Uma medida que leva em consideração todos os valores do conjunto é o desvio, que é tomado em relação ao desvio de todas as observações em relação a média do conjunto. Usando-se qualquer conjunto de dados a soma dos desvios é sempre nula. Isto

(34)

acontece porque existem valores negativos e positivos de desvios que, quando somados, se anulam. 1 1 ( ) sendo n i n i i i X desvio D X X X n = = = =

− =

onde: n : tamanho da amostra; i

X : i-ésimo valor da amostra; X : média da amostra.

Uma maneira de resolver este problema é tomar valores absolutos dos desvios. Desta maneira, tem-se a expressão: 1 ( ) n i i D X X = =

− Pelo fato de amostras de tamanhos diferentes, com a mesma dispersão, apresentarem desvios diferentes, o desvio precisa ser ponderado por n. Assim, temos o desvio médio, que é a média

aritmética dos valores absolutos dos desvios em torno da média.

1 sendo n i n i i i X X X DM X n n = −

=

=

, desvio médio para dados não agrupados em

classes.

Para dados agrupados utiliza-se a seguinte expressão para cálculo do desvio médio:

= = − = n i i n i i i f X X f DM 1 1 , sendo

= = = n i i n i i i f f X X 1 1 7.3. Variância e Desvio-Padrão

Uma outra forma de resolver o problema da soma dos desvios em torno da média ser nulo, é elevar a equação do desvio ao quadrado. Elevando-se cada desvio ao quadrado tem-se somente termos positivos. Portanto, temos um somatório diferente de zero. Dividindo-se este somatório dos desvios ao quadrado pelo número de observações de uma população, obtém-se a variância populacional que é representada pela equação a seguir:

2 2 1 ( ) n i i X X n

σ

= − =

(35)

O desvio-padrão é a mais empregada medida de dispersão, sendo calculado obtendo-se a raiz quadrada da variância.

2 1 ( ) n i i X X n

σ

= − =

Para dados agrupados em classes utiliza-se as seguintes equações para o cálculo da variância e desvio-padrão para uma certa população:

(

)

= = − = n i i n i i i f X X f 1 2 1 2

σ

(

)

= = − = n i i n i i i f X X f 1 2 1

σ

Quando estivermos trabalhando com amostras, o denominador das equações será n-1 (número de observações menos 1) que é denominado grau de liberdade.

(

)

1 2 1 2 − − =

= n X X s n i i

(

)

1 2 1 − − =

= n X X s n i i

A seguir serão apresentadas as equações para o cálculo de variância e desvio-padrão para dados agrupados.

(

)

      − − =

= = 1 1 2 1 2 n i i n i i i f X X f s

(

)

      − =

= = 1 1 2 1 n i i n i i i f X X f s

(36)

7.4. Coeficiente de Variação

O desvio-padrão e a variância são medidas de dispersão absolutas. Isto posto, somente podem ser utilizados para comparar a variabilidade de dois ou mais conjuntos de dados que possuem a mesma média, mesmo número de observações e estiverem expressos na mesma unidade. Por isso, possui grandes limitações. Assim, quando desejamos comparar variabilidade de qualquer conjunto de dados, devemos utilizar uma medida relativa denominada CVP.

100 . X CVp = σ

O resultado neste caso é expresso em percentual. Entretanto, pode ser expresso também por meio de um fator decimal, desprezando assim o valor 100 da fórmula.

Exemplo (para dados não agrupados): Em uma avaliação final da disciplina de português, as notas de 20 alunos, de 0 a 10, foram: 6; 2; 5; 1; 9; 8; 6; 7; 10; 4; 3; 4; 1; 0; 9; 3; 2; 4; 8; 6. Calcule a amplitude ou intervalo local, o desvio-médio, a variância e o desvio-padrão.

Dados Ordenados (Rol):

0; 1; 1; 2; 2; 3; 3; 4; 4; 4; 5; 6; 6; 6; 7; 8; 8; 9; 9; 10

Amplitude ou Intervalo Total: A = 10 – 0 = 10 Desvio-Médio: 5 , 2 20 50 1 = = − =

= n X X DM n i i 9 , 4 20 98 20 10 ... 1 1 0 1 = + + + + = = =

= n X X n i i 50 9 , 4 10 ... 9 , 4 1 9 , 4 1 9 , 4 0 1 = − + + − + − + − = −

= n i i X X n = 20

(37)

Variância:

(

)

n X X n i i 2 1 2

= − = σ

(

)

(

0 4,9

) (

2 1 4,9

) (

2 1 4,9

)

2 ...

(

10 4,9

)

2 167,8 1 2 = − + + − + − + − = −

= n i i X X n = 20 39 , 8 20 8 , 167 2 = = σ Desvio-Padrão:

(

)

90 , 2 39 , 8 2 1 = − =

= n X X n i i

σ

Coeficiente de Variação: % 18 , 59 100 . 9 , 4 9 , 2 100 . = ≅ = X CVp

σ

Exemplo (para dados agrupados): Utilizando-se o mesmo conjunto de dados para dados agrupados, tem-se:

Dados Ordenados (Rol):

0; 1; 1; 2; 2; 3; 3; 4; 4; 4; 5; 6; 6; 6; 7; 8; 8; 9; 9; 10 Amplitude Total (AT):

AT = 10 – 0 = 10 Número de Classes (K): 6 47 , 4 1 20 1+ = + ≅ = K

Amplitude de Classe ou Intervalo de Classe (h): 0 , 2 6 10 ≅ = = K AT h Distribuição de Freqüência:

(38)

Classes Freqüência (fi) Xi fri(%) Fac Fad 0 |-- 2 3 1 15 3 20 2 |-- 4 4 3 20 7 17 4 |-- 6 4 5 20 11 13 6 |-- 8 4 7 20 15 9 8 |-- 10 4 9 20 19 5 10 |-- 12 1 11 5 20 1 Somatório (Σ) 20 - 100 - -

Amplitude ou Intervalo Total: A = 10 -0 = 10 Desvio-Médio:

= = − = n i i i n i i f X X f DM 1 1

( ) ( ) (

) (

) (

) (

)

1 4 4 4 4 3 1 11 4 9 4 7 4 5 4 3 3 1 1 1 + + + + + + + + + + = =

= = x x x x x x f f X X n i i n i i i 5 , 5 20 110 20 11 36 28 20 12 3 = = + + + + + = X 55 , 2 20 51 20 5 , 5 14 6 2 10 5 , 13 20 5 , 5 11 1 5 , 5 9 4 5 , 5 7 4 5 , 5 5 4 5 , 5 3 4 5 , 5 1 3 = = + + + + + = − + − + − + − + − + − = DM Variância:

(

)

= = − = n i i i n i i f X X f 1 2 1 2

σ

(

)

(

)

(

)

(

)

75 , 8 20 175 20 5 , 5 11 1 ... 5 , 5 5 4 5 , 5 3 4 5 , 5 1 3 2 2 2 2 2 = − + − + − + + − = = σ Desvio-Padrão:

(

)

= = − = n i i i n i i f X X f 1 2 1

σ

(39)

96 , 2 75 , 8 ≅ =

σ

Coeficiente de Variação: 100 . X CVp = σ % 19 , 53 100 . 5 , 5 96 , 2 ≅ = p CV

8. MEDIDAS DE ASSIMETRIA E CURTOSE 8.1. Medida de assimetria

A medida de assimetria é o grau dos desvios ou afastamentos da simetria de uma distribuição. Para ser simétrica a distribuição deve admitir um eixo de simetria que passa por sua média e coincida com sua mediana. A distribuição pode ser:

1) Simétrica, quando a curva de freqüência da distribuição se coincide com as medidas de tendência central, ou seja, = Md = Moµ .

2) Assimétrica à direita, se a curva de freqüência da distribuição tem a calda mais alongada à direita e > Md > Moµ .

(40)

3) Assimétrica à esquerda, se a curva de freqüência da distribuição tem a calda mais alongada à esquerda e < Md <Moµ .

Para classificar a distribuição quanto à simetria utiliza-se vários métodos, sendo que o mais utilizado é o coeficiente de simetria, que é dado pela equação:

3 3 σ

M CS =

onde M3 é o momento estatístico de ordem 3 e é calculado pela seguintes equações:

- Para dados não agrupados:

3 1 3 ( ) n i i X X M n = − =

onde: n: tamanho da amostra; : i

X i-ésimo valor da amostra; :

X média da amostra.

- Para dados agrupados em classes:

(

)

= = − = n i i i n i i f X X f M 1 3 1 3 e σ é o desvio-padrão da distribuição.

Tem-se o seguinte critério de classificação, se: Cs = 0 a distribuição é simétrica perfeita.

Cs > 0 a distribuição é assimétrica à direita.

(41)

8.2. Medida de Curtose

Denomina-se curtose o grau de achatamento de uma curva de freqüência da distribuição. Estas curvas podem ser classificadas em leptocúrticas (mais afiladas), platicúrticas (mais achatadas) ou mesocúrticas quando tiverem o mesmo grau de achatamento de uma curva normal.

Existem varias maneiras de analisar o momento de curtose, sendo que o mais utilizado é o coeficiente momento de curtose α4, calculado da seguinte forma:

4 4 4

σ

α = M

onde M4 é o momento estatístico de ordem 4 e é calculado pela seguintes equações:

- Para dados não agrupados:

4 1 4 ( ) n i i X X M n = − =

onde: n: tamanho da amostra; : i

X i-ésimo valor da amostra; :

X média da amostra.

- Para dados agrupados em classes:

(

)

= = − = n i i i n i i f X X f M 1 4 1 4

e σ é o desvio padrão da distribuição.

Tem-se o seguinte critério de análise, se: α4

= 3 a curva é mesocúrtica.

α4

(42)

α4

> 3 a curva é leptocúrtica.

Exemplo: Em uma avaliação final da disciplina de geografia, as notas de 20 alunos, de 0 a 10, foram: 7; 3; 2; 5; 9; 8; 10; 1; 6; 8; 6; 0; 7; 4; 4; 9; 8; 7; 7; 6. Classificar a distribuição quanto à simetria utilizando o coeficiente de simetria e classificar o momento de curtose, por meio do coeficiente momento de curtose.

Coeficiente de Simetria:

(

)

19,47 0,61 89 , 11 69 , 2 89 , 11 3 3 3 == = σ M CS

(

)

(

) (

) (

)

(

)

20 85 , 5 6 ... 85 , 5 2 85 , 5 3 85 , 5 7 3 3 3 3 1 3 3 − + + − + − + − = − =

= n X X M n i i 89 , 11 20 89 , 238 − ≅ − = 85 , 5 20 117 20 6 ... 2 3 7 1 = + + + + = = =

= n X X n i i

(

)

(

) (

) (

)

(

)

20 85 , 5 6 ... 85 , 5 2 85 , 5 3 85 , 5 7 2 2 2 2 1 2 − + + − + − + − = − =

= n X X n i i σ 69 , 2 23 , 7 20 55 , 144 ≅ = =

(43)

Coeficiente Momento de Curtose:

(

)

52,36 2,48 94 , 129 69 , 2 94 , 129 4 4 4 4 = = = σ α M

(

)

(

) (

) (

)

(

)

20 85 , 5 6 ... 85 , 5 2 85 , 5 3 85 , 5 7 4 4 4 4 1 4 4 − + + − + − + − = − =

= n X X M n i i 94 , 129 20 74 , 2598 ≅ = 69 , 2 = σ

Como α4 < 3 a curva é platicúrtica.

9. EXERCÍCIOS

1) Classifique as variáveis em qualitativas ou quantitativas (discretas ou contínuas) a) cor dos olhos;

b) número de filhos;

c) o ponto obtido em uma jogada; d) número de peças produzidas por hora; e) diâmetro externo.

(44)

a) Estatística;

b) Variável, variável quantitativa e variável qualitativa; c) População;

d) Amostra.

3) Idealize uma tabela de série estatística com as seguintes classificações: a) histórica; b) geográfica; c) específica; d) geográfica-histórica; e) geográfica-específica. Utilize dados fictícios.

4) Procure exemplos de séries estatísticas em jornais e revistas e transcreva-os, classificando essas séries.

5) No rol abaixo tem-se as notas em Português, referentes ao 3º bimestre da série X, da escola Y, da cidade de Paracatu-MG, no ano de 2006.

12 14 14 15 15 16 16 16 17 17 17 18

18 19 19 20 20 21 22 22 23 23 24 25

26 26 27 29

Considerando-se os dados apresentados acima, pede-se:

a) Elaborar uma distribuição de freqüência com o limite inferior da 1ª classe igual a 12;

b) Determinar o ponto médio das classes;

c) Determinar as freqüências relativas simples das classes (percentual);

d) Determinar as freqüências acumuladas crescentes e decrescentes das classes.

6) Dadas as notas de 50 alunos, determine os pedidos. Notas: 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 41 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 Pede-se:

(45)

b) número de classes; c) amplitude das classes;

d) freqüência absoluta das classes; e) freqüência relativa (%);

f) ponto médio;

g) freqüência acumulada crescente; h) freqüência acumulada decrescente.

7) Sabendo-se que as notas de um determinado aluno na disciplina de Geografia foram 4, 5, 6, 6, 7, 7, 7, 9, 9, determine a média aritmética, a moda e a mediana para este conjunto de dados.

8) Sabendo-se que as idades de um conjunto de crianças são 3, 3, 4, 4, 5, 5, 6, 7, 8, 9, determine a média aritmética, a moda e a mediana para este conjunto de dados.

9) Considerando-se que um determinado professor aplicou 5 provas, atribuindo os seguintes pesos: a 1ª e a 2ª prova tiveram pesos 1, a 3ª e a 4ª prova tiveram pesos 2 e a 5ª prova teve peso 4. Sabendo-se que um determinado aluno obteve as seguintes notas: 9, 8, 7, 7 e 5; calcular a média aritmética ponderada para as notas deste aluno.

10) Dada a distribuição abaixo, referente às notas de um grupo de alunos, determinar a média aritmética, a moda e a mediana.

xi fi 1 5 2 6 3 4 4 2 5 3 6 2 Somatório (Σ) 22

11) Considerando os dados agrupados em classe, apresentados abaixo, referentes às estaturas de 100 alunos de uma turma, calcular a média aritmética, a moda e a mediana.

Estaturas (m) Fi

1,40 |--- 1,50 5 1,50 |--- 1,60 10

(46)

1,60 |-- 1,70 30 1,70 |-- 1,80 40 1,80 |-- 1,90 10 1,90 |-- 2,00 5 Somatório (Σ) 100

12) Em uma classe de 25 alunos as notas, de 0 a 10, em uma prova de português foram: 10; 7; 8; 5; 4; 3; 2; 9; 9; 6; 3; 1; 4; 3; 6; 8; 2; 5; 4; 10; 8; 3; 4; 7; 3. Determine os quartis, os decis 4 e 7 e os percentis 85% e 90%.

13) A tabela abaixo representa os salários pagos a 100 operários de uma empresa:

Classes Freqüência (fi) Xi fri(%) Fac Fad

0 |-- 2 40 2 |-- 4 30 4 |-- 6 10 6 |-- 8 15 8 |-- 10 5 Somatório (Σ) 100

Determine os quartis, os decis 4 e 7 e os percentis 85% e 90%.

14) Os dados a seguir referem-se à idade de 25 funcionários numa certa seção de uma empresa: 27; 27; 30; 26; 26; 25; 28; 28; 29; 29; 28; 27; 25; 26; 27; 27; 29; 29; 28; 28; 27; 28; 26; 28; 29. Calcule a amplitude ou intervalo local, o médio, a variância, o desvio-padrão e o coeficiente de variação.

15) A tabela abaixo representa a estatura de 140 alunos:

Estaturas (cm) Freqüência (fi) Xi fri(%) Fac Fad

145 |-- 150 2 150 |-- 155 10 155 |-- 160 27 160 |-- 165 38 165 |-- 170 27 170 |-- 175 21 175 |-- 180 8 180 |-- 185 7 Somatório (Σ) 140

(47)

Calcule a amplitude ou intervalo local, o desvio-médio, a variância, o desvio-padrão e o coeficiente de variação.

16) Os dados a seguir representam o peso de 20 recém-nascidos: 2,7; 3,9; 4,1; 4,3; 5,4; 4,0; 2,5; 3,7; 3,6; 2,8; 3,0; 4,0; 3,5; 3,7; 2,9; 3,2; 4,2; 2,4; 3,4; 3,3. Classificar a distribuição quanto à simetria utilizando o coeficiente de simetria e classificar o momento de curtose, por meio do coeficiente momento de curtose.

10. REFERÊNCIAS BIBLIOGRÁFICAS

CRESPO, ANTONIO Arnot. Estatística fácil. 17. ed. São Paulo: Saraiva, 2001. 224 p.

FARHAT, Cecília Aparecida Vaiano. Introdução à estatística aplicada. São Paulo: FTD, 1998. 112 p.

FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à estatística. 2. ed. Rio de Janeiro: LTC, 2003. 340 p.

FONSECA, Jairo Simon da. Curso de estatística. 6. ed. São Paulo: Atlas, 1996. 320 p. MARTINS, Gilberto de Andrade. Princípios de estatística. 2. ed. São Paulo: Atlas, 1983. 203 p.

MOREIRA, José dos Santos. Elementos de estatística. 9. ed. São Paulo: Atlas, 1982. 170 p. SILVA, Ermes Medeiros da. Estatística: para os cursos de economia, administração, ciências contábeis. 3. ed. São Paulo: Atlas, 1997. 188p.

SOARES, José Francisco. Introdução à estatística. Rio de Janeiro: Livros Técnicos e Científicos, 1991. 378 p.

SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: McGraw-Hill, 1993. 580 p.

SPIEGEL, Murray R. Estatística: 340 problemas resolvidos, 340 problemas propostos. 2. ed. São Paulo: McGraw-Hill, 1985.

TEIXEIRA, Daniel Mandin. Estatística descomplicada. 6. ed. Brasília: Vest-Con, 1998. 230 p.

TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1983. 459 p.

(48)

WILLIAM JOSÉ FERREIRA

Graduado em Tecnologia em Processamento de Dados pelo Centro de Ensino Superior de Juiz de Fora. Especialista em Matemática e Estatística pela Universidade Federal de Lavras. Mestre e Doutor em Zootecnia pela Universidade Federal de Viçosa.

Trabalhou no Centro Nacional de Pesquisa de Gado de Leite da Empresa Brasileira de Pesquisa Agropecuária, em Juiz de Fora-MG.

É professor Universitário e Diretor Geral da Faculdade do Noroeste de Minas (FINOM) desde junho de 2003.

Em julho de 2000 recebeu o prêmio Professor Octávio Domingues - Mensão Honrosa, pela tese apresentada no mestrado, concedido pela Sociedade Brasileira de Zootecnia, na XXXVII Reunião Anual, realizada em Viçosa-MG.

Em abril de 2004 foi aprovado e classificado em 1º lugar no Concurso Público de Provas e Títulos para o cargo de Professor de Ensino Superior, promovido pela Universidade Estadual do Sudoeste da Bahia (UESB).

Em outubro de 2004 recebeu Mensão Honrosa, outorgado pela Universidade Norte do Paraná (UNOPAR) pela autoria do trabalho “PCRSYS: Sistema Aplicação à Seleção de Primers para Reação em Cadeia da Polimerase”, apresentado no 7º Encontro de Atividades Científicas da UNOPAR.

É membro do Banco de Avaliadores do Sistema Nacional de Avaliação da Educação Superior, do Ministério da Educação, na categoria de Avaliador de Instituições de Educação Superior e de Cursos de Graduação.

Possui, aproximadamente, sessenta trabalhos científicos publicados em periódicos nacionais e internacionais. Participou também como co-autor de capítulo do livro Programa Nacional de Melhoramento do Gir Leiteiro: 20 anos gerando conhecimento, publicado pela Embrapa-Gado de Leite.

E-mail para contato: ferreirawj@uol.com.br.

MARCELO DO NASCIMENTO SOUSA

Graduado em Matemática pela Universidade Federal de Uberlândia. Especialista em Estatística Aplicada e Mestre em Engenharia Mecânica também pela Universidade Federal de Uberlândia. Em seu trabalho de mestrado utilizou planejamentos estatísticos para minimizar e facilitar a obtenção dos resultados.

Trabalhou oito anos como professor de física e matemática em escolas públicas e particulares. É professor Universitário e Coordenador do Curso de Matemática da Faculdade do Noroeste de Minas (FINOM).

Possui, aproximadamente, dez trabalhos científicos publicados em periódicos nacionais e internacionais, nos quais utilizou a metodologia estatística.

E-mail para contato: mnascimento28@yahoo.com.br.

BENEDITO DO CARMO BATISTA

Graduado em Ciências Econômicas pelo Centro Universitário Newton Paiva de Belo Horizonte. Especialista em Direito Educacional no Processo Ensino-Aprendizagem e em Administração Empresarial pela Universidade Federal de Uberlândia.

Trabalhou seis anos como Economista na Cooperativa Agropecuária do Vale do Paracatu Ltda. (COOPERVAP).

É professor Universitário desde 1991 na Faculdade do Noroeste de Minas (FINOM) e Economista na Prefeitura Municipal de Paracatu desde 1997.

Possui vários artigos publicados em jornais. E-mail para contato: ditinhobatista@yahoo.com.br.

(49)

Editora Faculdade FINOM

Exemplares do Guia de Estudos nº 1 - Estatística Aplicada à Educação podem ser adquiridos diretamente no campus da Faculdade FINOM, pelo telefone ou e-mail abaixo:

Campus JK

Rodovia MG 188 km 167, s/nº - Bairro Fazendinha Caixa Postal nº 201 – Paracatu-MG

CEP: 38600-000 Telefax: (38) 3311-2000 E-mail: finom@finom.edu.br

Site: www.finom.edu.br

Todas as publicações da série Guia de Estudos deverão ser previamente submetidas e aprovadas pelo conselho editorial.

É proibida a duplicação ou reprodução deste Guia de Estudos, no todo ou em parte, sob quaisquer formas ou meios (eletrônico, mecânico, gravação, fotocópia, distribuição na Web ou outros) sem permissão expressa da Editora.

Referências

Documentos relacionados

Neste trabalho de pesquisa mostrou que os funcionários da empresa Tecnogrês Revestimentos Cerâmicos, tem um conhecimento básico do que é o meio ambiente, e que se

A partir da junção da proposta teórica de Frank Esser (ESSER apud ZIPSER, 2002) e Christiane Nord (1991), passamos, então, a considerar o texto jornalístico como

A variável em causa pretende representar o elemento do modelo que se associa às competências TIC. Ainda que o Plano Tecnológico da Educação preveja a conclusão da

No Estado do Pará as seguintes potencialidades são observadas a partir do processo de descentralização da gestão florestal: i desenvolvimento da política florestal estadual; ii

No primeiro, destacam-se as percepções que as cuidadoras possuem sobre o hospital psiquiátrico e os cuidados com seus familiares durante o internamento; no segundo, evidencia-se

O objetivo deste trabalho foi realizar o inventário florestal em floresta em restauração no município de São Sebastião da Vargem Alegre, para posterior

The Anti-de Sitter/Conformal field theory (AdS/CFT) correspondence is a relation between a conformal field theory (CFT) in a d dimensional flat spacetime and a gravity theory in d +