• Nenhum resultado encontrado

texto6 2019 FisExp

N/A
N/A
Protected

Academic year: 2021

Share "texto6 2019 FisExp"

Copied!
22
0
0

Texto

(1)

Universidade Federal de Itajubá – UNIFEI

Instituto de Física & Química – IFQ

Universidade Aberta do Brasil – UAB

Curso de Licenciatura em Física – EaD

Textos Auxiliares para as disciplinas:

Física Experimental

Metodologia Científica

Prof. Gabriel Rodrigues Hickel

Baseado em material didático criado por

Prof. Agenor Pina da Silva & Profa. Mariza Grassi

Ano 2019

 Todos os direitos reservados à UNIFEI e UAB. O uso deste material para fins didáticos, não lucrativos, é permitido, desde que mantidos os créditos.

(2)

Conteúdo deste texto:

XVII – Introdução ao tratamento estatístico de medidas XVIII – Elementos de estatística básica

XIX – Tipos de dados

XX – Como fazer uma boa estatística

XXI – Aspectos referentes aos dados estatísticos XXII – Distribuição de dados estatísticos

XXIII – Representação gráfica da distribuição de dados

Referências Bibliográficas utilizadas neste texto

Livros:

1 – Vuolo, J.H., Fundamentos da Teoria de Erros. Editora Edgard Blücher LTDA, 2a

Edição, São Paulo, SP, 2000.

2 – Corradi, W.; Vieira, S.L.A.; Társia, R.D.; Balzuweit, K.; Fonseca, L.; Oliveira, W.S.,

Física Experimental. Editora da UFMG, Belo Horizonte, MG, 2008.

3 – Morettin, L.G., Estatística Básica – vol. I e II. Editora Makron Books, São Paulo, SP, 2004.

(3)

XVII – Introdução ao tratamento estatístico de medidas

Quando estudamos os erros de medidas diretas (no módulo 2), vimos que havia duas maneiras de estimar o erro, conforme a medida fosse efetuada uma só ou repetidas vezes. Na ocasião, vimos apenas como determinar o erro para medidas únicas. Agora, vamos analisar o que fazer e como reportar a medida e seu erro quando repetimos esta medida várias vezes.

Primeiro, porém, precisamos responder a uma pergunta fundamental. Por

qual(is) razão(ões) repetimos uma medida várias vezes? A resposta mais

óbvia seria tentar obter uma medida mais confiável. Uma única medida pode conter erros de leitura ou erros grosseiros. Então, repetindo-a várias vezes, aumentamos a confiabilidade do resultado final. Mas também existe outra possibilidade: a própria grandeza a ser medida e/ou o método utilizado

para obtê-la, podem apresentar valores de medidas naturalmente variáveis em uma faixa maior que o erro de uma única medida (erro instrumental). Por exemplo, imagine que queiramos medir o consumo de

combustível de um carro. Vamos supor que o medidor tem uma precisão de 0,2 km/litro. Mas note que ao andar no trânsito pesado da cidade, o consumo pode ser alto, digamos que o carro faça só 8,6 km/litro. Já na rodovia, em marchas mais altas, o consumo diminui, digamos que o carro consiga fazer 12,2 km/litro. Neste caso, a variação total entre as duas medidas extremas (12,2 – 8,6 = 3,6 km/litro) é bem maior que o erro da medida (0,1 km/litro).

A situação descrita acima mostra que para avaliarmos o consumo do carro, precisaríamos efetuar uma série de medidas, em várias situações diferentes de consumo e obter um valor representativo destas medidas, como por exemplo, a média aritmética. Isto significa fazer uma amostra de medidas e realizar a estatística da mesma.

Às vezes, a medida que desejamos tem um único valor, mas o método de medida introduz uma variação maior que o erro de uma medida individual. Por exemplo, quando tentamos determinar a aceleração da

gravidade local (que tem um valor único bem definido) através de um pêndulo, se a metodologia para medir o período depender da reação humana, então esperaremos flutuações nos períodos da ordem de 0,4 segundos, muito embora o cronômetro possa ter precisão de alguns centésimos de segundo. Assim, mais uma vez é necessária efetuar a estatística de um conjunto (amostra) de medidas para se obter uma medida confiável e mais precisa.

Ao longo do seu curso de graduação você terá a disciplina de Probabilidade & Estatística e verá em detalhes todos os aspectos envolvendo a análise das distribuições de dados. Por hora, estudaremos apenas alguns elementos de

(4)

estatística básica para clarear o entendimento da estatística de medidas que necessitamos nesta disciplina de Física Experimental / Metodologia Científica.

XVIII – Elementos de estatística básica

Podemos iniciar perguntando o que é estatística? Estatística é todo e

qualquer procedimento de análise científica na busca de parâmetros característicos de uma população, a partir de uma amostra reduzida desta população. Por exemplo, se queremos caracterizar a altura do brasileiro

adulto, obviamente não podemos medir um só brasileiro adulto; mas também não podemos medir a altura de todos os brasileiros adultos, pois seria impraticável. O melhor a fazer é separar uma amostra da população brasileira, de forma lógica; tomando a medida da altura de todos desta amostra e encontrando um valor representativo, por exemplo, a altura média.

Para tanto, primeiramente precisamos conhecer alguns conceitos de estatística:

População: é o conjunto de elementos dos quais queremos retirar

informação. A população é composta por todos os elementos. São exemplos: o número total de carros da cidade de Pouso Alegre; a quantidade total de lâmpadas produzidas por uma fábrica no mês de Abril de 2017; todos os alunos regularmente matriculados na disciplina de Física Experimental; etc...

Censo: é uma estatística feita com TODA a população.

Amostra: é um sub-conjunto da população, que mantém as

mesmas características médias da população, dentro de uma determinada margem de erro, que depende apenas do tamanho da amostra.

Parâmetro: é uma determinada característica da população. São

exemplos: a renda mensal média da família brasileira; a idade média da frota de carros da cidade de Juiz de Fora; a nota média dos alunos regularmente matriculados na disciplina de Metodologia Científica. Para obter um parâmetro é necessário efetuar um censo.

Valor Estatístico: é uma determinada característica da amostra.

O Valor Estatístico, dentro de uma determinada margem de erro, pode ser adotado como parâmetro da população da qual a amostra foi retirada.

Vamos exemplificar estes conceitos com as eleições presidenciais. A

população é composta por todos os eleitores brasileiros legalmente

(5)

conhecer: a intenção de voto. Antes de a eleição acontecer, são feitas pesquisas com uma amostra reduzida de eleitores. Estas pesquisas obtêm um valor

estatístico, que é a intenção de voto da amostra. Note que as pesquisas

sempre são divulgadas com uma margem de erro (percentual). A rigor, esta margem de erro mostra o quão fidedigno (ou confiável) é o valor estatístico da amostra em relação ao parâmetro da população.

XIX – Tipos de dados

Quando vamos efetuar um censo de uma população ou uma estatística de uma amostra, iremos trabalhar com dados dos elementos da população ou amostra. Por exemplo, uma pessoa pode ser um elemento de uma amostra, mas tem infinitas características: idade, peso, altura, renda, anos de trabalho, cor preferida, religião, etc. Conforme o que queremos obter, existem diversos tipos de dados, com naturezas distintas, levando à classificações diferentes, como mostram as Tabelas 6.1 e 6.2.

A classificação dos dados da amostra ou população é fundamental, pois determina o tipo de estatística possível de ser efetuada. Por exemplo, não faz sentido calcularmos a “religião média” ou a dispersão do “clube de futebol do coração”. Cada tipo de dado deve ter um tratamento específico, com ferramentas apropriadas.

XX – Como fazer uma boa estatística

Para efetuar uma boa estatística, não importando o tipo de dados que iremos trabalhar, é necessário observar alguns aspectos importantes:

a) Identificar bem a população e a questão a ser respondida na análise estatística

É necessário que saibamos exatamente o que queremos conhecer acerca dos elementos da população. Então, é preciso definir inicialmente a população. Isso nem sempre é trivial. Por exemplo, suponha que queiramos saber características quaisquer de onças no estado de Minas Gerais. Qual é a população? Não sabemos ao certo. Isto já dificulta a própria análise de qualquer problema relativo à população.

(6)

Tabela 6.1 – Classificação de Dados (quanto ao tipo numérico)

Classificação quanto à característica associada

Qualitativos

São dados que se referem a uma característica do elemento que não pode ser diretamente associada a um valor numérico. São exemplos: a cor dos olhos, a marca do carro, o sexo da pessoa, níveis de satisfação (ótimo, bom, ruim, etc), dentre muitos outros.

Quantitativo s

Discretos

São dados que se referem a uma característica do elemento que são representados por números inteiros. São exemplos: o número de irmãos que uma pessoa tem, a quantidade de carros produzida por uma montadora no mês de Janeiro, o número de alunos por escola, o número de peças com defeito por lote de peças, etc...

Contínuos

São dados que se referem a uma característica do elemento que são representados por números reais. São exemplos: a altura de uma pessoa, a quilometragem rodada por carro de uma empresa durante uma semana, a nota dos alunos de uma classe na prova de matemática, o tempo gasto por habitante de uma determinada cidade para ir de casa ao trabalho, etc...

Da mesma forma que é preciso saber a população, é necessário estabelecer quais características se deseja conhecer e com qual precisão, pois isto influencia na coleta de dados. Por exemplo, pesquisas complexas que delineiam o perfil do consumidor precisam ser bem elaboradas sob o risco de terem seus resultados invalidados e serem refeitas.

(7)

Tabela 6.2 – Classificação de Dados (quanto à mensuração)

Classificação quanto ao nível de mensuração

Nominal São dados representados por palavras. São exemplos:o nome de pessoas, sexo, cor dos olhos, etc...

Ordinal

São dados referentes ao ordenamento crescente ou decrescente. São exemplos: a colocação de atletas em uma corrida, o lugar de um aluno em uma fila ordenada por altura, o número de matrícula do aluno, etc...

Intervalar

São dados numéricos inteiros ou reais, mas com os quais não podemos efetuar operações algébricas absolutas, apenas intervalares, uma vez que seus pontos zeros são relativos (existem valores positivos e negativos) e não absolutos. São exemplos: o ano, a temperatura em graus Celsius, a taxa de inflação, etc... Estes tipos de dados permitem que uma

medida tenha valor “0” (zero), reforçando o que comentamos nos módulos 1 e 2.

Razão

São dados numéricos reais com os quais podemos fazer qualquer operação algébrica. São exemplos: a altura de uma pessoa, a velocidade média de carros que concluíram uma corrida, o tempo de queda livre de um corpo a partir de uma altura h, etc...

b) Escolher bem a amostra

Se não é possível efetuar um Censo da População, então a escolha da amostra é um passo crucial na elaboração de uma estatística. Como já falamos, a amostra é um sub-conjunto da população. Mas como escolher a amostra e qual deve ser o tamanho dela? Na verdade, estas perguntas não têm respostas simples. Boa parte da disciplina de Probabilidade & Estatística é dedicada em respondê-las.

De forma simplória, a melhor amostra é aquela em que seus elementos

são escolhidos de forma aleatória na população (em alguns casos

especiais, isto pode não ser verdade, mas não é oportuno desenvolver este aspecto agora). Efetuar uma amostragem aleatória, significa considerar que todos os elementos da população são iguais (têm o mesmo peso estatístico), frente à característica que queremos analisar.

O tamanho ideal da amostra é determinado pela margem de segurança desejável em relação aos valores estatísticos, frente aos parâmetros da

(8)

população. Quanto menor a margem de erro desejada, tanto maior deverá ser a amostra. Mas este é um assunto da disciplina de Probabilidade & Estatística.

c) Estabelecer o plano de coleta de dados

A coleta de dados para a estatística deve ser pensada antes de ser executada. Todos os cuidados que valem para uma única medida, também valem para efetuar uma estatística: escolher bem o instrumento, “isolar” o experimento, determinar os cuidados para evitar erros grosseiros. Não raro, é bom efetuar um Estudo Observacional antes de efetuar a estatística. Por exemplo, em experiências que envolvam a estatística de dados iguais (repetição de medidas) é aconselhável efetuar algumas medidas de treinamento antes de começar a anotar os valores propriamente ditos.

Se a coleta de dados envolve algum experimento comparativo, pode ser necessário estabelecer previamente uma amostra de controle. Isso é bastante comum em química, biologia e medicina. Um exemplo simples é a medida da eficácia de uma droga, em medicina. Normalmente são testados dois grupos distintos: um grupo recebe a droga e o outro grupo recebe um placebo. A eficácia é medida comparando a melhora de um grupo em relação ao outro. Outro aspecto muito importante referente aos dados resultantes de um experimento é o tratamento dos dados, ou seja, quais são os métodos que serão utilizados para retirar a informação útil deles. É preciso escolher um tratamento que forneça a informação requerida com a menor degradação possível.

d) Coletar os dados sem tendências

Por melhor que a coleta de dados tenha sido planejada, a sua execução deve ser feita sem tendências. Tendências podem ser introduzidas por vários fatores: instrumentos de medida com defeitos, condições ambientais adversas, cansaço ou falta de paciência do pesquisador, dentre outros. É um grande problema, identificar e tratar posteriormente na análise dados, qualquer tendência introduzida na coleta. Como isso nem sempre é possível, sobretudo se não existe uma perspectiva inicial dos resultados, o melhor a fazer é evitá-la ao máximo.

Por exemplo, imagine que vamos medir a velocidade média de carros que trafegam por uma avenida, utilizando um radar que tem a tendência de marcar as velocidades sempre com 7 km/h a mais em relação ao valor verdadeiro. Se nenhuma calibração é feita antes de utilizá-lo, esta tendência vai aparecer nas medidas sem que saibamos ou possamos identificá-la.

(9)

e) Analisar os dados, quantificar os erros e obter conclusões

Após efetuar a coleta dos dados, é importante analisá-los como previamente estabelecido, obtendo os valores estatísticos da amostra ou os parâmetros da população (se for possível). Tão importante quanto tirar os valores estatísticos da amostra é saber quantificar os erros cometidos nesta obtenção. Os erros irão determinar a margem de confiança do valor estatístico e o que podemos de fato concluir em relação ao parâmetro para a população. Veremos mais adiante (módulo 7) como quantificar, de forma simples, os erros dos valores estatísticos para dados Quantitativos, de Razão.

Os erros estatísticos são de dois tipos:

 Não amostrais: cometidos na coleta ou na análise dos dados;

 Amostrais: referentes ao tamanho da amostra frente ao tamanho da população.

Os erros não-amostrais não devem ser confundidos com os erros das medidas individuais. Toda medida terá um erro, independente de qualquer instrumento e metodologia empregados. Os erros não-amostrais são erros relativos ao método de medida (modelo incompleto e/ou execução incorreta) ou relativos a uma análise equivocada dos dados (por exemplo, falta de atenção à presença de dados espúrios). Nem sempre são facilmente detectáveis e fáceis de quantificar.

Já os erros amostrais, são bem mais simples de serem calculados e explicitados, bastando analisar a variância das medidas em relação ao tamanho da amostra para com o tamanho da população. Existem modelos teóricos de distribuição de dados que podem ser empregados na maioria dos casos.

Por fim, obter conclusões de estatísticas simples (nas quais procuramos apenas um ou dois resultados) é razoavelmente fácil. Mas quando a estatística executada analisa muitas características dos elementos da amostra, procurando inter-relação entre eles, a análise pode ser complicada e as conclusões muito difíceis de serem obtidas.

XXI – Aspectos referentes aos dados estatísticos

Analisar características na população ou em uma amostra reduzida, levam à pequenas diferenças, como já comentado. Quando analisamos parâmetros

da população efetuamos uma Estatística Descritiva (ou censo). Se a análise

é de valores estatísticos de uma amostra reduzida, efetuamos uma

(10)

Mas, quais informações podemos obter dos dados dos elementos da população ou da amostra, efetuando uma estatística (descritiva ou inferência)? A rigor, somente três tipos:

a) Distribuição dos dados; b) Valores representativos; c) Dispersão dos dados.

Nem sempre estes três tipos podem ser avaliados, pois dependendo do tipo dos dados, não faz muito sentido avaliar b e/ou c. Qualquer tipo de dados pode ter a sua Distribuição analisada e existem diversas formas de efetuar isto, sendo as formas gráficas as mais empregadas, devido à facilidade de captação da informação. Analisar a distribuição é fundamental, pois ela fornece uma ideia exata da natureza da característica que desejamos conhecer da amostra ou população. Ela também indica se vale a pena ou não calcular os valores representativos e a dispersão dos dados (quando estes são possíveis de serem calculados).

Os Valores Representativos, como o nome sugere, irão caracterizar o que desejamos conhecer dos elementos da amostra ou população. Nem sempre eles são numéricos, pois dependem do tipo de dados. Em algumas situações, sequer podemos expressá-los. Por exemplo, se fizermos uma estatística dos nomes próprios dos estudantes do sexo masculino na população de estudantes da UNIFEI, certamente encontraremos alguns nomes mais comuns, mas nenhum deles poderia ser utilizado como valor representativo da população.

A Dispersão dos dados versa sobre a amplitude de variação da característica a ser conhecida da amostra ou população, ponderada pela ocorrência. A dispersão é muito importante de ser mensurada, pois ela indica se o valor representativo é confiável ou não.

No restante deste texto do módulo 6, veremos como efetuar a Distribuição dos Dados. O cálculo dos Valores Representativos e Dispersão serão visto apenas no módulo 7.

XXII – Distribuição de dados estatísticos

A distribuição dos dados estatísticos é normalmente efetuada através da construção de uma tabela de frequências. Para estabelecer esta tabela são necessários dois procedimentos prévios:

1) ordenar os dados;

(11)

Para alguns tipos de dados, estes dois procedimentos se confundem em um só, uma vez que as classes já estão previamente estabelecidas. Por exemplo, na estatística para saber a intenção de voto da população, obviamente as classes são os candidatos (previamente conhecidos) e a ordenação, via de regra, é feita do mais frequente (com maior intenção de voto) para o menos frequente (com menor intenção de voto), como é exemplificado na Tabela 6.3.

Tabela 6.3 – Exemplo de Tabela de Frequências de Intenção de Voto

Candidato Intenção de Voto

(numérica) Intenção de Voto(%)

Sócrates 1.756 41,9

Aristarco 1.238 29,5

Aristóteles 751 17,9

Platão 328 7,8

Eratóstenes 122 2,9

Neste exemplo fictício, a Tabela 6.3 é uma Tabela de Frequência na qual as classes (candidatos) aparecem na primeira coluna; a frequência absoluta (contagem de intenção de votos) aparece na segunda coluna e a frequência relativa percentual (intenção de voto percentual, em relação ao total de entrevistados, 4.195 eleitores) aparece na terceira coluna. Note que o ordenamento é tal que a intenção de voto vai do mais frequente (Sócrates) para o menos frequente (Eratóstenes) na medida em que vamos da primeira linha de dados para a última.

Assim, sempre que o tipo de dado for nominal, as classes já estão naturalmente definidas. Mas quando isso não acontecer, como definimos as classes da Tabela de Frequências? O que fazemos quando os dados são Quantitativos, de Razão? Por exemplo, vamos supor que queremos estabelecer a tabela de frequências para as notas da primeira prova de uma turma de Física Experimental. Como proceder?

Nestes casos, quando dados Quantitativos, de Razão; estão presentes, torna-se necessário calcular as classes de dados a partir do número de dados e do intervalo total de variação (amplitude dos dados). A quantidade de classes (Nc) é calculada como segue:

 

N

Nc trunc

onde N é o número de dados da amostra ou população e “trunc” é a função que efetua o truncamento (e não o arredondamento) do resultado da raiz quadrada,

(12)

permanecendo apenas a parte inteira. Por exemplo, suponha que N = 34 dados, então temos que 345,83095... e Nctrunc

 

345 classes.

Em seguida, calcula-se o intervalo total de variação (ou amplitude dos dados)

I, como segue:

maior valor

 

menor valor

I

Então, calculamos o tamanho numérico ou tamanho do intervalo das classes (todas as classes devem ter o mesmo tamanho), dado por t :

Nc I t

O valor de t, via de regra, será um número real que pode ter muitas casas decimais. A regra é utilizar o valor de t com pelo menos uma casa decimal a mais do que os dados possuem. O valor de t será utilizado na determinação do

intervalo de variação de cada classe, como segue:

Classe I  vai do (menor valor) até (menor valor + t)

Classe II  vai do (menor valor + t + 1 dígito) até (menor valor + 2t) Classe III  vai do (menor valor + 2t + 1 dígito) até (menor valor + 3t) Classe IV  vai do (menor valor + 3t + 1 dígito) até (menor valor + 4t) ...

e assim por diante, para quantas classes existirem. A soma de 1 dígito é necessária para que os dados pertençam a apenas uma classe. Por exemplo, se o intervalo da classe I vai de 2,30 até 2,45 (neste caso, t = 0,15), então a classe II irá de 2,46 (2,45 + 1 dígito = 2,45 + 0,01 = 2,46) até 2,60.

Depois de estabelecer as classes e seus intervalos, é só contar quantos elementos da amostra ou população existem em cada uma delas e estabelecer a Tabela de Frequências. Para isto, é conveniente que os dados já estejam previamente ordenados.

Os procedimentos acima parecem confusos e complicados, mas tornar-se-ão mais claros, com a aplicaçtornar-se-ão a alguns exemplos, o que faremos a seguir.

 Exemplo 1 – Notas obtidas pelos alunos na primeira prova de Metodologia Científica

Suponha que temos a população de notas da primeira prova de Metodologia Científica de uma turma com 50 alunos. A primeira providência

(13)

para obter a distribuição destas notas é ordená-las de forma crescente,

como mostrado abaixo:

3,7 – 4,2 – 4,6 – 4,6 – 4,7 – 4,8 – 4,8 – 5,1 – 5,1 – 5,5 – 5,6 – 5,8 – 6,2 – 6,5 – 6,5 – 6,5 – 6,7 – 6,8 – 6,9 – 6,9 – 7,0 – 7,1 – 7,1 – 7,3 – 7,4 – 7,5 – 7,5 – 7,7 – 7,8 – 8,0 – 8,0 – 8,2 – 8,3 – 8,4 – 8,4 – 8,6 – 8,6 – 8,7 – 8,7 – 8,8 – 8,9 – 8,9 – 9,0 – 9,0 – 9,2 – 9,5 – 9,8 – 9,9 – 10,0 – 10,0

Em seguida, determinamos quantas classes distintas podemos montar. Neste exemplo, temos N = 50 notas. Então, calculamos o número de classes

 

50 trunc

7,07106...

7

trunc  

Nc classes. Isto significa que deveremos

separar estas 50 notas em 7 classes diferentes de notas. Precisamos, então, determinar o intervalo total de variação e o tamanho do intervalo de cada classe.

Na amostra, o maior valor é 10,0 e o menor valor é 3,7. Então, o intervalo total será I = 10,0 – 3,7 = 6,3. Assim, o tamanho do intervalo das classes é determinado por t = I/Nc = 6,3 / 7 = 0,9. Este valor é exato, mas iremos representá-lo com uma casa decimal a mais que os dados. Note que os dados têm apenas uma casa decimal. Então, escreveremos t = 0,90. Em outras palavras, separaremos as 50 notas dos alunos em 7 “caixinhas” de 0,90 de “largura” (ver Figura F-1). Assim, estamos prontos para montar as classes de notas:

Classe I  vai do (menor valor) até (menor valor + t) , ou seja: Classe I  vai do 3,7 até (3,7 + 0,90)  vai do 3,7 até 4,60

Classe II  vai do (menor valor + t + 1 dígito) até (menor valor + 2t) , ou seja: Classe II  vai do (3,7 + 0,90 + 0,01) até (3,7 + 20,90)  vai do 4,61 até 5,50

Classe III  vai do (menor valor + 2t + 1 dígito) até (menor valor + 3t), ou seja: Classe III  vai do (3,7 + 20,90 + 0,01) até (3,7 + 30,90) 

Classe III  vai do 5,51 até 6,40

E assim por diante, calculamos as outras classes: Classe IV  vai do 6,41 até 7,30

Classe V  vai do 7,31 até 8,20 Classe IV  vai do 8,21 até 9,10 Classe IV  vai do 9,11 até 10,0

Agora, precisamos contar quantos elementos da população existem em cada classe, ou seja, quantas notas existem em cada “caixinha”. Revendo a

(14)

população de notas ordenada, vemos que existem 4 notas dentro do intervalo da Classe I, que vai de 3,7 até 4,60: 3,7 – 4,2 – 4,6 – 4,6. Portanto, inferimos que a Classe I irá possuir 4 elementos da população de notas. Da mesma forma, podemos verificar a quantidade de elementos também para as outras classes.

A maneira lógica de expressar as classes, seus intervalos de variação e as contagens de elementos em cada classe, é através da montagem de uma tabela. Quando aferimos as 7 classes, com seus intervalos e contagens; obtemos a chamada Tabela de Frequências. A Tabela 6.4 mostra a tabela de frequências para a população de notas:

Tabela 6.4 – Tabela de Frequências de Notas

Classe Intervalo Frequência

Absoluta Relativa (%)Frequência

I 3,7 a 4,60 4 8,0 II 4,61 a 5,50 6 12,0 III 5,51 a 6,40 3 6,0 IV 6,41 a 7,30 11 22,0 V 7,31 a 8,20 8 16,0 VI 8,21 a 9,10 12 24,0 VII 9,11 a 10,0 6 12,0

É importante que os intervalos das classes cubram todo o intervalo de variação da característica abordada. A soma da Frequência Absoluta para todas as classes obviamente deve dar o número total de elementos da amostra ou população. A soma da Frequência Relativa para todas as classes deve dar 100% (ou muito perto disso, devido aos arredondamentos das porcentagens).

A Frequência Absoluta nada mais é que a contagem de elementos dentro de cada Classe. A Frequência Relativa é a Frequência Absoluta dividida pelo número de elementos da população ou amostra. Ela também pode ser dada na forma percentual (neste caso, basta multiplicar a Frequência Relativa por 100).

Parece complicado, mas de fato não é. Vamos visualizar o diagrama de “caixinhas” da Figura F-1, para isto ficar mais claro:

(15)

Figura F-1 – Diagrama de Caixas para a distribuição de notas.

Os pontos () na Figura F-1 acima são justamente as 50 notas da primeira prova dos alunos de Metodologia Científica. Assim, preencher uma tabela de frequências, nada mais é do que preencher “caixinhas” postas uma após a outra (intervalos iguais, em sequência), com elementos da amostra ou população, conforme o valor da característica que se deseja conhecer.

 Exemplo 2 – Alturas de adultos do sexo masculino

Vamos ver um segundo exemplo para fixar bem a idéia da Tabela de Frequências. Seja uma amostra de alturas (em metros) de adultos do sexo masculino, formando uma amostra com 30 elementos, já colocada em ordem crescente:

1,58 – 1,64 – 1,66 – 1,69 – 1,70 – 1,71 – 1,72 – 1,72 – 1,72 – 1,73 – 1,73 – 1,74 – 1,74 – 1,75 – 1,75 – 1,76 – 1,76 – 1,76 – 1,77 – 1,77 – 1,77 – 1,78 – 1,78 – 1,79 – 1,80 – 1,83 – 1,85 – 1,87 – 1,90 – 1,91

Existem 30 elementos, então teremos 305,4772...trunc

5,4772...

5 classes. O intervalo de variação total é:

valor maiorvalor menor

1,911,580,33

I m

(16)

066 , 0 5 33 , 0   Nc I t m

Assim, a tabela de frequências ficará da seguinte forma, como mostra a Tabela 6.5:

Tabela 6.5 – Tabela de Frequências de alturas Classe Intervalo (m) Frequência

Absoluta Relativa (%)Frequência

I 1,58 a 1,646 2 6,7

II 1,647 a 1,712 4 13,3

III 1,713 a 1,778 15 50,0

IV 1,779 a 1,844 5 16,7

V 1,845 a 1,91 4 13,3

 Exemplo 3 – Diâmetros de hemácias humanas

O terceiro exemplo traz uma amostra de diâmetros (em m) de hemácias humanas, formando uma amostra com 40 elementos, já colocada em ordem crescente: 6,742 – 6,785 – 6,810 – 6,844 – 6,867 – 6,889 – 6,892 – 6,907 – 6,921 – 6,933 – 6,942 – 6,957 – 6,962 – 6,972 – 6,978 – 6,983 – 6,988 – 6,991 – 6,995 – 6,997 – 7,007 – 7,008 – 7,032 – 7,043 – 7,057 – 7,068 – 7,095 – 7,110 – 7,129 – 7,142 – 7,151 – 7,173 – 7,181 – 7,204 – 7,247 – 7,279 – 7,290 – 7,324 – 7,377 – 7,413

Existem 40 elementos, então teremos 406,3245...trunc

6,3245...

6 classes. O intervalo de variação total é:

valor maiorvalor menor

7,4136,7420,671

I m

Conseqüentemente, o tamanho do intervalo de cada classe será:

... 1118333 , 0 6 671 , 0   Nc I t m = 0,1118 m

Neste exemplo, o tamanho das classes t precisou ser arredondado até a quarta casa. Efetuando as contas para os intervalos das classes, você verá que a última classe irá acabar em 7,4128, aparentemente deixando de fora o último dado da

(17)

amostra. Este é um mero problema de arredondamento e para estabelecer o limite superior da última classe, utilizamos mesmo o maior valor da amostra. Assim, a tabela de frequências ficará da seguinte forma, como mostra a Tabela 6.6:

Tabela 6.6 – Tabela de Frequências de diâmetros de hemácias Classe Intervalo (m) Frequência

Absoluta Relativa (%)Frequência

I 6,742 a 6,8538 4 10,0 II 6,8539 a 6,9656 9 22,5 III 6,9657 a 7,0774 13 32,5 IV 7,0775 a 7,1892 7 17,5 V 7,1893 a 7,3010 4 10,0 VI 7,3011 a 7,413 3 7,5

Apesar da tabela de frequências ter todas as informações necessárias à análise da distribuição dos dados, existe uma forma melhor de visualizar estas mesmas informações: a forma gráfica. De modo geral, gráficos sintetizam as informações e fornecem de maneira clara, objetiva e de fácil compreensão; a distribuição dos dados. As distribuições estatísticas são normalmente visualizadas através dos chamados histogramas, diagramas de Pareto e de pizza (ou torta). É o que veremos no próximo item.

XXIII – Representação gráfica da distribuição de dados

Na análise de dados, o recurso gráfico é muito útil, pois fornece uma visualização imediata da distribuição e possíveis tendências dos dados. Existem basicamente três formas de representação gráfica da distribuição de dados: diagrama de Pareto, diagrama de pizza (ou torta) e histograma.

Um diagrama de Pareto é uma representação de uma tabela de frequências, ordenada da classe mais frequente para a menos frequente. Basicamente, é um diagrama de colunas, onde as alturas das

colunas são proporcionais à frequência (absoluta ou relativa). Para demonstrar, vamos utilizar o exemplo da Tabela 6.3 e construir o diagrama de Pareto com a frequência absoluta (ver Figura F-2). O único eixo que possui uma escala numérica é o eixo Y, onde indicamos a frequência (contagem de eleitores entrevistados que forneceram sua intenção de voto). A escala deste eixo tem

que ser linear e iniciar no zero. No eixo X são indicadas as classes, que neste

exemplo, são os candidatos. Cada coluna corresponde a uma classe (ou candidato). É recomendado que as colunas estejam separadas por uma lacuna para indicar que não consecutivas e para uma melhor visualização.

(18)

Sócrates Aristarco Aristóteles Platão Eratóstenes 0 200 400 600 800 1000 1200 1400 1600 1800 2000 C o n ta g em d e in te n ç ã o d e v o to s Candidato

Figura F-2 – Diagrama de Pareto da intenção de voto.

De modo geral, Diagramas de Pareto não são utilizados para dados Quantitativos, de Razão. Seu uso é bastante comum para inferências estatísticas de dados nominais/qualitativos. Ele oferece a vantagem evidente de mostrar claramente o ordenamento das classes conforme a sua frequência.

Uma outra forma de visualizar graficamente uma tabela de frequências é através de um diagrama de pizza ou torta. Este gráfico é um diagrama

circular (visto de cima ou em perspectiva), o qual é dividido em setores (pedaços), correspondentes às classes.

A área de cada setor é proporcional à frequência relativa de cada classe (com a área do círculo equivalendo a 1 ou 100%). Os setores devem ser diferenciados, por cores ou padrões de preenchimento. A Figura F-3 exemplifica o diagrama de pizza aplicado aos dados da Tabela 6.3. Ela traz a mesma informação do Diagrama de Pareto mostrado na Figura F-2.

(19)

Figura F-3 – Diagrama de Pizza da Intenção de Voto.

O diagrama de pizza ou torta deve trazer os valores da frequência relativa ou absoluta junto aos setores, para fins de maior clareza. A grande vantagem do diagrama de pizza (ou torta) é fornecer uma clara idéia de quanto cada classe é representativa em relação ao total. Note que diferentemente do diagrama de Pareto, o diagrama de pizza (ou torta) pode ser utilizado para dados não nominais (numéricos). Por exemplo, seja o diagrama de pizza da Tabela 6.5, para a amostra de alturas de adultos do sexo masculino, mostrado na Figura F-4.

Figura F-4 – Diagrama de pizza de alturas de adultos do sexo masculino.

Para finalizar, vamos conhecer a forma mais comum de representar graficamente uma tabela de frequências de uma amostra ou população de dados Quantitativos, de Razão: o Histograma. Um histograma é um gráfico de

barras que representa uma Tabela de Frequências ordenada por valores dos intervalos das classes de uma distribuição racional. O objetivo do

(20)

histograma é justamente ser fidedigno à distribuição dos dados. Assim, diferente do diagrama de Pareto, as barras NÃO são ordenadas pela frequência, mas

sim por seus intervalos consecutivos. A representação das colunas no gráfico não podem ter lacunas, pois onde termina um intervalo de uma

classe, começa imediatamente o intervalo da classe seguinte.

As alturas das barras dependem da frequência que são representadas no eixo Y e devem manter a razão e proporcionalidade apresentada na Tabela de Frequências. Isso significa que o histograma deve ser linear e a escala do

eixo Y deve começar na origem (zero). As classes devem ser representadas no eixo X, de forma consecutiva e com intervalos iguais.

O eixo X deve conter a unidade de medida da característica analisada, mas também é permitido que apareça somente a classe, desde que com legenda ou conexão com uma Tabela de Frequências. De forma opcional, as barras podem conter os valores da frequência absoluta ou relativa. A Figura F-5 mostra o exemplo referente à Tabela 6.4 (notas da prova), com o valor da frequência relativa. 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 10,0 0 2 4 6 8 10 12 14 16 18 20 22 24 26 % d e A lu n o s

Nota da Primeira Prova (Met. Cient.)

Figura F-5 – Histograma com a distribuição das notas da primeira prova de Metodologia Científica (Tabela 6.4).

Note que como o Histograma é diferente do Diagrama de Pareto. A escala no eixo X é contínua e as classes são sequenciais (não existe lacunas entre as colunas), conforme aparecem em ordem crescente de intervalo da grandeza envolvida (nota). Isto nos permite avaliar de forma rápida a distribuição de

(21)

dados. Podemos ver que ela é assimétrica1 para valores maiores. Desta forma, é

notório que o histograma é uma boa ferramenta para analisar de forma direta e prática a função de distribuição de probabilidade dos dados.

Um outro exemplo de histograma é mostrado na Figura F-6, referente à Tabela 6.5, mostrando a frequência absoluta em uma amostra de alturas medidas de adultos do sexo masculino. Neste histograma, colocamos os valores da Tabela de Frequências para cada Classe, no alto de cada barra, para fins de clareza. Este procedimento, entretanto, é opcional.

2 4 15 5 4 1,56 1,60 1,64 1,68 1,72 1,76 1,80 1,84 1,88 1,92 0 2 4 6 8 10 12 14 16 18 N ú m er o d e P e ss o as Altura (m)

Figura F-6 – Histograma com a distribuição das alturas de adultos do sexo masculino, referente à Tabela 6.5.

Este histograma mostra uma clara concentração dos dados em uma determinada classe, sugerindo que um valor representativo central seria adequado para caracterizar esta amostra (por exemplo, a média), juntamente com algum valor de dispersão (por exemplo, o desvio padrão), para representar uma espécie de erro. Mas este será o assunto do próximo módulo (7 – Estatística II).

Um terceiro e último exemplo de histograma é mostrado, com os dados da Tabela 6.6, para a distribuição dos diâmetros das hemácias de uma amostra. O eixo Y mostra a frequência relativa percentual das classes, iniciando do zero, com escala linear. Mas note que no eixo X, ao invés de escrevermos uma escala numérica, substituímos apenas pelos “nomes” das classes. Sabemos que estas classes possuem intervalos fixados e de fato, podemos referenciar no gráfico a Tabela 6.5 ou criar uma legenda para fins de clareza, como está na Figura F-7.

(22)

Referências

Documentos relacionados

2º BATALHÃO DE AVIAÇÃO DO EXÉRCITO.. O COMANDANTE DO EXÉRCITO, no uso da atribuição que lhe confere o art. 4º da Lei Complementar nº 97, de 9 de junho de 1999, alterada pela

(2019) Pretendemos continuar a estudar esses dados com a coordenação de área de matemática da Secretaria Municipal de Educação e, estender a pesquisa aos estudantes do Ensino Médio

As variáveis peso, estatura e circunferência da cintura apresentaram valores médios superiores aos homens em relação as mulheres, sendo o inverso observado para índice

Detectadas as baixas condições socioeconômicas e sanitárias do Município de Cuité, bem como a carência de informação por parte da população de como prevenir

Os resultados dos estudos acima discutidos, como mencionado, indicam que a consciência metatextual é uma habilidade que emerge de forma mais efetiva por volta dos 8-9 anos.

em setembro de 2012, dentre as 64 escolas estaduais da jurisdição de pará de Minas que ofertavam o ensino mé- dio, duas foram escolhidas para ofertar os primeiros cursos técnicos

Sobre estas perspectivas procuro levantar alguns questionamentos durante esta investigação, tais como: a distopia relaciona com a realidade extra fílmicas do presente

O presente estudo teve como objetivo avaliar os níveis pressóricos de adultos jovens masculinos, integrantes de um serviço militar obrigatório na cidade de