• Nenhum resultado encontrado

APOSTILA CURSO DE NUTRIÇÃO

N/A
N/A
Protected

Academic year: 2021

Share "APOSTILA CURSO DE NUTRIÇÃO"

Copied!
46
0
0

Texto

(1)

APOSTILA

CURSO DE NUTRIÇÃO

CURITIBA

2010

(2)

BIOESTATÍSTICA

HISTÓRICO DA ESTATÍSTICA

ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos. Faziam "estatísticas".

IDADE MÉDIA: as informações eram tabuladas com finalidades tributárias e bélicas.

SÉC. XVI : surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos.

SÉC. XVIII : a estatística com feição científica é batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representações gráficas e os cálculos de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar "O estudo de como se chegar à conclusões sobre uma população, partindo da observação de partes dessa população (amostra)".

A ESTATÍSTICA:

É uma parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.

A coleta, a organização, a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também classificada como ―a medida da incerteza‖ ou ―métodos que se fundamentam na teoria da probabilidade‖.

 MÉTODOS:

MÉTODO: é um meio mais eficaz para atingir determinada meta.

MÉTODOS CIENTÍFICOS: destaca-se o método experimental e o método estatístico.

MÉTODO EXPERIMENTAL: consiste em manter constante todas as causas, menos uma, que sofre variações e das quais são observadas seus efeitos, caso existam. Ex: Estudos aplicados na Química, Física, Biologia etc.

MÉTODO ESTATÍSTICO: existe pelo fato de normalmente não haver a possibilidade de manter todas as causas e variáveis constantes. As variações existem e são registradas. Esse método procura então determinar, no resultado final, que influências cada variável causa no objeto de estudo. Ex.: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, o nível geral de preços de outros produtos etc. Essas variáveis podem afetar o estudo e por isso são analisadas e interpretadas pelo método estatístico.

(3)

CONCEITOS

- Estatística = ciência que trata das flutuações e variações. É uma forma de obter informação a partir de dados e um método de elaborar decisões de forma objetiva.

- Princípios básicos = enumeração de dados com critérios pré estabelecidos e tomada de decisão.

- Passos = planejar investigações, coletar dados, apresentar dados e resultados e interpretar os resultados.

DEFINIÇÃO DE TERMOS

- População Real = UNIVERSO  analisada com o censo feito pelo IBGE = RECENSEAMENTO. Somente algumas pessoas responderam a um questionário = SONDAGEM.

- População Estatística = conjunto de elementos que têm em comum uma determinada característica. Pode ser muito ampla, ou restrita.

- Amostra = subconjunto da população, considerando as características essenciais desta.

- Estatística descritiva = ou análise exploratória de dados: técnicas básicas e simplificadas para explorar ao máximo um conjunto de dados (tabelas, gráficos, medidas, escalas de mensuração, tipos de variáveis). Há a descrição e dedução de dados, mas não a indução, a extrapolação para dados reais da população. Para isso existe a estatística indutiva.

- Estatística indutiva ou inferencial = compreende as técnicas por meio das quais são tomadas decisões sobre uma população estatística, decisões estas baseadas unicamente na observação de amostras ou na elaboração de um juízo. Envolve a estimação de parâmetros e a formulação de testes de hipótese. Mostra a probabilidade de que o fato observado realmente ocorra na população.

- Parâmetros = medidas características de uma população

(4)

QUESTIONÁRIO 1. O que é estatística?

a) É um conjunto de métodos históricos utilizados no método científica. b) É um conjuntos de dados utilizados no método científico.

c) É um conjunto de métodos utilizados para se analisar dados.

d) É um conjunto de dados utilizados para analisar os métodos científicos. e) A matemática aplicada às ciências sociais.

2. A estatística é utilizada como...

a) ... uma ferramenta do método científico; b) ... uma série de cálculos inúteis;

c) ... uma série de ferramentas utilizadas no material e métodos; d) ... cálculos na área das ciências sociais.

3. Para a Estatística, o que é uma ―população‖?

a) É um grupo da mesma espécie que habita em um determinado local.

b) É um conjunto de elementos que têm em comum uma determinada característica. c) É um grupo de dados que varia da mesma forma.

d) É um conjunto da mesma espécie que tem em comum o local em que habita. 4. O que é ―amostra‖?

a) É tudo o que está à mostra. b) É um grupo de informações. c) É um subconjunto da população. d) É um grupo de dados à mostra.

5. O que é ―variável‖?

a) É a variação dos dados. b) É um dado variando.

c) São dados coletados de uma amostra. d) É uma amostra com dados.

6. Com que finalidade você acha que a Estatística pode ser utilizada na sua área profissional?

____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________

(5)

TIPOS DE VARIÁVEIS

 Variáveis são o agrupamento das medidas repetidas de um dado objeto de estudo, realizadas em diferentes unidades de observação. Ex: As variáveis peso, altura e tempo empregado na realização de uma tarefa, podem ser ―medidas‖ para cada funcionário (objeto de estudo) de uma empresa. As variáveis podem ser quantitativas ou qualitativas. As técnicas estatísticas apropriadas para analisar um conjunto de variáveis dependem da maneira como essas variáveis foram medidas. Variáveis podem ser classificadas como quantitativas ou qualitativas.

1. Variáveis Quantitativas são aquelas em que as possíveis realizações (resultados) são números resultantes de uma contagem ou mensuração. Por exemplo: número de filhos, salário, estatura, peso, pressão sangüínea etc.

2. Variáveis Qualitativas são aquelas que apresentam como possíveis realizações (resultados) uma qualidade (ou atributo) do(s) indivíduo(s), ou objeto(s) pesquisado(s). Por exemplo: sexo, estado civil, nível de escolaridade, situação com relação a uma doença (possuir ou não) etc.

 Dentre as variáveis quantitativas, ainda se pode fazer distinção entre dois subtipos:

1. Variável Quantitativa Discreta  é aquela que só pode assumir valores inteiros positivos, inclusive o zero, resultante, normalmente, de uma contagem. Seus possíveis valores formam um conjunto finito de números. Ex: número de filhos (0, 1, 2, 3...); número de acidentes de trabalho (20, 30, 50...); número de faltas (0, 4, 8, 15...); número de alunos presentes às aulas de bioestatística no 2º semestre de 2002: ago= 18, set = 30 , out = 35 , nov = 36...

2. Variável Quantitativa Contínua  é aquela que pode assumir infinitos valores entre dois limites quaisquer, resultando, geralmente, de alguma mensuração. Seus possíveis valores formam um intervalo de números reais. Ex: altura (1,54; 1,65; 1,81m...); peso de um indivíduo (42,0; 54,2; 65,8 kg...); temperatura ambiente (5; 12; 14,7; 35,2ºC); tempo empregado na realização de uma tarefa (1 hora; 1 ½ hora; 55,22 minutos...)

 De modo análogo, as variáveis qualitativas podem sofrer uma classificação dicotômica:

1. Variável Qualitativa Nominal para a qual não existe nenhuma ordenação nas possíveis realizações. Os elementos (resultados) são alocados em categorias que não possuem ordem entre si. Ex.: sexo (masculino, feminino), Estado de origem (PR, SC, RS, SP..), estado civil (solteiro, casado, viúvo...) etc.

2. Variável Qualitativa Ordinal  para a qual existe uma certa ordem (ou grau) nos possíveis resultados. Os elementos (resultados) são alocados em categorias (postos) que são ordenadas entre si. Ex.: nível de escolaridade, onde 1o, 2o e 3o graus correspondem a uma ordenação baseada nos anos de escolaridade; resposta do paciente com relação a um tratamento: nenhuma melhora, alguma melhora ou muita melhora; classe social: alta, média, baixa...

(6)

EXERCÍCIOS  variáveis

Classifique as variáveis abaixo em qualitativas nominais (N), qualitativas ordinais (O), quantitativas contínuas (C), ou quantitativas discretas (D).

a) Cor dos olhos dos alunos do 2º período... ( ) b) Índice de liquidez nas indústrias capixabas... ( ) c) Classificação no vestibular... ( )

d) Índice de massa corporal... ( ) e) Quantidade de calorias... ( )

f) O ponto obtido em cada jogada de um dado... ( )

g) Grau de escolaridade dos funcionários de uma empresa... ( ) h) Sexo ( )

i) Idade ( )

j) Número de alunos de uma sala de aula ( ) k) Salário (em R$) ( )

l) Concentração de proteínas de bifes de alcatra ( ) m) Temperatura (em ºC) ( )

n) Religião ( ) o) Raça ( )

p) Estatura (em metros) ( ) q) Nível sócio econômico ( ) r) Funcionalidade ... ( )

s) Possuir ou não casa própria ( ) t) Tempo ( )

u) Número de um calçado ( )

(7)

EXERCÍCIOS

1) A tabela abaixo apresenta 5 variáveis. Determine quais são estas variáveis e classifique cada uma delas em quantitativas ou qualitativas.

Estado civil Grau de instrução Número de filhos Altura (m) Região de procedência

Solteiro Fundamental 0 1,51 Interior

Casado Médio 0 1,82 Capital

Casado Fundamental 1 1,58 Interior

Solteiro Médio 0 1,68 Capital

Casado Fundamental 1 1,75 Capital

2) Imagine que você é o (a) chefe de uma equipe de enfermeiros de um hospital com 5.000 pacientes em Curitiba. Infelizmente têm ocorrido muitos casos leves e graves de infecção hospitalar em diversos setores do hospital. Você ficou incumbido(a) de analisar quantos casos têm ocorrido e em que turno mais ocorrem. Como você faria isso? A primeira coisa a fazer é determinar quem é a população estatística e escolher quem será a sua amostra. Determine, então, como você vai ―obter‖ sua amostra. Pense em todas as possibilidades e explique o modo de resolver este caso.

3) Abaixo há alguns exemplos de populações estatísticas e de suas possíveis amostras. Analise primeiramente o todos os ítens e combine os exemplos de 2 a 2, determinando quem é a população e quem é a amostra de cada uma das combinações. Faça todas as combinações possíveis (Ex: 1-2; 1-3 e 2-3). Faça então o mesmo procedimento no quadro da direita.

1- Pacientes de hemodiálise do HC

2 - Pacientes de hemodiálise de 30 a 40 anos de idade do HC

3 - Pacientes de hemodiálise

4 - Seringas descartáveis de 10 mL do setor de quimioterapia

5 - Seringas descartáveis

6 - Seringas descartáveis de 10 mL

4) Uma famosa marca de gás está sendo processada por distribuir em todo o país botijões com uma quantidade menor de metano do que está impresso na embalagem. Para não pagarem a multa, os

assessores desta empresa recolheram 500 botijões provenientes de São Paulo, Belo Horizonte, Curitiba e Vitória e os mandaram para a análise. O que você acha deste procedimento? A amostragem foi correta? Poderemos confiar nos resultados? Justifique sua resposta determinando quem é a população estatística e quem é a amostra.

5) Você quer analisar o perfil dos alunos da sua sala de aula. Quais variáveis você poderia utilizar? Dê pelo menos 10 exemplos, determinando o tipo de cada uma das variáveis (quantitativas ou qualitativas). 6) Existem dois tipos de Estatísticas, a Descritiva e a Indutiva. Qual delas é utilizada para:

a) elaborar gráficos; b) analisar gráficos;

c) determinar, a partir de dados amostrais, algo que ocorre na população estatística; d) calcular a freqüência de diabéticos juvenis entre pacientes obesos de 10 a 15 anos; e) comparar a eficiência de um novo remédio em relação a um antigo;

(8)

TÉCNICAS DE AMOSTRAGEM

Definida a população, é preciso definir a técnica de amostragem, isto é, o procedimento que será adotado para escolher os elementos que irão compor a amostra. Conforme a técnica utilizada, tem-se um tipo de amostra.

Amostra casual simples ou amostra aleatória

É composta por elementos retirados da população ao acaso. Logo, todo elemento da população tem igual probabilidade de ser retirado para compor a amostra.

Exemplo:

1) sorteio dos alunos da sala

2) retirar animais de um frasco de vidro com uma pipeta

3) contar aleatoriamente o número de espécies existentes em uma dada área Amostra sistemática

Os elementos da amostra são escolhidos por um sistema. Exemplo:

1) chamar para a amostra todos os alunos com números terminado em um determinado dígito (e.g. par ou ímpar)

2) em uma população organizada, obter uma amostra de 2% dos prontuários dos pacientes de uma clínica – retirar o último de cada 50 prontuários (melhor do que fazer sorteio até atingir 2%!)

Tamanho da população (N) = 1000 = 10 Tamanho da amostra desejada 10

Amostra estratificada

A amostra estratificada é composta por elementos provenientes de todos os estratos da população, garantindo assim a representatividade da população.

Exemplo:

1) uma população de Mysidacea apresenta diferentes classes etárias (juvenis, machos imaturos, machos maduros, fêmeas imaturas, fêmeas vazias, fêmeas ovígeras). Devemos, então, retirar uma amostra de cada uma das classes e depois reunir todas as amostras e uma só. Esta amostra final é estratificada.

2) Pessoas de uma cidade que moram em diferentes bairros e que apresentam diferentes níveis sociais.

300 200 idosos adolescentes 400 100 crianças adultos 25 25 idosos adolescentes 25 25 crianças adultos Amostra estratificada uniforme = todos os estratos da amostra

têm o mesmo número de observações

Reduz a heterogeneidade

- Escolher um número qualquer entre 1 e 10. (exemplo = 3)

- A cada dez números, toma-se um. (exemplo = 3. 13. 23, 33, 43...)

(9)

Amostra estratificada proporcional = garante a mesma proporcionalidade da população

Amostra de conveniência

A amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Os estatístico têm muitas restrições em relação à esta técnica de amostragem, porém, com relativa freqüência este é o único método que pode ser empregado, principalmente em se tratando de pesquisa na área de saúde. Nesta área muitas vezes existem amostras de um determinado caso, ocorrentes em um único hospital, ou clínica, sendo posteriormente extrapolado para toda uma população.

Precisa-se ser criterioso como amostras de conveniência, para não ser tendencioso

1) se o professor tomar os alunos de sua classe como amostra de toda a escola, estará usando uma amostra de conveniência.

2) Estimar a probabilidade de morte por desidratação. Não se deve recorrer aos dados de um hospital, pois aí só são internados os casos mais graves, logo, é possível que a mortalidade entre pacientes internado seja muito maior do que em pacientes não-internados. Análise tendenciosa!

300 200 idosos adolescentes 400 100 crianças adultos 30 20 idosos adolescentes 40 10 crianças adultos N = 1000 N = 100

(10)

Exercícios

1. Imagine que você precisa descobrir quantas pessoas são internadas em hospitais particulares por problemas digestivos em Curitiba, no mês de julho. Dê exemplos consistentes de como fazer isso utilizando os 4 tipos de amostragem citados acima. Após exemplificar os 4 tipos, escolha o que você achar mais eficaz e explique a razão.

2. Os prontuários dos pacientes de um hospital estão organizados em um arquivo por ordem alfabética. Qual o melhor tipo de amostragem para recolher 1/3 do total dos prontuários. Justifique sua resposta e explique o procedimento.

3. Uma clínica tem dez quartos, com seis pacientes em cada. Como você selecionaria dez paciente? Explique sua amostragem.

4. Organize um lista com dez nomes em ordem alfabética e descreva uma forma de obter uma amostra sistemática de cinco nomes.

5. Dada uma população de quatro pessoas: Luis, João, Camila, Joana, quantas amostras aleatórias de tamanho dois (contendo duas pessoas), podem ser obtidas? Exemplifique.

6. Você é incumbido para fazer uma pesquisa de mercado sobre a preferência da população com relação a serem tratados por nutricionistas do sexo masculino ou feminino. Seu chefe sugere que você amostre as pessoas utilizando uma lista telefônica de assinantes, escolhendo o décimo de cada dez assinantes. Critique este procedimento. Elabore uma nova amostragem para alcançar os objetivos da pesquisa e explique a razão de sua escolha.

7. Para levantar o conhecimento de crianças de oito a dez anos sobre a importância de ingerir vegetais, um nutricionista elaborou um questionário e o entregou às crianças que conhecia: dois filhos seus, dois amigos deles que freqüentavam a casa, quatro sobrinhos e três filhos de colegas seus, também dentistas. Que tipo de amostragem ele utilizou ? Você acha que os dados obtidos podem ter algum tipo de tendência ? Como você faria esta amostragem ?

8. Descreva diferentes técnicas de amostragem para levantar dados sobre o hábito de fumar e o consumo de álcool entre os alunos de uma grande universidade.

(11)

TIPOS DE GRÁFICOS MAIS USADOS

Gráficos de diferentes tipos para diferentes dados. 1. Gráfico de colunas

São muito usados. Um gráfico de colunas ilustra as comparações entre itens individuais. Normalmente exemplificam dados contáveis, pontos médios, freqüências absolutas ou relativas, sem um acompanhamento temporal das variáveis.

2. Gráfico de barras

São os mais usados. Muito semelhante ao de colunas, também ilustrando comparações entre itens individuais, porém permitindo a inclusão de um acompanhamento temporal das variáveis, se desejado. O tempo, neste caso, não recebe uma grande ênfase no gráfico.

0 2 4 6 8 10 12 14 16 Q u a n ti d a d e d e p a ra s ito s

B. soporator S. cristata C. idella

Controle Tratamento

Sobrevida média de pacientes com IRC

0 5 10 15 20 25 30 35 40

um três quatro oito dez

Tempo em anos Q u a n ti d a d e d e p a c in e te s Qtde de formandos 0 10 20 30 40 50 60 70 1980 1985 1990 1995 2000 Grau de escolaridade e o

Conhecim ento sobre a funcão do Enferm eiro

0 20 40 60 80 100 F u n d a m e n ta l M é d io S u p e rio r

(12)

3. Gráfico de linhas

Gráficos de linha sólida são similares aos de Barras, porém mostram as tendências dos dados em intervalos iguais, como por exemplo, em meses. É muito utilizado quando se deseja acompanhar alguma variável durante um período de tempo.

4. Histogramas

São utilizados para representar um conjunto de freqüências absolutas observadas para um dado fenômeno estudado, dentro de intervalos, ou categorias pré estabelecidas. Podem ser utilizados para representar a freqüência de dados em qualquer tipo de categoria estudada, como intervalos de pressão, idades, níveis de colesterol, classes de tamanho, meses do ano etc.

5. Dispersão

Mostram as relações entre valores numéricos em várias séries de dados. Mostram normalmente o ponto médio dos dados, podendo indicar os valores máximos e mínimos. % ( n c /n t) 2 1 0 1 2 3 4 5 6 7 Agosto/99 nt=6415 Juvenis Machos Imaturos Machos Maduros Fêmeas Imaturas Fêmeas Ovígeras Fêmeas Vazias 0 5 10 15 20 25 30 1 6 a 2 1 2 2 a 2 8 2 9 a 3 5 3 6 a 4 1 4 2 a 4 8 4 9 a 5 5 5 6 a 6 1 6 2 a 6 8 6 9 a 7 5

Idade dos entrevistados

% d e e n tr e v is ta d o s ( n t: 1 0 0 ) 12 15 18 21 24 27

Agosto Setembro Outubro Novembro Dezembro

T e m p e ra tu ra m é d ia d a á g u a ( o C ) Atami Mansa Leste Mé d ia d a T e m p e ra tu ra ( o C) 0 5 10 15 20 25 30 35 40 JANEIRO FEVEREIRO MARÇO ABRIL MAIO JUNHO JULHO Máxima Mínima Méia

(13)

5. Gráfico circular ou setorial  pizza – rosca...

Mostra a dimensão proporcional dos itens que compõem uma série de dados relativamente à soma dos itens. Revela-se útil quando se pretende enfatizar um elemento importante, em relação ao todo.

Para facilitar a visualização de setores pequenos, deve-se agrupá-los como um item num gráfico circular e, em seguida, deve-se decompor esse item num gráfico menor ao lado do gráfico principal.

6. Pictogramas

São construídos a partir de figuras representativas da intensidade do fenômeno. Os símbolos devem ser auto-explicativos.Vantagens:despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Desvantagens: mostram uma visão geral do fenômeno, sem detalhes. Os símbolos devem ser usados para comparações, nunca para afirmações isoladas.

Grau de escolaridade (%) 35% 56% 9% Fundamental Médio Superior

Dogas Utilizadas no Ensino Médio

Maconha Cocaína Crack Cola Benzina

Drogas mais Utilizadas no Ensino Médio

2,0% 0,8% 0,4% 0,6% 0,3% Maconha Cocaína Crack Benzina Cola LSD Heroína Cogumelos Ácidos Outros

(14)

DÍGITOS SIGNIFICATIVOS E ARREDONDAMENTO

Dígitos significativos = são os números que expressam os dados, os quais representam uma informação precisa. Os dígitos que não são acurados servem, freqüentemente, apenas para localizar a vírgula. Exemplo:

Foram realizar mensurações de peso em 100 gambás. A balança utilizada apresenta dois dígitos após a vírgula. (existem números que variam após estas duas casas decimais, logo, este último número não é preciso). A média resultante foi de 5,23 kg. Os dígitos significativos são 5 e 2.

Arredondamento de dados = o arredondamentos de um número à unidade mais próxima (décimo, ou outra decimal) reduz seus dígitos significativos ao número de dígitos significativos garantido pelo cálculo realizado

Se o número seguinte ao número a ser arredondado for maior ou igual a 5, soma-se uma unidade ao ―arredondado‖.

Ex.: 2,354 – arredondar na decimal  2,4

Se o número seguinte ao número a ser arredondado for menor que 5, o ―arredondado‖ permanece inalterado.

Ex.: 2,324 – arredondar na decimal  2,3

Caso após o valor a ser arredondado o número termine em 5, a regra é alterada. Se o número a ser arredondado for par, o valor permanece. Caso seja ímpar, soma-se uma unidade ao ―arredondado‖. Ex.: 2,45 – arredondar na decimal (4 é par)  2,4

2,55 – arredondar na decimal (5 é ímpar)  2,6

 Arredondamento de dados (continuação...)

Pode ocorrer, ainda, de um número ter que ser arredondado em relação à casa que ocupa.

 LEMBRETE:

8754,621

 Assim, pode-se, por exemplo, arredondar um número na sua centena, sempre seguindo as regras de arredondamento acima citadas.

Exs: a) 1234,22 = 1200 c) 1250 = 1200 b) 255,2 = 260 d) 8898 = 8900 milhar centena dezena unidade decimal centesimal milesimal Cuidado para não confundir “dezena’com “decimal”

(15)

 Pode-se, portanto, arredondar um número em qualquer casa que ele ocupe. Exemplos:

1 – Arredonde os números abaixo no centesimal:

a) 0,225 = 0,22 c) 22,555 = 22,56

b) 1324,221 = 1324,22 d) 0,318 = 0,32

2 – Arredonde os números abaixo na dezena:

a) 10,285 = 10 c) 775 = 780

b) 1824,221 = 1820 d) 1285 = 1280

3 – Arredonde os números abaixo no milhar:

a) 1234 = 1000 c) 1500 = 2000

b) 8895,2 = 9000 d) 2500,00 = 2000

EXERCÍCIOS

Dígitos significativos e Arredondamento

1) Arredondar apropriadamente as operações abaixo, indicando na resposta o número de dígitos significativos:

a) 54,40 + 127 + 125,53 + 400 (à centena mais próximo) = b) 3500 – 125,87 (à centena mais próximo) =

c) 5830 – 27,55 (à unidade mais próxima) = d) 4579 – 356,89 (ao decimal mais próximo) = 2) Arredondamento de dados

a) 5789 (à centena mais próxima)  b) 6501 (ao milhar mais próximo)  c) 130,055 (à unidade mais próxima)  d) 28,65 (ao decimal mais próximo)  e) 19,95 (ao decimal mais próximo)  f) 32,505 (ao centesimal mais próximo)  g) 57,8755 (para 4 dígitos significativos)  h) 24,54 (para 3 dígitos significativos)  i) 92,445 (para 4 dígitos significativos)  j) 8,875 (para 3 dígitos significativos)  k) 15,05 (para a decimal mais próxima) 

(16)

3)Arredonde cada uma dos números abaixo, conforme a precisão pedida: 3.1) Para o decimal mais próximo:

a) 23,40 = b) 234,7832 = c) 45,09 = d) 48,85002 = e) 120,4500 =

3.2) Para o centesimal mais próximo: a) 46,727 =

b) 123,842 = c) 45,655 = d) 28,255 = e) 37,485 =

3.3) Para a unidade mais próxima: a) 46,727 =

b) 123,842 = c) 45,65 = d) 28,255 = e) 37,485 =

3.4) Para a dezena mais próxima: a) 42,3 =

b) 123,842 = c) 295 = d) 2995,000 = e) 59 =

4) Arredonde para o centesimal mais próximo: 0,061 + 0,119 + 0,224 + 0,313 = 0,717  0,72

5) Arredonde o resultado utilizando somente 3 números significativos. 4,015 + 7,667 + 11,411 + 8,712 + 12,468 = 44,273  44,3

(17)

6) Em algumas balanças, os 2 últimos dígitos não são totalmente precisos. Arredonde os valores abaixo, os quais foram obtidos pelas balanças.

a) 22,55 = 23 e)1122,50 = 1122

b) 1254,02 = 1254 f) 44,33 = 44

c) 0,0224 = 0,02 g) 1000,52 = 1001

d) 7250 = 7200 h) 5,55 = 6

FREQUÊNCIAS

Freqüências simples ou absolutas: são os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados da distribuição.

Freqüências relativas: são os valores das razões entre as freqüências absolutas de cada classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100 %).

Freqüências acumuladas: são somadas todas as observações existentes na classe com as demais observações das classes anteriores.

Porunhagem  0,35 Porcentagem  0,35 x 100 = 35 % Classes Freqüência Absoluta Freqüência Absoluta Acumulada Freqüência Relativa Freqüência Relativa Acumulada 41 |--- 45 7 7 0,35 0,35 ou 35 % 45 |--- 49 3 10 0,15 0,50 ou 50 % 49 |--- 53 4 14 0,20 0,70 ou 70 % 53 |--- 57 1 15 0,05 0,75 ou 75 % 57 |--- 61 5 20 0,25 1,00 ou 100 % Total 20 20 1,00 1,00 ou 100 %

(18)

 DISTRIBUIÇÃO DE FREQUÊNCIA

É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores).

Tabela primitiva ou de dados brutos: é uma tabela ou relação de elementos que não foram

numericamente organizados. É normalmente a primeira tabela a ser feita. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

ROL: é a tabela obtida após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuição de freqüência sem intervalos de classe: é a simples condensação dos dados conforme as

repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já que exige muito espaço. Veja exemplo abaixo:

Dados Freqüência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20

Distribuição de freqüência com intervalos de classe: quando o tamanho da amostra é elevado, é mais

racional efetuar o agrupamento dos valores em vários intervalos de classe. Classes Freqüências 41 |--- 45 7 45 |--- 49 3 49 |--- 53 4 53 |--- 57 1 57 |--- 61 5

(19)

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (com intervalos de classe):

CLASSE: são os intervalos de variação da variável. São sempre iguais, em todas as classes.

Ex: na tabela anterior há 5 classes, onde a 3ª classe é representada pela freqüência de dados encontraos entre 49 e 53 cm (49 |--- 53)

LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe

e o maior número, o limite superior de classe. Ex: em 49 |--- 53 (classe 3), o limite inferior é 49 e o superior é 53. O símbolo |--- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não pertence a classe 3 e sim a classe 4 representada por 53 |--- 57.

AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e

inferior da classe. Ex: na tabela anterior, a amplitude da classe 3 é = 53 - 49 = 4. Obs: Na distribuição de freqüência c/ classe, a amplitude de classe será sempre igual, em todas as classes.

AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo

da amostra (ROL), antes de se transformada em tabela. Em nosso exemplo, a amplitude a amostra é = 60 - 41 = 19. A

AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior da última classe e o

limite inferior da primeira classe. Ex: na tabela anterior, a amplitude da distribuição é = 61 - 41= 20. Obs: a amplitude da distribuição normalmente será maior do que a da amostra

PONTO MÉDIO DE CLASSE: é o ponto que divide o intervalo de classe em duas partes iguais. ..Ex:

a classe 3 compreende os valores que vão de 49 |--- 53. O ponto médio será, então, (53+49)/2 = 51.

 MÉTODO PRÁTICO PARA CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSE:

1º - Organize os dados brutos (Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51) em um ROL (Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60).

2º - Calcule a amplitude amostral  Ex: 60 - 41 =19

3º - Se você não souber quantas devem ser as classes, calcule o número de classes através da "Regra de Sturges": K = 1 + 3,33 log n, onde K = número de classes e n = número total de dados

No nosso exemplo: n = 20 dados, então, de acordo com a regra: K = 1 + 3,33 log n  K = 1+3,33 log 20  K = 1 + 3,33(1,30)  K = 5,33  5 Assim, a princípio, a regra sugere a adoção de 5 classes.

(20)

Assim: a amplitude do intervalo de classe é 19/5 = 3,8  4  Deve-se sempre arredondar esse valor para haver folga na última classe.

5º - Temos então o menor nº da amostra (41), o nº de classes (5) e a amplitude do intervalo (4). Podemos montar a tabela, com o cuidado para não aparecer classes com freqüência = 0 (zero).

No nosso exemplo: o menor nº da amostra é de 41, e a amplitude do intervalos de cada classe é de 4. assim, a primeira classe compreenderá os valores de (41 + 4 = 45)  41 |--- 45. As classes seguintes respeitarão o mesmo procedimento.

Os primeiros elementos das classes seguintes sempre serão formados pelo último elemento da classe anterior.

EXERCÍCIOS  CONSTRUÇÃO DE TABELA DE FREQUENCIA ABSOLUTA COM INTERVALOS DE CLASSES

1) Com os dados da planilha abaixo: a)classifique cada variável quanto ao tipo;

b)escolha uma variável quantitativa e faça todos os passos para a construção de uma tabela de freqüência absoluta com intervalo de classes. (Dica: seu 1º passo deve ser a construção de um ROL, ou AMOSTRA, sendo que a tabela e dados brutos está representada abaixo. O 2º passo deve ser a construção de uma tabela de distribuição de freqüência sem intervalos de classe. O 3º passo deve ser a construção de uma tabela de distribuição de freqüência com intervalos de classe. Para isso você precisa determinar a quantidade de classes (K) de sua tabela, utilizando a "Regra de Sturges", cuja fórmula é: K = 1 + 3,33 log n, onde K = número de classes e n = número total de dados. Após determinado o número de classes, você deve então descobrir a amplitude de cada intervalo de classe (A), utilizando a fórmula: A = amplitude amostral K. Não se esqueça de arredondar tanto o número de classes quanto a amplitude de intervalo de cada classe para a unidade mais próxima.)

Estado civil Grau de instrução Número de irmãos Salários Mínimos Região de procedência

Solteiro Fundamental 0 5 Interior

Casado Médio 0 26 Capital

Casado Fundamental 1 9 Interior

Solteiro Médio 0 13 Capital

Solteiro Médio 0 6 Capital

Casado Médio 2 10 Interior

Casado Fundamental 1 8 Capital

Casado Superior 2 14 Outro

Casado Superior 1 16 Interior

Solteiro Pós Graduação 0 25 Capital

Solteiro Fundamental 0 12 Outro

Solteiro Médio 0 13 Interior

Solteiro Superior 0 26 Capital

Casado Fundamental 1 17 Outro

Casado Médio 3 8 Outro

Solteiro Superior 0 12 Interior

Solteiro Médio 0 4 Capital

Casado Fundamental 1 18 Outro

Solteiro Fundamental 0 11 Capital

Solteiro Fundamental 0 4 Interior

Casado Superior 1 27 Outro

Casado Fundamental 2 10 Capital

(21)

MÉDIA ARITMÉTICA – MÉDIA PONDERADA – MODA – MEDIANA

Em um amostra, quando se têm os valores de uma certa característica, é fácil constatar que os dados normalmente não se distribuem uniformemente, havendo uma certa concentração. Pode-se, portanto, estudar os valores numéricos que determinam a distribuição dos dados, procurando o ponto onde está a maior concentração de valores individuais. De um modo geral, um conjunto de dados pode ocupar uma posição específica dentro de uma distribuição. Essas medidas que "posicionam" o dado (ou o grupo de dados) dentro de uma distribuição, são chamadas de medidas de tendência central.  Essas medidas são: média (aritmética, ponderada etc); mediana e moda.

Essas medidas mostram a informação sobre todos os dados e sua distribuição, de maneira ―resumida‖. Elas dão o valor do ―ponto‖ em torno do qual os dados se distribuem!

Média Aritmética: M ou

É a soma de todos os valores, dividida pelo número total desses valores

Em um conjunto com vários dados (x1, x2, x3, x4...), a = (x1 + x2 + x3 + x4 +...) / n ou x / n Onde ―n‖ é o número total de dados.  Ex.: 10; 2; 9; 6; 8  M = (10 + 2 = 9 + 6 + 8) /5 = 7. Significado: corresponde a um "ponto de equilíbrio" (valor em torno do qual os dados se distribuem). Só se deve arredondar a média quando ela representar variáveis quantitativas discretas, como por exemplo idade, número de filhos etc., as quais não podem ser expressas com números fracionados.

Mediana: Md

É o valor que ocupa a posição central dos dados, após estes serem ―organizados‖ em ordem crescente ou decrescente (ROL). A mediana divide a amostra ―exatamente no meio‖, no caso da amostra possuir um número ―ímpar‖ de dados.

Ex: 71; 82; 57; 68; 78; 75; 64; 61; 85 (n = 9)

ROL: 57; 61; 64; 68; 71 ; 75; 78; 82; 85.  A mediana é 71.

Obs.: metade dos dados são menores ou iguais à mediana (71) e a outra metade, maior.

Se o número total de dados for ímpar, a mediana será a média aritmética dos pontos centrais, ou seja, pega-se os 2 valores que estão nas posições centrais e divide-os por 2.

Pode-se usar a seguinte fórmula para encontrar a posição da mediana: Md = (n+1)/2 Ex: 71; 82; 57; 68; 69; 78; 75; 64; 61; 85  no de dados: 10 (par).

ROL: 57; 61; 64; 68; 69; 71 ; 75; 78; 82; 85 Mediana  (n+1)/2  (10+1)/2 = 11/2  5,5

Ou seja, a mediana está entre a posição 5 e 6  Assim, soma-se o número da posição 5, que é 69, com o número da posição 6, que é 71, e divide-se esta soma por 2  (69 + 71)  2 = 70  Mediana = 70 Ex: 71; 82; 57; 68; 86; 69; 78; 75; 64; 61; 85  no de dados: 11 (ímpar).

ROL: 57; 61; 64; 68; 69; 71 ; 75; 78; 82; 85; 86  no de dados: 11 (ímpar)

Mediana  (n+1)/2  (11+1/2) = 12/2 = 6  Ou seja, a mediana está na posição 6, que é ocupada pelo número 71  Mediana = 71

Moda: Mo

É o valor que ocorre com mais freqüência entre todos os dados, após estes serem organizados em ordem crescente ou decrescente (ROL).

Ex.: 5; 4; 3; 6; 6; 3; 1; 6; 2

ROL: 1; 2; 3; 3; 4; 5; 6; 6; 6  Moda = 6

Se existir apenas uma moda em uma amostra, significa que há apenas um grupo de indivíduos com aquelas variações, ou seja, a amostra é homogênea. Mas se houver mais modas, há grupos diferentes dentro daquela amostra. Diz-se, então, que a amostra é heterogênea.

(22)

Obs.: em geral a mediana pode dar melhor idéia da tendência central dos dados quando existem valores muito discrepantes.

Ex.: 0; 9; 8; 10  Média = 6,75  Mediana = 8,5  Moda= não existe. A mediana, neste caso, representa melhor a amostra.

MEDIDAS DE TENDÊNCIA CENTRAL EM TABELAS DE DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS DE CLASSES

1) Média: M ou

Para obter a média de dados que estão expressos em freqüência distribuídas em classes, deve-se seguir os seguintes passos: 1º - obter o ―ponto médio‖ de cada classe (é a média aritmética dos valores mínimo

e máximo da cada classe);

2º - multiplicar o ponto médio de cada classe pela respectiva freqüência absoluta; 3º - somar o produto de cada multiplicação;

4º - dividir esse resultado pelo ―n‖ (número total de dados). Exemplo:

M = (43 x 7) + (47 x 3) + (51 x 4) + (55 x 1) + (59 x 5) / 20

M = 301 + 141 + 204 + 55 + 295 / 20  M = 49,8 (média)  não arredondar a média quando isto não for necessário. Deve-se arredondar quando ela representar variáveis quantitativas discretas, como idade, número de filhos etc., que não podem ser expressas com números fracionados. 2) Mediana: Md

Da mesma forma que já foi colocado acima, a mediana é a classe que divide os dados no meio. Assim, em uma tabela de distribuição de freqüências em intervalos de classes, a mediana é encontrada do mesmo modo.

Se a tabela tiver um número ímpar de classes, basta olhar a quantidade de classes e determinar aquela que divide a amostra ao meio.

Ex: na tabela acima há 5 classes  a mediana é a classe que divide as 5 ao meio, ou seja, a 3ª classe 49 |--- 53

Porém, se a tabela tiver um número par de classes, deve-se encontrar a posição da mediana da mesma maneira que se faz em dados que não estão dispostos em classes.

Classes Ponto médio Freqüência Absoluta 41 |--- 45 43 7 45 |--- 49 47 3 49 |--- 53 51 4 53 |--- 57 55 1 57 |--- 61 59 5 Total 20

(23)

3) Moda: Mo

É simplesmente a classe onde está concentrada a maior parte dos dados. Basta olhar a freqüência absoluta de cada classe e determinar a classe modal.

Ex: a 1ª classe é a que tem a maior freqüência (7), assim, a classe 41 |--- 45 é a classe modal Classes Ponto médio Freqüência Absoluta 41 |--- 45 43 7 45 |--- 49 47 3 49 |--- 53 50 4 53 |--- 57 55 1 57 |--- 61 59 5 61 |--- 65 63 6 Total 26 Ex: Md = (n + 1) / 2  Md = (26 + 1) / 2  27 / 2

 Md = 13,5  A classe mediana é aquela onde estão os números que ocupam entre a 13ª e a 14ª posição.

Assim, basta observar as freqüências e somá-las até se chegar na posição da mediana, que no caso, estará entre a 13ª e a 14ª posições. Assim, estas estão incluídas na 3ª classe  49 |--- 53.

Assim, a classe mediana é a que vai de 49 |--- 53 (ou: de 49 a 52).

(24)

EXERCÍCIOS

1) Supondo os seguintes dados, já ordenados: 4 - 5 - 6 - 6 - 6 - 7 - 7 - 7 - 8 - 8 9 - 9 - 9 - 9 - 9 - 10 - 10 - 10 - 10 - 11 12 - 12 - 12 - 12 - 12 - 13 - 13 - 13 - 13 - 14 14 - 15 - 15 - 15 - 15 - 15 - 16 - 17 - 18 - 19 19 - 19 - 20 - 20 - 21 - 22 - 23 - 24 - 25 - 26

a) calcule a média ( = x / n)  e explique seu significado =

O valor ________ é um ponto de equilíbrio entre os dados, ou seja, eles se distribuem em torno deste valor.

b) calcule a mediana (Md)  Md = (n+1)/ 2  e explique seu significado Md = (50+1)/2 = 51/2 = 25,5 (entre a posição 25 e 26)

Posição 25 = 12 e posição 26 = 13 Md = 12 + 13 / 2  12,50

Metade dos dados está acima de 12,50 % e a outra metade está abaixo.

c) calcule a moda (Mo)  explique seu significado e diga se a amostra é homogênea, ou heterogênea.

Mo =

Os valores _____________ são os mais freqüentes na amostra, ou seja, há muito dados com tais valores. A amostra tem ____ moda(s), sendo assim caracterizada como __________ e, por esse motivo, é uma amostra _________________.

2) Os dados abaixo referem-se à altura em cm de uma amostra de 54 universitários de sexo masculino e já estão organizados em orem crescente.

160 160 161 162 162 162 164 164 165 165 166 166 166 167 167 168 168 169 169 169 169 170 170 170 170 171 171 171 172 172 172 172 173 174 174 174 175 175 175 177 177 177 177 177 178 178 179 179 180 180 183 185 188 192

Calcule: a) média - b) mediana - c) moda a) média  M = x / n

M =

b) mediana  Md = (n+1)/2 Md =

(25)

3) A tabela abaixo (Tab. I) apresenta o percentual de água no cérebro de cobaias machos com 90 dias de idade. Determine e dê o significado:

a) da média dos dados; b) da mediana; c) da moda. a) Média: M = x / n M =

A média significa que os dados se distribuem em torno do valor de _________________. b) Mediana: Md = (n + 1) / 2  com os dados organizados

Md =

Md = __________  não arredondar a mediana, quando esta ficar igual a um dos números da amostra. Metade dos dados está acima de __________________ e a outra metade está abaixo.

c) Moda: Mo

4) No exercício acima, se você tivesse que representar a amostra apenas com “uma” medida de tendência central, qual você escolheria e porquê?

R:

____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ 5) Uma escola chamada “Iniciantes na Gastronomia” possui 10 alunos com as seguintes idades: {8, 10, 11, 47, 48, 49, 51, 55, 56, 57 }. Qual das medidas de tendência central representaria melhor esta amostra de pacientes? Escolha somente “uma” medida, dê o seu valor e explique a razão de sua escolha.

R:  Média = 39,2  39 anos  Mediana = 48 + 49 / 2 = 48,5  48 anos  Moda = não há moda ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ 68,86 79,86 68,97 79,87 79,25 79,90 79,55 79,91 79,85 80,06 Tab. I Dados brutos 80,06 68,86 68,97 79,90 79,85 79,91 79,87 79,55 79,86 79,25 Tab. I Dados organizados

(26)

 “EXERCÍCIO SOBRE FREQÜÊNCIAS E MEDIDAS DE TENDÊNCIA CENTRAL”

1) A tabela abaixo representa o salário (R$) de uma amostra de 25 funcionários selecionados em uma empresa.

a) Construa para estes dados a distribuição de freqüências em intervalos de classes, organizando os dados primeiramente em um Rol, já passando para a elaboração da ―tabela de freqüência com intervalo de classes‖ (por meio da Regra de Sturges). A ―tabela de freqüência sem intervalos de classes‖ não será feita, pois todos os valores são diferentes entre si. Após encontrar a freqüência absoluta, calcule a freqüência absoluta acumulada, a freqüência relativa e a freqüência relativa acumulada. Faça então, um histograma para representar esses dados, dizendo se eles têm ou não uma distribuição normal.

Tabela: salário (R$) de 25 funcionários de uma empresa.

1298,00 1000,00 1478,88 1700,00 1601,00 1400,00 1698,98 1800,99 1500,00 1500,00 1245,00 1598,05 1350,00 1645,45 1301,20 1248,50 1504,00 1458,44 1100,10 1520,00 1399,85 1450,20 1787,02 1402,25 1988,85  1º PASSO: ROL 1000,00 1100,10 1245,00 1248,50 1298,00 1301,20 1350,00 1399,85 1400,00 1402,25 1450,20 1458,44 1478,88 1500,00 1500,00 1504,00 1520,00 1598,05 1601,00 1645,45 1698,98 1700,00 1787,02 1800,99 1988,85

 2º PASSO: REGRA DE STURGES No de classes (K)  K = 1 + 3,33 log n K =

Amplitude do intervalo de classes (A)  A = amplitude amostral / K A =

 NUNCA ARREDONDAR A AMPLITUDE DE INTERVALO DE CLASSES QUANDO AVARIÁVEL FOR “QUANTITATIVA CONTÍNUA”

(27)

 3º PASSO: CONSTRUÇÃO DE UMA TABELA DE FREQÜÊNCIA COM INTERVALOS DE CLASSES Classes Salários R$ N o funcionários (Freq. absoluta) Freq. absoluta acumulada Freqüência relativa (%) Freq. relativa Acumulada (%) Total 25 100

b) Determine e dê o significado: da média dos dados; da classe mediana e da classe modal, dizendo se a amostra é unimodal, ou bimodal e se é homogênea, ou heterogênea.

 Média

1º - encontrar o ponto médio das classes.

Média:

M = (ponto médio x freq. absoluta) / n (número total de dados) M =

M =

Os salários dos 25 funcionários estão distribuídos em torno do valor de __________________  Classe Mediana (Md)

Md = (n+1)/2  n = número total de dados Md =

A classe mediana é aquela que inclui o número que está na _______ posição dentro da distribuição de freqüências dos dados organizados.

A classe mediana, então, é a _____________________________.

Assim, metade dos funcionários recebem igual ou menos do que a faixa de_______________________; e a outra metade, recebe igual, ou mais do que isso.

Classes Salários R$ Ponto médio

No funcionários (Freq. absoluta)

(28)

EXERCÍCIOS  MEDIDAS DE TENDÊNCIA CENTRAL 1) A mediana da série de dados { 1, 3, 8, 15, 10, 12, 7 } é : a) igual a 15

b) igual a 10 c) igual a 8 d) igual a 3,5

e) não há mediana, pois não existe repetição de valores.

2) Segundo o site de VEJA na Internet, 28% da população brasileira é de origem africana, 32% de origem portuguesa, 20% de origem italiana e 20% de outras origens. Qual é a moda quanto à origem ?

a) 32% b) 20%

c) 32% da população. d) origem portuguesa.

e) não podemos identificar a moda por falta de dados. 3) Na série de dados formada por {-1 , -2, 3 , 4 }: a) a mediana está entre -2 e 3.

b) a mediana é 1

c) a questão a) e b) estão corretas. d) a mediana é 1.

e) não existe mediana, pois não há dados repetidos. 4) Na série de dados formada por { 3 , 1 , 2 , 3 , 6 }: a) mediana > moda > média.

b) moda < média < mediana. c) moda = mediana = média.

d) mediana = média e não há moda. e) média > mediana e não há moda

5) Quando desejamos o ponto médio exato de uma distribuição de freqüência, basta calcular: a) o desvio médio.

b) a média. c) a moda. d) a mediana.

e) qualquer medida de posição

6) Considere uma amostra com 2351 dados (elementos). A “posição” da mediana é representada pelo:

a) 1175º elemento. b) 1176º elemento.

c) ponto médio entre o 1175º e o 1176º elemento. d) 1175,5º elemento.

e) impossível resolução, pois não há identificação dos elementos.

7) Qual medida de tendência central deve ser usada para representar amostras que possuem dados muito discrepantes (diferentes) entre si?

a) moda b) mediana c) média

(29)

EXERCÍCIO SOBRE FREQÜÊNCIAS E MEDIDAS DE TENDÊNCIA CENTRAL

1) A tabela abaixo representa a temperatura de crianças (em oC) de uma amostra de 140 pacientes em desnutrição.

 a) Calcule a freqüência absoluta acumulada, a freqüência relativa e a freqüência relativa acumulada. Faça então, um histograma para representar esses dados, mostrando o polígono de freqüência e dizendo se os dados têm ou não uma distribuição normal.

 b) Determine e dê o significado: da média dos dados da tabela; da classe mediana e da classe modal, dizendo se a amostra é unimodal, ou bimodal e se é homogênea, ou heterogênea. Indique no histograma a coluna que representa a classe modal

Temperatura (em oC) Número de pacientes (freqüência absoluta) Freqüência absoluta acumulada Freqüência relativa (%) Freqüência relativa acumulada (%) 37,5 |--- 39,5 01 39,5 |--- 41,5 02 41,5 |--- 43,5 17 43,5 |--- 45,5 20 45,5 |--- 47,5 43 47,5 |--- 49,5 57 Total 140 --- 100 --- Temperatura (em oC)

Ponto Médio Número de

computadores (freqüência absoluta) 37,5 |--- 39,5 39,5 |--- 41,5 41,5 |--- 43,5 43,5 |--- 45,5 45,5 |--- 47,5 47,5 |--- 49,5 Total --- 140 Classe modal  Classe mediana Esta é a classe modal 5 10 15 20 25 30 35 40 45 F re q ü ê n c ia r e la ti v a ( % ) Média = Média = _______________________  ponto de equilíbrio da amostra.

Distribuição NÃO é normal !

(30)

MEDIDAS DE VARIABILIDADE E DISPERSÃO

1) Amplitude Total (At ou R) - Intuitivamente, quando queremos saber o grau de variabilidade de um conjunto de números, a primeira coisa a fazer é verificar qual o maior e qual é o menor deles. Se eles forem muito diferentes, então, será maior a dificuldade de uma medida qualquer de tendência central (média, moda ou mediana) representar bem, sozinha, o conjunto. A diferença entre o maior e o menor seria uma medida simples deste grau de dispersão dos dados. A Amplitude Total foi o nome dado a esta diferença e é muitas vezes utilizada como medida de dispersão ou variabilidade.

R = Máx - Mín

Ex1: observe a tabela abaixo:

Renda Quantos anos

morou com os pais?

Com quantos teve o primeiro emprego? Período na escola Mínimo R$ 180,00 0 12 0 Máximo R$ 5000,00 27 19 12 Amplitude Total R$ 4820,00 27 7 12

Ex2: Calcular a amplitude dos dados: {2; 3; 6; 9; 11; 10; 9; 7; 4} At = 11 – 2 = 9

Obs.:

 Amplitude igual a zero = não houve variabilidade  Quanto maior é a amplitude = maior a variabilidade

 Amplitude não mede bem a variabilidade, pois não informa nada sobre valores intermediários

2) Variância (S2) – baseada nas diferenças entre cada valor do conjunto de dados e a média aritmética do grupo. Essas diferenças são elevadas ao quadrado antes de serem somadas, para que as medidas que possuem sinal negativo sejam anuladas. O único problema da variância é que a unidade que ela acaba sendo expressa também fica elevada ao quadrado. Ex: se estamos analisando a estatura de 50 pessoas, em metros, após ser obtida sua variância, a estatura estará sendo representada em ―m2‖, o que dificulta a compreensão do resultado. (Símbolos:  S2 = amostra)

S

2

= ∑( x – x )

2

n - 1

Significado: normalmente a variância é transformada para desvio padrão para a análise dos dados. Quando o ―desvio padrão‖ assume um valor alto (em relação aos valores da média e da amplitude da amostra em questão), significa que os dados desta amostra têm uma ―alta dispersão‖, ou seja, possuem valores discrepantes uns dos outros. Essa amostra, assim, é formada por dados diversos, não sendo caracterizada como homogênea. Porém, quando o ―desvio padrão‖ assume um valor baixo (em relação aos valores da e da média e da amplitude da amostra em questão), pode-se dizer que não houve muita variação nos dados desta amostra, possuindo seus dados, valores próximos ao da média da amostra.

Exemplo de cálculo de variância:

Ex.: determinar o desvio-padrão das seguintes medidas obtidas em laboratório: {5; 8; 10; 12; 15} Média = (x) / n = 10

(31)

Medidas (x) Média (M) x - M (x – M ) 2 5 10 5 – 10 = -5 25 8 10 8 – 10 = -2 4 10 10 10 – 10 = 0 0 12 10 12 – 10 = 2 4 15 10 15 – 10 = 5 25  = 58 S2 =  (x – M)2  n -1  S2 = 58  4  S2 = 14,5

3) Desvio padrão (S) - é a raiz quadrada da variância. É necessário que se obtenha a raiz quadrada da variância para que sua medida (Ex: m2), volte a ser expressa da mesma forma que aparece nas medidas originais (Ex: m). Seus valores ficam assim expressos nas mesmas unidades dos dados observados.

S = ∑( x – x )

2

n – 1

De acordo com o exemplo acima, basta calcular a raiz quadrada da variância pare se obter o desvio padrão :

S =  (x – M)2  n -1

S = 58  4 = 14,5  S = 3,8

Neste caso, a média dos dados é 10 e possui um desvio padrão igual a 3,8.

Ou seja, os dados da amostra variaram aproximadamente 3,8 ao redor da média, o que não é um valor muito alto, tendo-se uma amplitude total igual a 10.

(32)

EXERCÍCIOS: CÁLCULO DE MÉDIA, AMPLITUDE, VARIÂNCIA E DESVIO PADRÃO 1) Calcule a amplitude total, a média, a variância e o desvio padrão da altura (m) de 30 jovens do sexo masculino diagnosticados como estando ―abaixo do peso‖. Desses jovens, 15 foram submetidos a um tratamento para acelerar o crescimento com a utilização de ―hormônio de crescimento‖. Os outro 15 jovens não foram medicados. Explique o significado do resultado do desvio padrão das duas amostras, comparando-as entre si.

Resposta:____________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ ____________________________________________________________________________________ Resultados: Tab. 1 At = 0,14 m -- M = 1,72 m -- S2 = 0,00216 -- S = 0,0464 Tab. 2 At = 0,26 m -- M = 1,66 m -- S2 = 0,00726 -- S = 0,0851

Tratados com hormônio cresceram mais (de 1,69 a 1,76 m), do que os jovens que não fizeram tratamento (de 1,58 a 1,75 m). É mais interessante fazer o tratamento.

Tab. 1 – Altura obtida (em m) por 15 jovens tratados com ―hormônio de crescimento‖. Altura obtida (em m) Média ( M ) (x – M) (x – M) 2 1,68 1,65 1,69 1,78 1,77 1,71 1,69 1,79 1,77 1,68 1,65 1,74 1,69 1,74 1,70  = Amplitude total (At) At = Média (M) M = (x) / n  Variância (S2) S2 =  (x – M)2  n -1  Desvio Padrão (S) S =  (x – M)2  n -1 

Tab. 2 – Altura obtida (em m) por 15 jovens que não estão em tratamento. Altura obtida (em m) Média ( M ) (x – M) (x – M) 2 1,75 1,60 1,55 1,74 1,51 1,77 1,62 1,65 1,62 1,74 1,55 1,71 1,68 1,66 1,77  = Amplitude total (At) At = Média (M) M = (x) / n  Variância (S2) S2 =  (x – M)2  n -1  Desvio Padrão (S) S =  (x – M)2  n -1 

(33)

DISTRIBUIÇÃO NORMAL REDUZIDA”, OU “SCORE Z”

Considere a variável que representa o número de meninos em 16 recém-nascidos. Essa variável pode assumir qualquer valor inteiro entre zero e 16, inclusive. A distribuição dessa variável está apresentada na tabela abaixo:

Tabela I – Distribuição do número de meninos em 16 recém-nascidos

Número de meninos Probabilidade (%)

0 0.00153 1 0.02441 2 0.18311 3 0.85449 4 2.77710 5 6.66504 6 12.21924 7 17.45605 8 19.63806 9 17.45605 10 12.21924 11 6.66504 12 2.77710 13 0.85449 14 0.18311 15 0.02441 16 0.00153

Construa um histograma representativo da distribuição do freqüência de meninos em 16 nascituros:

Gráfico 1 – Distribuição do número de meninos em 16 nascituros

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 20,00

15,00

10,00

(34)

Suponha que se deseja obter a probabilidade de serem do sexo masculino mais de 10 dos 16 nascituros desta população. Na tabela anterior estão todas as probabilidades associadas a uma distribuição com n = 16. Logo, basta somar as probabilidades de ocorrerem 11, 12, 13, 14, 15 e 16 meninos:

Cálculo

Mas, caso você não tivesse tais probabilidades já calculadas, podemos chegar a esta probabilidade utilizando os cálculos da distribuição Z. Para isso devemos seguir uma série de passos: 1º passo: saber os valores da média e desvio-padrão, os quais estão publicados na literatura. Neste caso, é sabido que a média é 8 e o desvio padrão é 2.

2º passo: calcula-se a variável reduzida da Distribuição Z (também chamada de desvio relativo): Cálculo:

Z = X - 



3º passo: represente graficamente a variável reduzida, e demonstre a probabilidade a ser calculada

4º passo : encontre a probabilidade da variável reduzida na Tabela da Distribuição Z. 5º passo: calcule a probabilidade, caso necessário.

CONCLUSÃO:

____________________________________________________________________________________ ____________________________________________________________________________________

(35)

Exercícios:

1. A pontuação média obtida por 52 alunos em uma determinada avaliação foi de 70 pontos, com um desvio padrão igual a 5 pontos. Calcule a probabilidade dos alunos tirarem:

a) mais de 80 pontos;  2,28 % b) menos de 80 pontos.  97,72 %

2. Em uma outra prova, os mesmos alunos citados acima obtiveram a mesma pontuação média, porém com um desvio padrão de 20 pontos. Calcule a probabilidade dos alunos tirarem:

a) mais de 80 pontos;  30,85 % b) menos de 80 pontos.  69,15 %

3. Suponha que a pressão sanguínea sistólica média de indivíduos com idades entre 15 e 25 anos seja de 120 mmHg, com desvio padrão de 8 mmHg. Nestas condições, calcule a probabilidade de um indivíduo dessa faixa etária apresentar pressão:

a) entre 110 e 130 mmHg;  78,88 % b) maior do que 130 mmHg.  10,56 %

4. Suponha que a média da taxa de glicose no sangue humano é de 100 mg, com desvio padrão de 6 mg. Calcule a probabilidade de um indivíduo apresentar taxa:

a) superior a 110 mg;  4,75 % b) entre 90 e 100 mg.  45,25 %

5. Suponha que o tempo médio de permanência em um hospital seja de 50 dias, com um desvio padrão igual a 10 dias. Qual a probabilidade de um paciente permanecer no hospital:

a) mais de 30 dias;  97,72 % b) menos de 30 dias.  2,28 %

6. Suponha que a estatura média de recém nascidos do sexo masculino seja de 50 cm, com um desvio padrão de 2,50 cm. Calcule a probabilidade de um recém nascido do sexo masculino ter a estatura: a) inferior a 48 cm;  21,19 %

b) superior a 56 cm.  0,86 %

7. Uma clínica possui 10 pacientes, com as idades: {35, 39, 35, 45, 47, 54, 57, 42, 61, 35}. Calcule a média e o desvio padrão e encontre a probabilidade de algum paciente ter:

a) mais do que 50 anos;  30,15 % b) menos do que 30 anos;  5,94 % c) entre 30 e 65 anos;  92,18 % d) entre 30 e 45 anos; 44,06 % e) entre 45 e 50 anos; 19,85 % f) mais de 65 anos;  1,88 %

g) quantos pacientes têm mais de 65 anos;  0,188 ou nenhum pacientes (FAZER POR FÓRMULA) h) quantos pacientes têm entre 45 a 50 anos;  1,98 ou 2 pacientes (FAZER POR FÓRMULA)

(36)

EXERCÍCIOS COMPLEMENTARES

1) Em uma população de 411 homens adultos com média de peso de 70 kg e desvio padrão de 7,0 kg, calcule a probabilidade de algum homem possuir: (Em todos os exercícios demonstrem a curva normal) a) menos do que 75 kg ? 76,11 % b) mais do que 75 kg ?  23,89 % c) menos do que 65 kg ? 23,89 % d) entre 65 e 75 kg ?  52,2 % e) mais do que 77,4 kg?  14,69 %

f) quantos homens têm mais de 75 kg?  98,19 ou 98 homens g) quantos homens pesam entre 65 e 75 kg?  214,62 ou 215 homens

2) A altura média de 500 alunos de uma determinada escola foi de 1,50 metros. Calcule a probabilidade de algum alunos ter:

a) entre 1,50 e 1,65 m; 34,13 % b) mais de 1,65 m; 15,87 % c) menos de 1,65 m;  84,13 % d) entre 1,65 e 1,80 m;  13,59 %

e) quantos alunos medem de 1,50 e 1,65 m;  170,65 ou 171 alunos f) quantos alunos têm mais de 1,65 metros; 79,35 ou 79 alunos g) quantos alunos têm menos de 1,65 metros; 420,65 ou 421 alunos h) quantos alunos medem de 1,65 a 1,80 meros.  67,95 ou 68 alunos

3) O peso de 9 pacientes de uma ala de um certo hospital é: { 55, 62, 75, 80, 50, 51, 50, 60, 65 }. Encontre o desvio padrão e calcule a probabilidade de um paciente pesar:

a) mais de 70 kg;  20,05 % b) menos de 55 kg;  29,46 % c) entre 55 e 70 kg;  50,49 %

(37)

CONCEITOS BÁSICOS DOS TESTES DE HIPÓTESE

Tudo que estudamos até agora é a fundamentação para as inferências estatísticas, o qual é o processo pelo qual tiramos conclusões sobre uma população a partir de resultados observados em uma amostra.

A ―força‖ de uma inferência está relacionada com: a) o tamanho da amostra;

b) a variabilidade do fenômeno em estudo;

c) a variação amostral do resultado médio (VARIÂNCIA E DESVIO PADRÃO. Para se realizar uma inferência, geralmente, são testadas hipóteses.

Considere o seguinte exemplo:

A proporção de recém-nascidos com defeito ou doença séria é 3%. Imagine que um médico suspeita que esta proporção aumentou. Para estabelecer se esta suspeita é procedente, é preciso fazer um teste estatístico.

Elaboração das hipóteses: H0 = hipótese de nulidade :

____________________________________________________________________________________

H1 = hipótese alternativa :

____________________________________________________________________________________

Mas, a hipótese alternativa pode assumir uma das seguintes formas seguintes: a) H1 : 

b) H1: c) H1: 

A escolha de a ou b define um teste unicaudal, onde interessam apenas os afastamentos em uma dada direção. A escolha de c define um teste bicaudal onde interessam os afastamentos de X em relação a  em ambas as direções.

Referências

Documentos relacionados

Produto regulável, fita dupla face em poliéster super reforçado, macio, com estampas exclusivas, Possui dois pontos para prender a guia sendo um na altura do pescoço e um na altura

definir claramente as variáveis e detalhar a análise estatística; incluir referências padronizadas sobre os métodos estatísticos e informação de eventuais

Para a análise dos dados dos 340 questionários válidos, utilizou-se métodos de estatística descritiva (medidas de tendência central e porcentagens) com o auxílio

A CNM firmou uma parceria com a Delegação da União Europeia no Brasil para a execução do projeto Integração Local para Reinserção do Usuário de Drogas, que tem como

Em particular, este trabalho apresenta um estudo bibliométrico que examinou o uso de métodos estatísticos inferenciais ou multivariados para a análise de dados

Nas figuras 4 e 5 observa-se que os métodos A e B (Budeanu e Fryse) para as medições de potência ativa e reativa possuem uma maior variabilidade nas medições pelo período da manhã,

A análise desse quadro à luz dos limites mínimos e máximos de proficiência que os alunos deveriam alcançar nos anos iniciais e finais do ensino fundamental e médio

The late Quaternary of themiddle Caquetá area (Colombian Amazonia). Holocene mangrove dynamics and sea-level changes in Taperebal, northeastern Pará State, northern