Estatística para Farmácia
-UNIFESP-Diadema
Rodolfo Valentim
October 26, 2015
A importância da Estatística
O que é estatística?
Por que eu devo aprender estatística?
Exemplos
“As pessoas que comem três porções diárias de grãos integrais têm risco de sofrer problemas cardíacos reduzidos em 37%.” (Fonte: Whlole Grains Council.) “Setenta por cento dos 1.500 danos à espinha dorsal em menores de idade resultam em acidentes de carro e 68 dos feridos não estavam usando cinto de segurança.” (Fonte: UPI.)
“Espera-se que a produção americana de carvão, que aumentou em 2,5%em 2006, sofra uma redução de 3,1%
em 2007.” (Fonte: Energy Information Administration.)
As três afirmações que
Definição
DADOSconsistem em informações que vêm de
observações, contagens, medições ou respostas. Às vezes, os dados são apresentados graficamente. Se você alguma vez leu oUSA TODAY, certamente já viu
uma das características mais populares do jornal, oUSA TODAYSnapshots. Gráficos que apresentam informações
Definição
ESTATÍSTICAé a ciência que coleta, organiza, analisa e intepreta dados para a tomada de decisões.
Definição 1
CONJUNTO DE DADOS:há dois tipos de conjuntos de
dados usados em estatística. Esses conjuntos são chamados depopulação eamostra.
Uma população é uma coleção da todos os resultados, medições ou contagens que são de interesse.
Uma amostra é um subconjunto de uma população. Dados amostrais podem ser usados para formar
Importante
Um censo consiste de dados de uma população inteira. Mas, a menos que a população seja pequena, é
normalmente impraticável obter todos os dados da população.
Exemplo 1 - identificando um conjunto de dados
Solução
A população consiste das respostas de todos os adultos dos EUA.
A amostra consiste das respostas das 1.708 adultos nos EUA na pesquisa.
Problema 1
O departamento de energia dos EUA conduz pesquisas semanais em aproximadamente 800 postos de gasolina para determinar o preço médio por galão de gasolina comum.
Em 12 de fevereiro de 2007, o preço médio era de$2,24
por galão.
Identifique a população. Identifique a amostra.
Definição 2
Um parâmetro é a descrição numérica de uma característica populacional.
Exemplo 2 - Distinguindo entre parâmetro e estatística
Decida se o valor numérico descreve um parâmetro ou uma estatística amostral. Exemplifique seu raciocínio. 1. Uma pesquisa recente de uma amostra de MBA’s reportou que o salário médio para uma pessoa com MBA é mais do que$82.000 (The Wall Street Journal.)
Solução
1. Em razão de a média de$82.000 ser baseada em um
subgrupo de uma população, ela é uma estatística amostral.
2. Devido ao fato de o aumento porcentual de 8,5%ser baseado nos salários iniciais de todos os 667 graduandos, ele é um parâmetro populacional.
Problema 2
Em 2006, a liga dos times de beisebol gastou um total de $2.236.706.685 nos salários dos jogadores. Esse
parâmetro numérico descreve um parâmetro populacional ou estatística amostral? (Fonte: USA Today.)
a. Decida se o valor numérico é de uma população ou de uma amostra.
Ramos da Estatística
Definição 3
Exemplo 3 - Estatística descritiva e inferencial
Decida qual a parte do estudo representa o ramo descritivo da estatística. Que conclusões podem ser tomadas do estudo usando estatística inferencial?
1. Uma grande amostra de homens com 48 anos de idade, foi estudada durante 18 anos. Para os que são solteiros, 70%ainda estavam vivos aos 65 anos de idade. Para os casados, 90%estavam vivos aos 65 anos de idade. (Fonte: The Journal of Family Issues.)
Solução
1. A estatística descritiva envolve afirmações tais como “Para os que são solteiros, 70%ainda estavam vivos aos 65 anos” e “Para os casados, 90%ainda que estavam vivos aos 65 anos.” Uma inferência possível tirada do estudo é que o fato de ser casado está associado a uma vida mais longa.
Definição 3
Se o conjunto de dados é uma população ou uma amostra normalmente depende do contexto da vida real. Há uma diferença quando números são usados na descrição de características de uma população e/ou de uma amostra, isso é definido a seguir:
Parâmetro→é a descrição numérica de uma caracterísitca populacional.
Exemplo 3
1. Uma pesquisa recente de MBA’s reportou que o salário médio para um MBA é de mais do que$82.000/ano. (Fonte: The Wall Street Journal.)
Solução
1. Em razão de a média de$82.000/ano ser baseada em um subgrupo de uma população, ela é uma estatística amostral.
Classificação dos dados: Tipos de dados→Tipos de variáveis
Os estatísticos classicam variáveis como categóricas ou numéricas, e, ainda classificam as variáveis numéricas como valores discretos ou contínuos.
Variáveis categóricas ou qualitativas→apresentam valores que podem ser apresentados como “sim” ou “não”. São variáveis cujas respostas são não-numéricas.
Classificação dos dados: Tipos de dados→Tipos de variáveis
Variáveis discretas→apresentam valores numéricos que surgem de um processo de contagem. “O número de revistas que uma pessoa assina” é um exemplo de uma variável discreta, uma vez que a resposta corresponde a um dentre uma quantidade finita de números inteiros. Variáveis contínuas→produzem respostas numéricas que surgem de um processo de mensuração. O tempo que vc espera pelo atendimento de um caixa em um banco constitui um exemplo de uma variável numérica contínua, uma vez que a resposta assume qualquer valor dentro de umcontinum, ou intervalo, dependendo da precisão do
Níveis de mensuração
A utilização de níveis de mensuração constitui um outro meio de se classificarem dados. Existem quatro níveis de mensuração amplamente reconhecidos, os veremos a seguir:
Nominal→esta escala classifica os dados em categorias distintas, nas quais não está implícito nenhum tipo de classificação. Um exemplo é a pesquisa de satisfação de uma empresa, seu refrigerante favorito, etc. Esses dados são apenasqualitativos.
Níveis de mensuração
Dados oriundos de uma variável numérica são
mensurados em uma escala intervalar ou em uma escala de razão.
Níveis de mensuração
Classificando os dados por nível
Planejamento experimental
Planejamento de um estudo estatístico→o objetivo de todo estudo estatístico é coletar dados e então usá-los para tomar uma decisão. Qualquer decisão que seja tomada usando os resultados de um estudo estatístico será tão boa quando o processo utilizado para obtenção desses dados. Se o processo tiver falhas, então a decisão resultante será questionável.
Instruções
1. Identifique a variável (ou variáveis) de interesse (foco) e a população do estudo.
2. Desenvolva um plano detalhado para a coleta de dados. Se usar uma amostra, tenha certeza de que a amostra representa a população.
Planejamento experimental
4. Descreva os dados usando técnicas de estatística descritiva.
5. Interprete os dados e tome as decisões sobre a população usando estatística inferencial.
Coleta de dados
Há várias maneiras de coletar dados. Frequentemente, o foco do estudo determina a melhor maneira de fazer a coleta. A seguir, veremos quatro métodos de coleta de dados.
Faça um estudo observacional→em um estudo observacional, um pesquisador observa e mede as características de interesse de parte de uma população, mas não muda as condições existentes. Por exemplo, foi realizado um estudo observacional na qual os
pesquisadores observaram e registraram o
Coleta de dados
Realize um experimento→ao realizar um experimento, um tratamento é aplicado em uma parte da população e as respostas são observadas. Outra parte da população pode ser usada como grupo controle, na qual nenhum experimento é realizado. Em muitos casos, indivíduos (às vezes chamados de unidades experimentais) do grupo de controle recebem placebos, um tratamento não
Coleta de dados
Exemplo: Foi realizado um experimento no qual diabéticos tomaram extrado de canela diariamente enquanto o grupo de controle não tomou nada. Depois de 40 dias, os
Coleta de dados
Use uma simulação→uma simulação é o uso de um modelo matemático ou físico para reproduzir as condições de uma situação ou processo. A coleta de dados
frequentemente envolve o uso de computadores. As simulações permitem que você estude situações que são impraticáveis ou mesmo perigosas para serem criadas na vida real, e frequentemente economizam tempo e dinheiro. Por exemplo, os fabricantes de automóveis usam
Coleta de dados
Use um levantamento ou pesquisa de mercado.→um levantamento ou pesquisa de mercado é uma investigação de uma ou mais características de uma população.
Mais frequentemente, essas pesquisas são conduzidas com pessoas, por meio de perguntas feitas a elas. Os tipos mais comuns de levantamentos são realizadas por meio de entrevistas, correio ou telefone.
Ao planejar bem esse tipo de pesquisa, é importante planejar bem para não obter resultados tendenciosos. Por exemplo, uma pesquisa é conduzida em uma amostra de médicos do sexo feminino para determinar se o argumento principal para a escolha profissional é a estabilidade financeira.
Exemplo 4 - decidindo um método de coleta de dados
Considere os estudos estatítisticos a seguir. Qual método de seleção de dados você usaria para coletar os dados para cada estudo?
1. Um estudo de efeito da mudança dos padrões de voo no número de acidentes com aviões.
2. Um estudo sobre os efeitos da ingestão de farinha de aveia na redução de pressão arterial.
3. Um estudo sobre os índices de aprovação presidencial com o residentes do Brasil.
Solução
1. Use simulações computacionais.
2. Você deve realizar um experimento e utilizar um grupo controle.
3. Você pode fazer uma pergunta usando algumas opções que vão direcionar a pesquisa.
Planejamento experimental
Para produzir resultados significativos e não tendenciosos, os experimentos devem ser cuidadosamente planejados e executados. É importante saber quais os passos devem ser realizados para que os resultados sejam válidos. Três elementos-chave de um experimento bem planejado são: controle,aleatorização ereplicação.
Em razão do fato de que os resultados podem ser
arruinados por uma variedade de fatores, a capacidade de controlar esses fatores de influência é importante. Um desses fatores é uma variável confounding.
Planejamento experimental
Por exemplo, para atrair consumidores, o dono de uma cafeteria faz um experimento reformando a loja e usando cores vibrantes. Ao mesmo tempo, um shopping center da região realiza sua grande inauguração. Se os negócios aumentarem na cafeteria, não podemos determinar se isso ocorreu pour causa das novas cores ou por causa do novo shopping perto da cafeteria. Os efeitos das cores e do shopping center se confundem.
Definição
Definição
Aleatorização é o processo de se designar sujeitos aleatoriamente para diferentes grupos de tratamento. Em um planejemanto completamente aleatório, os sujeitos são designados para diferentes grupos de tratamento por meio da seleção aleatória. Em alguns experimentos, pode ser necessário usar blocos, que são grupos de sujeitos com características similares.
Em um planejamento experimental normalmente usa-se planejamento de blocos aleatórios. Para usar esse tipo de planejamento, é necessário designar os sujeitos
aleatóriamente ou designá-los segundo características similares.
Definição
Replicação é uma técnica de repetição de um experimento usando um grande número de sujeitos.
Exemplo 5 - analisando um planejamento experimental
Uma empresa quer testar a eficácia de uma nova goma de mascar para ajudar as pessoas a pararem de fumar. Identifique um problema em potencial como o
planejamento experimental dado e sugira uma maneira de melhorá-lo.
Solução
1. O tamanho da amostra não é grande o suficiente para validar o resultado. O experimento pode ser replicado para melhorar o resultado..
Técnicas de amostragem
Um censo é uma contagem ou medição de uma população inteira. A realização de um censo fornece informações completas, mas ela é frequentemente cara e difícil de realizar.
Uma amostragem é uma contagem ou medição de parte de uma população.
Para coletar dados “imparciais”, o pesquisador precisa ter certeza que a amostra reproduz as características da população. Em outras palavras, a amostra reproduz a população em microescala.
Exemplos de amostragem
Exemplos de amostragem
Exemplos de amostragem
Amostra aleatória
Amostra aletória é aquela na qual todos os membros de uma população têm chances iguais de serem
selecionados.
Exemplo 6
Há 800 estudantes que se inscreveram no curso de estatística em sua faculdade. Você deseja obter uma amostra com 8 estudantes para responder um
Solução
Designe os 800 estudantes em uma sequência de
Amostra estratificada
Amostra por agrupamento
Quando uma população está sem subgrupos que ocorrem naturalmente, cada um tendo características similares, uma amostra por agrupamento pode ser apropriada. Para selecionar uma amostra por agrupamento, divida a
Amostra sistemática
Amostra por conveniência
Uma amostra de conveniência é uma amostra
Apresentação dos dados
Veremos a partir de agora como apresentar os dados. Normalmente, os dados são apresentados na forma de gráficos e tabelas.
Apresentação dos dados - tabela resumida
Uma tabela resumida indica a frequência, a quantidade ou a percentagem de itens em um conjunto de categorias, de tal modo que você possa verificar diferenças entre as categorias.
Apresentação dos dados - tabela resumida
Apresentação dos dados - tabela resumida
Apresentação dos dados - tabela resumida
Apresentação dos dados - tabela de contingência
Muitas vezes os elementos da amostra ou da população são classificados de acordo com dois fatores.
Apresentação dos dados - tabela de contingência
Note que os dados são classificado em dois tipos: sexo e fator.
Apresentação dos dados - tabela de distribuição de frequências
Tabelas com grande número de dados são, cansativas e não fornecem ao leitor visão rápida e global do fenômeno. Para isso, é preciso que os dados estejam organizados em uma tabela de distribuição de frequências.
Apresentação dos dados - tabela de distribuição de frequências
Uma distribuição de frequência é um método de se agrupar dados em classes de modo a fornecer a quantidade (e/ou a percentagem) de dados em cada classe.
Com isso, podemos resumir e visualizar um conjunto de dados sem precisar levar em conta os valores individuais. Uma distribuição de frequência (absoluta ou relativa) pode ser apresentada em tabelas ou gráficos.
Apresentação dos dados - tabela de distribuição de frequências
Apresentação dos dados - tabela de distribuição de frequências
Determine o intervalo de classes (regra de Struges ou Logarítmo)
k =1+3,3×log(n). (1)
Regra da potência de 2→k menor que o valor interiro 2n
≥2.
Regra da raiz quadrada→k =√n.
Apresentação dos dados - tabela de distribuição de frequências
Calcule a amplitude das classes (h): Calcule a amplitude do conjunto de dados.
L=xmax−xmin. (2)
Calcule a amplitude (largura) da classe:
h= L
k. (3)
Arredonde este resultado convenientemente. Calcule os intervalos de classes:
Primeira Classe:
Apresentação dos dados - tabela de distribuição de frequências
Segunda Classe:
xmin →xmin+2h
Terceira Classe:
xmin →xmin+3h E-nésima classe:
xmin →xmin+n.h
Apresentação dos dados - gráfico de barras
Em um gráfico de barras, uma barra ilustra cada uma das categorias, cujo comprimento representa a quantidade, frequência ou a porcentagem de valores que se
posicionam em uma terminada categoria.
Apresentação dos dados - gráfico de barras
Um gráfico de barras precisa conter:
Título→que dá o nome à pesquisa ou aos dados que estão sendo apresentados.
Corpo→com as barras e a frequência relativa de cada variável qualitativa nominal.
Apresentação dos dados - gráfico ou diagrama de dispersão
Um gráfico ou diagrama de dispersão mostra dois eixos como cada um representado uma variável.
O gráfico ou diagrama de dispersão é um gráfico onde pontos no plano cartesiano XY são usados para
representar simultaneamente os valores de duas variáveis quantitativas medidas em cada elemento do conjunto de dados.
O eixo y representa a variável dependente ou funçãof(x).
Apresentação dos dados - gráfico ou diagrama de dispersão
Um gráfico de dispersão precisa conter: Título→que indica do que se trata o gráfico.
Apresentação dos dados - gráfico de setores ou pizza
Gráficos de pizza exibem dados como proporção de um todo.
Os gráficos de pizza são os mais usados para fazer comparações entre grupos.
Apresentação dos dados - gráfico de setores ou pizza
Um gráfico de pizza ou de setores precisa conter:
Título→que contém as informações relativas ao mesmo. Corpo→que contém “a pizza” fatiada em setores.
Apresentação dos dados - diagrama de Pareto
Em um diagrama de Pareto, as respostas categorizadas são apresentadas sob a forma de um gráfico, em ordem descendente, de acordo com suas respectivas
frequências, e são combinadas com uma linha
correspondente à porcentagem acumulada no mesmo gráfico.
O diagrama de Pareto consegue identificar as situações que ocorrem o príncipio de Pareto.
Apresentação dos dados - diagrama de Pareto
O diagrama de Pareto apresenta a capacidade de separar os “poucos vitais” dos “muitos triviais”, possibilitando que você se concentre nas categorias importantes.
Apresentação dos dados - diagrama de Pareto
Resumidadmente: o diagrama de Pareto tem o objetivo de compreender a relação ação /benefício, ou seja, prioriza a ação que trará o melhor resultado.
O diagrama é composto por um gráfico de barras que ordena as frequências das ocorrências em ordem
Apresentação dos dados - diagrama de Pareto
Apresentação dos dados - diagrama de Pareto
Apresentação dos dados - diagrama de Pareto
Como fazer o diagrama de Pareto?
Passo 1→determine o tipo de perda que você quer investigar.
Passo 2→especifique o aspecto de interesse do tipo de perda que você quer investigar.
Apresentação dos dados - diagrama de Pareto
Passo 5→faça as contagens, organize as categorias por ordem decrescente de frequência, agrupe aquelas que ocorrem com baixa frequência sob denominação “outros” e calcule o total.
Apresentação dos dados - diagrama de Pareto
Apresentação dos dados - diagrama de Pareto
Apresentação dos dados - diagrama de Pareto
O diagrama de Pareto estabelece prioridades, isto é, mostra em que ordem os problemas devem ser resolvidos. →verifique e teste diversas classificações , antes de fazer o diagrama definitivo estude o problema medindo-o em várias escalas
→quebre grandes problemas ou grandes causas em problemas ou causas específicas, estratificando ou subdividindo em aspectos mais específicos.
Apresentação dos dados - diagrama de Pareto
Originou-se do modelo econômico de Pareto, traduzido por Juran para a área da qualidade; sucintamente, diz: “alguns elementos são vitais e outros apenas triviais”. →20%do tempo gasto com itens importantes são responsáveis por 80%dos resultados; ou
→20%dos itens em estoque respondem por 80%dos custos; ou
Apresentação dos dados - diagrama de Pareto
→20%dos clientes representam 80%do faturamento do negócio;
Apresentação dos dados - diagrama de Pareto
Assim, quando se identificam e coletam dados sobre um processo, é possível determinar as porcentagens
atribuídas a cada uma das causas (ou outro parâmetro que esteja sendo estudado).
Apresentação dos dados - diagrama de Pareto
Vamos considerar uma pesquisa sobre as principais tipos de lesões por acidentes domésticos em uma determinada cidade (repare que a coleta de dados terá usado um formulário de dados, como já estudado).
Apresentação dos dados - diagrama de Pareto
Apresentação dos dados - diagrama de Pareto
É comum ser incluído no Diagrama de Pareto o valor em porcentagem e o valor acumulado das ocorrências; desta forma, é possível verificarmos o efeito acumulado dos itens pesquisados.
Neste caso, a figura a seguir mostra-nos qual é a participação de cada item individualmente e também a participação de:
Hematomas+Queimaduras;
Hematomas+Queimaduras+Cortes;
Apresentação dos dados - diagrama de Pareto
Apresentação dos dados - histograma
Distribuição de frequências é um agrupamento de dados em classes, de tal forma que contabilizamos o número de ocorrências em cada classe.
Apresentação dos dados - histograma - tipos de frequências
Frequência absoluta (fi): É o número de observações correspondente a cada classe. A frequência absoluta é, geralmente, chamada apenas de frequência.
Frequência relativa (fri): É o quociente entre a frequência
absoluta da classe correspondente e a soma das
frequências (total observado), isto é, onde n representa o número total de observações.
fri =
fi P
jfj
Apresentação dos dados - histograma - tipos de frequências
Frequência percentual (pi): É obtida multiplicando a frequência relativa por 100%.
Apresentação dos dados - histograma - tipos de frequências
Apresentação dos dados - histograma - tipos de frequências
Apresentação dos dados - histograma - tipos de frequências
Para dados quantitativos contínuos, geralmente
resultantes de medições de características da qualidade de peças ou produtos, dividimos a faixa de variação dos dados em intervalos de classes.
O menor valor da classe é denominado limite inferior (li) e o maior valor da classe é denominado limite superior (Li).
O intervalo ou classe pode ser representado das seguintes maneiras:
1. (li) - (Li), onde o limite inferior da classe é incluído na
contagem da frequência absoluta, mas o superior não; 2. (li) - (Li) , onde o limite superior da classe é incluido na
Apresentação dos dados - histograma - tipos de frequências
Podemos escolher qualquer uma destas opções, mas é importante que deixemos claro no texto ou na tabela qual delas está sendo usada. Embora não seja necessário, os intervalos são frequentemente construídos de modo que todos tenham larguras iguais, o que facilita as
comparacções entre as classes.
Na tabela de distribuição de frequência, acrescentamos uma coluna com os pontos médios de cada intervalo de classe, denotada porxi. Esta é definida como a média dos limites da classe. Estes valores são utilizados na
Apresentação dos dados - histograma - tipos de frequências
Algumas indicações na construção de distribuição de frequências são:
→Na medida do possível, as classes deverão ter amplitudes iguais.
→Escolher os limites dos intervalos entre duas possíveis observações.
Apresentação dos dados - histograma - tipos de frequências
→Escolher limites que facilitem o agrupamento. →Marcar os pontos médios dos intervalos.
Apresentação dos dados - histograma - tipos de frequências
Histograma é uma representação gráfica (um gráfico de barras verticais ou barras horizontais) da distribuição de frequências de um conjunto de dados quantitativos contínuos.
O histograma pode ser um gráfico por valores absolutos ou frequência relativa ou densidade. No caso de
Apresentação dos dados - histograma - tipos de frequências
Consequentemente, a área total do histograma (igual a soma das áreas de todos os retângulos) será igual a 1. Assim, ao construir o histograma, cada retângulo deverá ter área proporcional á frequência relativa (ou á frequência absoluta, o que é indiferente) correspondente.
No caso em que os intervalos são de tamanhos
(amplitudes) iguais, as alturas dos retângulos serão iguais às frequências relativas (ou iguais às frequências
Apresentação dos dados - histograma - tipos de frequências
Apresentação dos dados - polígono de frequências acumuladas ou ogiva
O polígono de porcentagens acumuladas ou ogiva, exibe uma variável de interesse ao longo do eixo X e a
Apresentação dos dados - polígono de frequências acumuladas ou ogiva