ESTATÍSTICA
BIO
ESTATÍSTICA
Lilian de Souza Vismara Mestre Eng. Elétrica – ESSC / USP Licenciada em Matemática – UFSCar
1
Ministério da Educação
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Câmpus Dois Vizinhos
Conteúdo da aula
Antecedentes (medidas de posição e situação
problema (Dieta experimental);
Medidas de dispersão: A. O que é desvio?
B. Variância
C. Desvio padrão e coeficiente de variação
D. E agora, podemos fazer nossa recomendação? E. Exercício proposto.
Antecedentes
Até agora vimos que podemos resumir a
informação de um conjunto de dados através de:
1. Tabelas de frequência (Tabulação); 2. Histograma (Gráfico) e
3. Estatísticas (Medidas de posição: média
Situação problema
No ano de 2010 o município de Chopinzinho contava com um rebanho bovino efetivo (gado de corte) de 59.495 cabeças (fonte: IPARDES). A Fazenda Santa Lucia, localizada neste município, possuía este ano um rebanho de 12300 cabeças, sendo 20% de novilhos em engorda). A tabela a seguir mostra o ganho de peso/dia em gramas de uma amostra de 39 novilhos submetidos a certa dieta experimental. Que informações podemos obter destes dados, sabendo-se que a média de ganho de peso sem a dieta é de 774 g/dia?
Situação problema
890 986 806 798 995 876 705 706 915 801 720 807 960 858 606 798 708 893 906 660 780 615 895 969 880 700 697 804 918 825 809 758 705 800 910 896 708 690 830
Aula passada: Resumo
Qual foi a população alvo do experimento? Depende (poucas informações)
Definindo a população estatística:
1. Qual é a unidade amostral? O novilho
2. Qual é a variável de interesse? Ganho diário de peso (g/dia)
Qual é a amostra? Os 39 novilhos da fazenda Santa Lucia
Aula passada: Tabela de
frequência
Classes
Frequencia Frequencia acumulada Absoluta Relativa Absoluta Relativa
[606-662) 3 0,08 3 0,08 [662-718) 8 0,21 11 0,28 [718-774) 2 0,05 13 0,33 [774-830) 10 0,26 23 0,59 [830-886) 4 0,10 27 0,69 [886-942) 8 0,21 35 0,90 [942-998) 4 0,10 39 1,00 Total Geral 39 1,00
Resumindo Informações: “Estatísticas”:
relação entre média moda e mediana
Estatísticas calculadas na aula
passada para o nosso exemplo:
Média = 809,8 g/dia Mediana = 806 g/dia
Moda = 802 g/dia
Então nossa variável tem distribuição bastante
simétrica e com medidas de posição central maiores que 774 g/dia (valor de referência na região).
Mas será isso suficiente para afirmarmos que a nova
dieta é eficiente em melhorar a produtividade?
Aula passada: Gráfico de frequência
(Histograma)
0 2 4 6 8 10 12 [606-662) [662-718) [718-774) [774-830) [830-886) [886-942) [942-997) Fr equ ência Classes Frequência absolutaResumindo Informações
“Estatísticas”: medidas de posição
Quartis e percentis
Na distribuição de uma variável quantitativa, o
percentil representa a posição abaixo da qual está uma dada porcentagem dos dados.
Por exemplo: o percentil 13% é o valor abaixo do qual estão 13% das observações;
Os quartis são percentis especiais: 25%, 50% e 75%, sendo o quartil 50% a própria mediana
Resumindo Informações
“Estatísticas”: medidas de dispersão
Mas a investigação continua:
Será que se o valor médio, modal e mediano
(g/dia) obtido na amostra (novilhos) for maior que a média sem o tratamento (dieta experimental), pode-se garantir que ela é eficiente em aumentar a produtividade?
Não nos esqueçamos que 33% dos novilhos
tiveram produtividade inferior à média sem a dieta.
Resumindo Informações:
“Estatísticas”: medidas de dispersão
𝑥
Quem é mais dispersa?
Resumindo Informações
“Estatísticas”: medidas de dispersão
Uma “Estatística” de “dispersão” se refere àvariabilidade ou heterogeneidade dos dados.
Nas duas distribuições do slide anterior (A e
B) qual tem maior dispersão ? Qual é mais variável ?
Resumindo Informações
“Estatísticas”: medidas de dispersão
Variância
Como se mede a dispersão?
Uma forma de se medir a variabilidade de uma variável é quantificando a dispersão das observações em relação a um ponto
Resumindo Informações
“Estatísticas”: medidas de dispersão
O que é desvio?
Considerando a medida de posição média,
podemos calcular um desvio em relação a essa média:
𝑥 = 808,9
Situação problema
890 986 806 798 995 876 705 706 915 801 720 807 960 858 606 798 708 893 906 660 780 615 895 969 880 700 697 804 918 825 809 758 705 800 910 896 708 690 830
Ganho de peso de novilhos (g/dia) de uma amostra de novilhos da Fazenda Santa Lucia.
Resumindo Informações
“Estatísticas”: medidas de dispersão
Variância
Considerando a medida de posição média,
podemos calcular uma medida de desvio em relação a essa média:
𝑥 = 809,8
Novilho (xi)
Desvio
Prod. Prod. Média
(g/dia) Novilho (g/dia)
Situação problema
890 986 806 798 995 876 705 706 915 801 720 807 960 858 606 798 708 893 906 660 780 615 895 969 880 700 697 804 918 825 809 758 705 800 910 896 708 690 830
Ganho de peso de novilhos (g/dia) de uma amostra de novilhos da Fazenda Santa Lucia.
x1 x2
Novilho (xi)
Desvio Quadrado do desvio
Prod. Prod. Prod. Prod.
Média
(g/dia) Novilho (g/dia) (g/dia)Média Novilho (g/dia)
1 809,8 - 801 = 8,8
Situação problema
890 986 806 798 995 876 705 706 915 801 720 807 960 858 606 798 708 893 906 660 780 615 895 969 880 700 697 804 918 825 809 758 705 800 910 896 708 690 830
Ganho de peso de novilhos (g/dia) de uma amostra de novilhos da Fazenda Santa Lucia.
x1 x2
Novilho (xi)
Desvio
Prod. Prod. Média
(g/dia) Novilho (g/dia)
1 809,8 - 801 = 8,8
2 809,8 - 660 = 149,8
Novilho (xi)
Desvio
Prod. Prod. Média
(g/dia) Novilho (g/dia)
1 809,8 - 801 = 8,8 2 809,8 - 660 = 149,8 3 809,8 - 825 = -15,2 4 809,8 - 890 = -80,2 5 809,8 - 720 = 89,8 6 809,8 - 780 = 29,8 7 809,8 - 809 = 0,8 8 809,8 - 986 = -176,2 9 809,8 - 807 = 2,8 continua... 36 809,8 - 915 = -105,2 37 809,8 - 906 = -96,2 38 809,8 - 918 = -108,2 39 809,8 - 830 = -20,2 Soma 0,0
Novilho (xi)
Desvio Quadrado do Desvio
Prod. Prod. Prod. Prod.
Média
(g/dia) Novilho (g/dia) (g/dia)Média Novilho (g/dia)
1 809,8 - 801 = 8,8 (809,8 - 801)2 = 77,8 2 809,8 - 660 = 149,8 3 809,8 - 825 = -15,2 4 809,8 - 890 = -80,2 5 809,8 - 720 = 89,8 6 809,8 - 780 = 29,8 7 809,8 - 809 = 0,8 8 809,8 - 986 = -176,2 9 809,8 - 807 = 2,8 continua... 36 809,8 - 915 -105,2 37 809,8 - 906 -96,2 38 809,8 - 918 -108,2 39 809,8 - 830 -20,2 Soma 0,00
Novilho (xi)
Desvio Quadrado do desvio
Prod. Prod. Prod. Prod.
Média
(g/dia) Novilho (g/dia) (g/dia)Média Novilho (g/dia)
1 809,8 - 801 = 8,8 (809,8 - 801)2 = 77,8 2 809,8 - 660 = 149,8 (809,8 - 660)2 = 22446,2 3 809,8 - 825 = -15,2 (809,8 - 825)2 = 230,4 4 809,8 - 890 = -80,2 (809,8 - 890)2 = 6428,8 5 809,8 - 720 = 89,8 (809,8 - 720)2 = 8067,7 6 809,8 - 780 = 29,8 (809,8 - 780)2 = 889,3 7 809,8 - 809 = 0,8 (809,8 - 809)2 = 0,7 8 809,8 - 986 = -176,2 (809,8 - 986)2 = 31039,2 9 809,8 - 807 = 2,8 (809,8 - 807)2 = 7,9 continua... 36 809,8 - 915 -105,2 (809,8 - 915)2 = 11062,7 37 809,8 - 906 -96,2 (809,8 - 906)2 = 9250,5 38 809,8 - 918 -108,2 (809,8 - 918)2 = 11702,8 39 809,8 - 830 -20,2 (809,8 - 830)2 = 407,2 Soma 0,00 402299,74
Resumindo Informações
“Estatísticas”: medidas de dispersão
Variância
Variância: 𝑠2 = 𝑖=1 𝑛 𝑥 − 𝑥 𝑖 2 𝑛 − 1 No nosso exemplo:𝑠
2=
𝑖=1 39809,8 − 𝑥
𝑖 239 − 1
= 10586,83(𝑔/𝑑𝑖𝑎)
2Resumindo Informações
“Estatísticas” : medidas de dispersão
Desvio padrão
Desvio padrão: 𝑠 = 2 𝑖=1 𝑛 𝑥 − 𝑥 𝑖 2 𝑛 − 1 No nosso exemplo: 𝑠2 = 2 10586,83 = 102,9 𝑔/𝑑𝑖𝑎Resumindo Informações:
“Estatísticas”: medidas de dispersão
Coeficiente de variação
Coeficiente de variação: 𝐶𝑉 = 𝑠 𝑥 . 100 No nosso exemplo: 𝐶𝑉 = 102,9 809,8 . 100 = 𝟏𝟐, 𝟕 %Em Estatística, o coeficiente de variação de Pearson é uma medida de dispersão relativa empregada para estimar a precisão de experimentos e
representa o desvio-padrão expresso como porcentagem da média. Sua principal qualidade é a capacidade de comparação de distribuições diferentes.
Resumindo Informações:
“Estatísticas”: Medidas de dispersão
Intervalo de variação.
706,9 809,8 912,7
+ 12,7% - 12,7%
Medidas de posição e dispersão dos
dados
0 2 4 6 8 10 12 [606-662) [662-718) [718-774) [774-830) [830-886) [886-942) [942-997) Fr equ ência Classes Frequência absolutaMedidas de posição e dispersão dos
dados
0 2 4 6 8 10 12 [606-662) [662-718) [718-774) [774-830) [830-886) [886-942) [942-997) Fr equ ência Classes Frequência absolutaMedidas de posição e dispersão dos
dados
0 2 4 6 8 10 12 [606-662) [662-718) [718-774) [774-830) [830-886) [886-942) [942-997) Fr equ ência Classes Frequência absolutaMedidas de posição e dispersão dos
dados
0 2 4 6 8 10 12 [606-662) [662-718) [718-774) [774-830) [830-886) [886-942) [942-997) Fr equ ência Classes Frequência absolutaMedidas de posição e dispersão dos
dados
0 2 4 6 8 10 12 [606-662) [662-718) [718-774) [774-830) [830-886) [886-942) [942-997) Fr equ ência Classes Frequência absolutaConclusões
A dispersão média contém o valor de referência
da produtividade média da região (774 g/dia), indicando que possivelmente se esta dieta fosse aplicada em larga escala o ganho de produtividade não seria compensador financeiramente.
No entanto, para se ter certeza, precisaríamos
usar a última ferramenta disponível do analista para resumir informação: “O teste de hipóteses”
EXERCÍCIOS - APS
Exercício 1
Na tabela abaixo é possível observar a
produtividade média (parcelas por dia) de duas equipes de inventário de florestas plantadas. Qual é a equipe mais produtiva? Qual é o mais consistente? Quais das duas você contrataria?
Equipe A 6 6 7 6 7 6 5
Exercício 2
Crie um exercício de BIOestatística voltado para a sua área de atuação (interesses de pesquisas), de modo que contemple os tópicos já estudadas nas aulas até a presente data (medidas de posição e dispersão).
Referências básicas:
VISMARA, Edgar de Souza. Notas das aulas de Estatística ministradas no
Câmpus Dois Vizinhos. 2014.
BATISTA, J. L. F. Notas para acompanhar as aulas da disciplina “Introdução à Bioestatística
Florestal”. Piracicaba, 1997.
BUSSAB, Wilton O. Estatística Básica. 6.Ed.São Paulo, SP: Saraiva, 2010.
CAMPOS, Celso Ribeiro; WODEWOTZKI, Maria Lúcia Lorenzetti; JACOBINI, Otávio Roberto.
Educação Estatística: Teoria e Prática em Ambientes de Modelagem Matemática. 1. Ed. Belo
Horizonte: Autêntica, 2011.
CRESPO, A. A. Estatística Fácil. 19. ed. São Paulo: Saraiva, 2009.
MORETTIN, L. G. Estatística básica: probabilidade e interferência. São Paulo: Pearson Education Prentice Hall, 2010.
VIEIRA, S. Elementos de estatística. 4. ed. São Paulo: Atlas, 2003.
Referências complementares:
DOWNING, D. Estatística aplicada. 3. ed. São Paulo: Saraiva, 2010.
FONSECA, J. S. da. Curso de Estatística. 6. ed. São Paulo: Atlas, 1996.
LEVINE, D. M.; BERENSON, M. L; STEPHAN, D. Estatística: teoria e aplicações. 5. ed. Rio de Janeiro:
Livros Técnicos e Científicos, 2008.
MAGNUSSON, W.; MOURÃO, G. Estatística sem matemática: a ligação entre as questões e análise.
Londrina: Editora Planta, 2005.
PETERNELLI, L. A.; MELLO, M. P. Conhecendo o R: uma visão estatística. 2. ed. São Paulo: UFV, 2011.
VIEIRA, S. Elementos de estatística. 4. ed. São Paulo: Atlas, 2003.