Parte 5
Introdução à Estatística
Prof. Adriano Pasqualotti
Probabilidade e Estatística
Ciência da Computação
2/46
Objetivos
n Definir os termos utilizados na área de Estatística
n Definir dados quantitativos e qualitativos
n Definir os níveis de mensuração n Descrever os métodos de amostragem
Problema
n Programa de televisão realiza pesquisa para verificar a opinião dos
telespectadores sobre a permanência da sede das Nações Unidas nos USA
n Os telespectadores pagavam 50 centavos
de dólar para fazer a chamada telefônica
n Dos 186.000 que responderam, 67%
disseram que a sede da ONU devia sair dos USA
4/46
Estatística
n A palavra pode ser usada com dois sentidos
n Em relação a números específicos obtidos de dados
n Como método de análise
n É uma coleção de métodos para planejar
experimento, obter, organizar, resumir, analisar, interpretar e extrair conclusões de dados
5/46
Definição de termos
extensamente utilizados
n População (N)
n Consiste na totalidade de unidades de observação a partir das quais se deseja tomar uma decisão
n Censo
n Exame de todas as unidades de
observação de uma população
6/46
Definição de termos
extensamente utilizados
n Amostra (n)
n Conjunto de unidades selecionadas de uma população
n Parâmetro
n É uma medida numérica que descreve uma característica de uma população
n Estatística
n É uma medida numérica que descreve uma característica de uma amostra
7/46
A natureza dos dados
n Dados qualitativos (dados categóricos ou atributos)
n Podem ser separados em diferentes
categorias que se distinguem por alguma característica não-numérica
n Dados quantitativos
n Consistem em números que representam
contagem ou medidas
8/46
A natureza dos dados
quantitativos
n Dados discretos
n Resultam de um conjunto finito de valores possíveis ou infinito enumerável
n Dados contínuos (numéricos)
n Resultam de um conjunto infinito de valores possíveis que podem ser associados a pontos em uma escala contínua
Exemplos de dados
qualitativos
n Sexo: masculino e feminino
n Religião: católica, judaica e protestante n Naturalidade: carioca, paulista, gaúcho
e mineiro
n Cor dos olhos: castanho, verdes e azuis n Faixa etária: até 25 anos, de 26 a 49
10/46
Exemplos de dados
quantitativos discretos
n Quantidade de valores de uma moeda: 1, 2, 5, 10, 20, 50 e 100
n Número de alunos em uma sala de aula n Número de enfermeiros em um hospital n Quantidade de sabores de um suco:
tangerina, laranja, maracujá, abacaxi e maçã
11/46
Exemplos de dados
quantitativos contínuos
n Valor do patrimônio dos hospitais de Passo Fundo: R$ 1.700.000,00; R$ 11.240,00; R$ 120.977.174,96 n Duração de uma bateria de
marca-passo: 463h, 345h35min, e 1.280h n Valor de cirurgia paga pelo SUS: R$
170,32 e R$ 11,24 12/46
Exercício proposto
n Identifique cada número como discreto ou contínuo.13/46
Problemas
n Cada cigarro Camel tem 16,13 mg de
alcatrão
n O altímetro de um avião da American Airlines
indica uma altitude de 21.359 pés
n Uma pesquisa efetuada com 1.015 pessoas
indica que 40 delas são assinantes de um serviço de computador on-line
14/46
Escalas utilizadas
n Nominaln Os dados consistem em nomes, rótulos ou
categorias
n Ordinal
n Os dados podem ser dispostos em alguma
ordem
Escalas utilizadas
n Intervalarn Os dados podem ser dispostos em alguma
ordem e também há variação numérica entre as características
n Uma unidade de medida (arbitrária e fixa) n Um zero relativo (convencional)
16/46
Escalas utilizadas
n Racionaln Os dados podem ser dispostos em alguma
ordem e também há variação numérica entre as características
n Uma unidade de medida (arbitrária e fixa)
n Um zero absoluto
n Diferenças e razões entre os dados têm significado
17/46
Exemplos de níveis de
mensuração
n Nominal
n Sexo dos alunos em uma turma de
estatística
n Respostas do tipo “sim” ou “não”
n Ordinal
n Editor classifica originais como excelente, “bons” ou “maus”
n Posição de corretores em uma prova
18/46
Exemplos de níveis de
mensuração
n Intervalar
n Os anos 1000, 2000, 1876 e 1984
n As temperaturas anuais médias (em °C)
das capitais dos estados brasileiros
n Racional
n Pesos de artigos de material plástico descartados pelos hospitais
19/46
Exercício proposto
n Determine o nível de mensuração mais adequado. 20/46Problemas
n Classificação como superior, acima da média, médio, abaixo da média ou pobre para encontros marcados com desconhecidos
n Conteúdo de nicotina (em mg) de cigarros Camel
n Números de inscrições no INSS
Problemas
n Rendas anuais de enfermeiras n Carros classificados como
subcompacto, compacto, intermediário ou grande
n Classificação do prefeitos da capitais da região sul (em uma escala de 0 a 10): Curitiba 6,7; Porto Alegre 6,4;
22/46
Amostragem
n Processo pelo qual uma amostra de unidade da população é observada n Envolve pelo menos dois passos
n Escolha das unidades
n Registro das observações
n Sem reposição
n As unidades são selecionadas apenas
uma vez
23/46
Amostragem
n Com reposiçãon As unidades são selecionadas mais de
uma vez
n Justificativas para o seu uso
n Escassez de tempo e recursos
n Testes destrutivos
n Impossibilidade de estudar a totalidade
24/46
Amostragem
n Coleta de dados por observação direta
n As unidades de observação são obtidas
pelo próprio pesquisador
n Através de um instrumento
n Coleta de dados por observação indireta
n As unidades de observação são obtidas
25/46
Tipos de amostragem
n Amostragem aleatória simplesn Processo de retirada de uma amostra de
população no qual cada unidade tem a mesma chance de ser retirada
n Nomes em cartões ou tabela de dígitos pseudo-aleatórios 124-222 671-481 26/46
Exemplo amostragem
aleatória simples
n Selecionar, aleatoriamente, dez unidades de uma população de tamanho N = 874
n Utilizando tabela de dígitos pseudo-aleatórios
874; 855; 422; 257; 706; 362; 434; 338; 365, 922; 767;
Tipos de amostragem
n Amostragem estratificadan Subdivide a população em, no mínimo,
duas subpopulações (estratos) que compartilham das mesmas características e, em seguida, extraí-se uma amostra de cada estrato
28/46
Exemplo amostragem
estratificada
n O TER dos Estados quer verificar, no conjunto do eleitores, quanto são homens ou mulheres, quanto estão em cada faixa etária pesquisada e quantos estão na capital ou no interior
n Dividir a população em termos de sexo, faixa etária e tipo de cidade
n Escolha da unidade por sorteio aleatório
29/46
Tipos de amostragem
n Amostragem sistemátican Escolhe-se um ponto de partida, e seleciona-se cada k-ésimoelemento da
população
30/46
Exemplo amostragem
sistemática
n Selecionar, aleatoriamente, dez unidades de uma população de tamanho N = 874
n Definir intervalo de seleção: 874/10 = 87,4
≅87 (aproxima-se sempre para menos)
87; 174; 261; 348; 435; 522; 609; 696; 783; 870;
31/46
Tipos de amostragem
n Amostragem por conglomeradon Divide-se a área da população em seções
(conglomerados); em seguida escolhe-se algumas dessas seções e, finalmente, toma-se todos os elementos das seções escolhidas
32/46
Exemplo amostragem por
conglomerado
n Um enfermeiro quer entrevistar todos os pacientes internados em uma UTI de cada 10 hospitais das cidades da região do planalto
n Dividir em seções as UTIs dos hospitais
n Selecionar aleatoriamente alguma dessas
UTIs
n Tomar todos os pacientes dessas UTIs
Exercícios proposto
n Identifique o tipo de amostragem utilizado: aleatória, estratificada, sistemática ou por conglomerado.34/46
Problemas
n Quando escreveu Women and love: A Cultural Revolution, a autora Shere Hite baseou-se suas conclusões em 4.500 respostas a 100.000 questionários distribuídos a mulheres
n Um sociólogo da UPF seleciona 12 homens e 12 mulheres de cada uma das quatro turmas de inglês
35/46
Problemas
n Um psicólogo da Universidade de Nova York faz uma pesquisa sobre todos os estudantes de cada uma de 20 turmas selecionadas aleatoriamente
n A empresa Sony seleciona cada 200º CD de uma linha de produção e faz um teste de qualidade rigoroso
36/46
Problemas
n Um cabo eleitoral escreve o nome de cada senador do Brasil em cartões separados, mistura-os e extrai 10 nomes
n O programa Planejamento Familiar pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais
37/46
Problemas
n Um pesquisador de mercado da Varing entrevista todos os passageiros de cada um de 10 vôos selecionados aleatoriamente
n Um repórter da revista Veja entrevista todo 50º gerente geral constante da relação dos 1000 hospitais com maior número de internações pelo SUS
38/46
Exercício proposto
n Selecionar unidades de observação de uma população utilizando a tabela de dígitos pseudo-aleatóriosProblema
n Selecionar, aleatoriamente, 15 unidades de uma população de tamanho N = 3.467. A leitura deverá iniciar de baixo para cima, a partir da última coluna40/46
Solução do problema – tabela
de dígitos pseudo-aleatórios
2700; 2124; 3205; 753; 2770; 990; 1014; 3262; 3062; 1475; 559; 395; 3361; 3060; 1467; 41/46Tipos de estudos
n Observacionaln Verifica e mede-se as características específicas, mas não tenta-se manipular ou modificar os elementos a serem estudados
n Experimento
n Aplica-se determinados tratamentos e passa-se a observar seus efeitos
42/46
Exercícios proposto
n Determine se a descrição dada corresponde a um estudo observacional ou a um experimento.43/46
Problemas
n Mede-se o conteúdo de alcatrão, nicotina e monóxido de carbono em diferentes marcas de cigarro
n Pede-se a fumantes que reduzem à metade o número de cigarros
consumidos diariamente, para que se possam medir os efeitos sobre a freqüência de pulsação
44/46
Problema
n Em uma turma de educação física, estuda-se o efeito dos exercícios físicos sobre a pressão sanguínea,
determinando-se que a metade dos estudantes ande 2 km cada dia, enquanto a outra metade corra 2,0 km diariamente
Problema
n Estuda-se a relação entre os pesos de ursos e seus comprimentos, tomando-se as medidas e ursos anestesiados
46/46
Atividade em grupo
n Deseja-se fazer uma pesquisa junto a estudantes de tempo integral do curso de Computação da UPF. Planeja e descreva detalhadamente um processo para obter uma amostra aleatória de 100 estudantes.