• Nenhum resultado encontrado

DESCRIÇÃO E APRESENTAÇÃO DE DADOS: UMA INTRODUÇÃO

N/A
N/A
Protected

Academic year: 2021

Share "DESCRIÇÃO E APRESENTAÇÃO DE DADOS: UMA INTRODUÇÃO"

Copied!
120
0
0

Texto

(1)

D

ESCRIÇÃO E

A

PRESENTAÇÃO DE

D

ADOS

: U

MA

I

NTRODUÇÃO

THIAGO REZENDEDOS SANTOS BOLSISTA: GABRIELJULIANO CAMÊLO

UNIVERSIDADE FEDERALDE OURO PRETO

INSTITUTODE CIÊNCIAS EXATASE BIOLÓGICAS

DEPARTAMENTODE MATEMÁTICA

(2)

ELABORAÇÃO DE UM MATERIAL DIDÁTICO PARA A DISCIPLINA DE ESTATÍSTICA I

U

NIVERSIDADE

F

EDERAL DE

O

URO

P

RETO

Neste projeto pró-ativa, desenvolvemos um material pra a disciplina de Estatística I com o apóio da PROGRAD.

(3)

Índice

1.Introdução_______________________________________________5

2.História da Estatística_______________________________________4

2.1.Panorama Histórico_________________________________________________7

2.2.Estatística no século XIX

___________________________________________8

2.3.Aleatoriedade _____________________________________________________8 2.4.Probabilidade______________________________________________________ 9

2.5.O experimento de Fisher ____________________________________________9 2.6.Cronologia________________________________________________________11

3.Estatística:

definição, conceitos, importantes, motivação e aplicações s

______________13

3.1.Definição _________________________________________________________13 3.2.População e Amostra_______________________________________________14 3.3.Censo e Amostragem _______________________________________________15 3.4.Parametro e Estatística _____________________________________________15 3.5.Variável__________________________________________________________16 3.5.1. Os tipos de variáveis __________________________________________16

3.6.Exemplos de Dados em Diversas áreas do conhecimento _________________17

4.Noções de Metodologia Científico_____________________________23

4.1. Natureza da ciência ________________________________________________23

4.2. Conceito de Método ________________________________________________24 4.3. Método científico __________________________________________________24

5.Técnicas de Pesquisa________________________________________25

5.1. Métodos Experimentais e Estatísticos__________________________________25 5.2. Preparação da Pesquisa_____________________________________________27 5.3. Elaboração do Questionário _________________________________________29

6.Tipos de levantamentos de Dados_____________________________33

6.1. Método de coleta de dados___________________________________________33 6.2. Conceitos básicos de Amostragem ____________________________________36 6.2.1. Métodos de Amostragem Probabilística __________________________37 6.2.1.1. Amostragem Aleatória Simples (AAS) ____________________37

(4)

6.2.1.2. Amostragem Sistemática _______________________________38 6.2.1.3. Amostragem Aleatória Estratificada (AAE) _______________38 6.2.2. Amostragem não-probabilística_________________________________38 6.2.2.1. Intencional __________________________________________39 6.2.2.2. Por “Júris” __________________________________________39 6.2.2.3. Por Quotas __________________________________________39

7.Organização e Tabulação dos Dados _________________________41

8. Análise dos Dados: Tabelas e Gráficos__________________________44

8.1. Tabelas___________________________________________________________44 8.2. Gráficos__________________________________________________________45 8.3. Tabelas para Variáveis Quantitativas _________________________________47 8.4. Tabelas para Variáveis Qualitativas___________________________________72 8.5. Vários Tipos de Gráficos ___________________________________________76 8.6. Dados dos alunos do curso de Estatística I _____________________________89

9. Medidas de síntese Numérica_________________________________106

9.1. Medidas de síntese Numérica para dados brutos _______________________106 9.2. Medidas de síntese Numérica dados agrupados sem intervalo de classe ____110 9.3. Medidas de síntese Numérica dados agrupados com intervalo de classe ____112

10.Conclusão________________________________________________119

(5)

Capítulo 1

Introdução

O intuito da preparação deste material é auxiliar as aulas da disciplina de Estatística I do curso de Estatística do DEMAT-UFOP. A disciplina consiste em conceitos básicos de pesquisa, planejamento, descrição, análise e apresentação de dados. De uma forma simples e objetiva, abordam-se todas as etapas do processo de pesquisa científica desde da elaboração e planejamento do projeto até a análise e apuração dos resultados. A estrutura deste texto segue as etapas do método científico estatístico de pesquisa, como mostrado no organograma abaixo: Definição do Problema PLANEJAMENTO Tipos de Levantamento e Coleta Organização e Tabulação dos Dados Apresentação e Análise dos Dados CONCLUSÃO

(6)

Cada capítulo aborda um pouco de cada uma das etapas no organograma. Para algumas fases, faz-se necessário o uso de planilhas eletrônicas, bem como análise dos dados coletados. Desta forma, são introduzidos alguns softwares para as análises.

Na parte computacional, serão usados os softwares MINITAB e Excel para a confecção de tabelas, gráficos e medidas de resumo dos dados. Isto é, os leitores são introduzidos e aprendem, de uma forma bem interativa, métodos de análise de dados básica nesses softwares, bem como adquirem familiaridade com os mesmos. Todas as rotinas e arquivos criados podem ser disponibilizados através de uma simples requisição.

O Minitab é um programa de computador proprietário voltado para fins estatísticos. É muito utilizado nas universidades nos cursos introdutórios de estatística. Também é utilizado em empresas num nível mais avançado de utilização, tendo funções mais específicas voltadas para gerenciamento. Sua interface é parecida com a de uma planilha eletrônica como Microsoft Excel ou Calc do OpenOffice mas com a capacidade de executar análises estatísticas complexas. O programa foi desenvolvido em 1972. O Minitab geralmente é utilizado em conjunto com o Seis Sigma, que é uma forma de aperfeiçoar processos rotineiros. Atualmente, milhares de entidades públicas e privadas no mundo usam essa poderosa ferramenta em seu ambiente de trabalho. Dentre elas mais de 4000 universidades em mais de 80 países.

Diferenciais: Fácil de usar e de aprender, o Minitab oferece ferramentas de Controle da Qualidade, Planejamento de Experimentos (DOE), Análise de Confiabilidade e Estatística Geral, além de ser o software mais utilizado no desenvolvimento de projetos Seis Sigma. Outros diferenciais: • Utilizado em mais de 80 países por mais de 30 mil empresas; • Ensinado em mais de 4.000 universidades em todo o mundo; • Fácil de aprender e de operar; • O software mais completo para a metodologia Seis Sigma; • Diferentes modalidades de licença, de acordo com a necessidade do cliente; • Parceria com várias empresas no fornecimento de cursos, treinamentos e consultorias; • Total apoio aos usuários.

O Microsoft Office Excel é um programa de planilha eletrônica escrito e produzido pela Microsoft para computadores que utilizam o sistema operacional Microsoft Windows e também computadores Macintosh da Apple. Seus recursos incluem uma interface intuitiva e capacitadas ferramentas de cálculo e de construção de gráficos que, juntamente com marketing agressivo, tornaram o Excel um dos mais populares aplicativos de computador até hoje. É, com grande vantagem, o aplicativo de planilha eletrônica dominante, disponível para essas plataformas e o tem sido desde a versão 5 em 1993 e sua inclusão como parte do Microsoft Office.

Este está organizado da seguinte forma: No Capítulo 2, é discorrido um pouco sobre a história da Estatística. No Capítulo 3, são apresentados conceitos fundamentais e definições essenciais em estatística. No Capítulo 4, é feita uma breve introdução sobre metodologia de pesquisa. No Capítulo 5, são abordados o método estatístico e técnicas de pesquisa. No Capítulo 6, são mostrados os tipos possíveis de levantamento de dados. No Capítulo 7, são exibidas algumas maneiras de organização e tabulação dos dados. No Capítulo 8, a análise dos dados através de tabelas e gráficos é feita. No Capítulo 9, as medidas de síntese númerica são mostradas. Finalmente, no Capítulo 10, é feita a

(7)

Capítulo 2

História da Estatística

“To understand God's thoughts we must study

statistics, for these are the measure of His purpose.”

Florence Nightingale

2.1. Panorama Histórico

Todas as ciências têm suas raízes na história do homem. A Matemática, que é considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário, empírico.

A Estatística, ramo da Matemática Aplicada teve origem semelhante. Desde a Antiguidade, vários povos registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuíam eqüitativamente terras ao povo, cobravam impostos e realizam inquéritos quantitativos por processos que, hoje, chamaríamos de “estatísticas”. Na Idade Média colhiam-se informações geralmente com finalidades tributárias ou bélicas.

A partir do século XVI começaram a surgir às primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais, originando as primeiras tábuas e tabelas e os primeiros números relativos. No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. Godofredo Achenwall batizou a nova ciência (ou método) com o nome de Estatística, determinando o seu objetivo e suas relações com as ciências.

As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (população), partindo da observação de partes desse todo (amostras). Isso o que denominamos com Inferência estatística indutiva.

Atualmente, o público leigo (leitor de jornais e revistas) posiciona-se em dois extremos divergentes e igualmente errôneos quanto à validade das conclusões estatísticas: ou crê em sua infalibilidade ou afirma que elas nada provam. Os que pensam assim ignoram os objetivos, o campo e o rigor do método estatístico; ignoram a Estatística, quer teórica quer prática, ou a conhecem muito superficialmente. Na era da energia nuclear, os estudos estatísticos têm avançado rapidamente e com seus processos, técnicas têm contribuído para a organização dos negócios e recursos do mundo moderno.

(8)

A ciência chegou ao século XIX com a firme visão filosófica de que o Universo funcionaria como o mecanismo de um imenso relógio. Acreditava-se que havia um pequeno número de fórmulas matemáticas (como as leis do movimento de Newton e as leis de Boyle) capazes de descrever a realidade e prever eventos futuros. Tudo de que se necessitava para tal predição era um conjunto completo dessas fórmulas e um grupo de medições a elas associadas, realizadas com suficiente precisão. A cultura popular levou mais de 40 anos para se pôr em ida com essa visão científica.

A observação de planetas e cometas a partir da Terra não se ajustava com precisão às posições previstas, fato que Laplace e seus colegas cientistas atribuíram a erros nas observações, algumas vezes atribuíveis a alterações na atmosfera da Terra, outras vezes a falhas humanas. Laplace reuniu todos esses erros numa peça extra (a função erro), que atrelou a suas descrições matemáticas. Essa função erro absorveu e deixou apenas as puras leis do movimento para prever as verdadeiras posições dos corpos celestes. Acreditava-se que, com medições cada vez mais precisas, diminuiria a necessidade da função erro. Como ela dava conta de pequenas discrepâncias entre o observado e o previsto, a ciência do século XIX estava nas garras do determinismo filosófico – a crença de que tudo é determinado de antemão pelas condições iniciais do Universo e pelas fórmulas matemáticas que descrevem seus movimentos.

No final do século XIX, os erros haviam aumentado, em vez de diminuir. À proporção que as medições se tornavam mais precisos, novos erros se revelavam. O andar do Universo mecânico era trôpego. Falharam as tentativas de descobrir de as leis que Newton e Laplace tinham utilizado mostravam-se meras aproximações grosseiras. Gradualmente, a ciência começou a trabalhar com um novo paradigma, o modelo estatístico da realidade. No final do século XX, quase toda a ciência tinha passado a usar modelos estatísticos.

2.3. Aleatoriedade

Para o cientista moderno, o conceito de distribuição probabilística nos permite estabelecer à aleatoriedade e nos dá limitada capacidade de prever eventos futuros aleatórios. Assim, eventos aleatórios não são simplesmente indomados, inesperados e imprevisíveis – sua estrutura pode ser descrita matematicamente.

(9)

Apesar da natureza incompleta da teoria de probabilidade, ela se mostrou útil para idéia, que então se desenvolvia de distribuição estatística. Uma distribuição estatística ocorre quando consideramos um problema científico específico.

Usando as ferramentas da probabilidade, eles construíam uma fórmula teórica para aquela distribuição, “a função de distribuição probabilística”, ou simplesmente a função de distribuição, que utilizaram para examinar a questão.

Com os avanços da teoria de medida e integração e da análise matemática, A.N. Kolmogorov, em 1933, lança axiomatização da

probabilidade ou a definição axiomática. Agora a

medida de probabilidade pode lançar mão de ferramentas mais sofisticadas da matemática. A probabilidade é levada mais a sério e tem todo rigor e formalidade que os matemáticos tanto apreciam.

2.5. O experimento de Fisher

Era uma tarde de verão em Cambridge, Inglaterra, no final dos anos 1920. Um grupo de professores universitários, suas esposa e alguns convidados tomara lugar a uma mesa no jardim para o chá da tarde. Uma das mulheres insistia em afirmar que o chá servido sobre o leite parecia ficar com o gosto diferente do que apresentava ao receber o leite sobre ele. As cabeças científicas dos homens zombaram do disparate. Qual seria a diferença? Não podiam perceber diferença alguma na química da mistura. Um homem de estatura baixa, magro, de óculos grossos interessou pelo problema. “Vamos testar a proposição”.

E assim naquela tarde de verão em Cambridge. O homem de cavanhaque era Ronal Aymler Fisher, na época com 30 e tantos anos, que posteriormente receberia o título de sir Ronald Fisher.Em 1935, publicou The Design of experiments, em cujo segundo capitulo descreveu o experimento da senhora provando chá.

Livro de Fisher

O livro sobre desenho experimental de Fisher foi um elemento importante na revolução que atravessou todos os campos da ciência na primeira metade do século XX. Bem antes de Fisher entrar em cena, experimentos científicos

já vinham sendo realizados havia centenas de anos. Em Design of Experiments, Fisher

Ilustração 2.1 - A.N. Kolmogorov

(10)

forneceu alguns exemplos de bom desenho experimental, e deduziu regras gerais para eles. No entanto, a matemática dos métodos de Fisher era muito sofisticada, e a maioria dos cientistas não era capaz de gerar os seus próprios planejamentos a não ser que seguisse o padrão de algum dos que Fisher apresentara em seu livro.

Os cientistas agrícolas reconheceram o grande valor do trabalho de Fisher sobre o planejamento de experimentos, e os métodos Fisherianos, logo, dominaram as escolas de agricultura na maior parte do mundo de língua inglesa.

Fisher versus Pearson

Laplace, em 1820, descrevia a primeira distribuição probabilística. Pearson descobriu uma família de distribuições que denominou skew distributions (distribuições assimétricas).

Pearson acreditava que as distribuições estatísticas descreviam as verdadeiras coleções de dados que ele iria analisar; Fisher acreditava que a verdadeira distribuição é fórmula matemática abstrata, e os dados coletados só podem ser usados para estimar os parâmetros da distribuição verdadeira.

O triunfo de Fisher:

• Fisher propôs o método de estimação de máxima verossimilhança (MLE);

• Estabeleceu critérios para comparar os estimadores; • Experimentos aleatórios controlados;

• Análise de Variância; • Graus de liberdade;

• Contribuições na pesquisa agronômica;

• Os métodos de Pearson jazem na poeira da história.

Fisher publicou um artigo intitulado “Cigarros, câncer e estatística” na Centennial Review e dois artigos na Nature “Câncer de pulmão e cigarros?” e “Câncer e Fumar”;

Ele insistia que a evidência usada para mostrar que fumar causava câncer de pulmão era cheia de imperfeições.

(11)

Ano Evento Pessoa

1857 Nascimento Karl Pearson K. Pearson

1876 Nascimento de William Gosset W. S.Gosset (“Student”)

1886 Nascimento de Paul Lévy P. Lévy

1890 Nascimento Ronald Aylmer Fisher R. A. Fisher

1893 Nascimento Harald Cramér H. Cramér

1894 Nascimento Jerzy Neyman J. Neyman

1895 Descoberta distribuições Assimétricas K. Pearson

1895 Nascimento Egon Pearson E. Pearson

1902 Primeira edição Biometrika Galton, Pearson e Weldon

1903 Nascimento A. N. Kolmogorov A. N.Kolmogorov

1908 Teste t de Student W.S. Gosset

1912 1ª publicação de Fisher Fisher

1915. Distribuição Coeficiente de Correlação Fisher

1915 Nascimento John Tukey Tukey

1916 Lema Glivenko-Cantelli Cantelli

1917 Nascimento Savage Savage

1919 Fisher Est. Exp.Rothamsted *** Fisher

1920 1º dos artigos de integração de Lebesgue Lebesgue 1925 1ª Ed. Statistical methods for research workers Fisher

1925 Teoria MV Fisher

1928 Teste hipóteses Neyman,Pearson

1933 Axiomatização probabilidade Kolmogorov

1934 Intervalos confiança J.Neyman

1934 Prova Teorema Central do Limite Lévy, Lindeberg

1945 Testes não-paramétricos Wilcoxon

1947 Testes nãoparamétricos Mann-Whitney

1948 Inferência estatística não paramétrica Pitman

1949 Estudos observacionais Cochran

1957 Polêmica cigarros Fisher

1959 Formulação Definitiva testes hipóteses E. L. Lehmann 1970 Teoria confiabilidade e distribuição Weibull N. Mann

1972 Modelos lineares Generalizados J. A. Nelder

1976 Modelos ARIMA Box e Jenkins

1977 Testes de significância Cox

1977 Publicação Exploratory Data Analysis Tukey

1979 Bootstrap Efron

1987 Morte Kolmogorov Kolmogorov

1990 Splines for Observation al Data Wahba

1990 MCMC Gelfand e Smith

2000 Morte Tukey Tukey

2009 Morte Lehmann Lehmann

2010 Morte Nelder Nelder

(12)

Os interessados em mais detalhes da história da estatística podem consultar o livro Uma senhora toma chá (The Lady Tasting Tea). Boa parte desse capítulo foi baseado no mesmo. Outros livros interessantes são Um Desafio aos Deuses (conta a história da teoria do risco) e o Andar do Bêbado o qual aborda como a aleatoriedade pode influenciar nossas vidas.

A seguir, será apresentado os conceitos fundamentais, definições e aplicações em Estatística.

(13)

Estatística: definição, conceitos

importantes, motivação e aplicações

“A Estatística nada mais é que o bom senso em números.” Pierre Simon, Marquês de Laplace Matemático francês do século XVIII.

Todo dia ouvimos ou lemos essa frase, aplicada às informações a respeito de todo tipo de assunto: • Desemprego • Acidentes • Saúde Pública • Infração • Educação • Divórcio • Turismo • Comércio

• Etc., etc., etc...

É cada vez mais freqüente a necessidade de se compreender as informações veiculadas. Estar “alfabetizado” também supõe saber ler e interpretar dados.

As “Estatísticas” são usadas para o conhecimento, fazer previsões e tomar decisões.

3.1. Definição

Estatística é a ciência da coleta, organização, análise e interpretação de dados com o objetivo de conhecimento e tomada de decisão. A palavra Estatística vem do latim status, que significa estado.

Isto porque os primeiros usos da Estatística envolviam compilação de dados e confecção de gráficos que descreviam alguns aspectos demográficos e sociais (como nascimentos e mortes) de um estado, o Império Romano.

Objetivos do Aprendizado de Estatística

• Saber fazer ou criticar o que está feito.

• Tornar-se mais crítico em sua análise de informações quantitativas;

• Tornar-se menos sujeito as afirmações enganosas baseadas em números ou gráficas distorcidos.

• Aguçar sua capacidade de reconhecer dados estatísticos distorcidos e de interpretar adequadamente dados não distorcidos.

(14)

Os Dados

Dados são informações (sobre pessoas, plantas, objetos, etc) obtidas através de

medição, observação ou contagem. Exemplos:

• Medição de pressão sanguínea de um paciente; • Circunferência do tronco de uma árvore;

• Classificação de uma peça produzida: defeituosa ou não; • PIB de um país;

• Número de alunos de uma escola.

Construção de Modelos Estatísticos

I. Descrever a relação entre variáveis para entender um fenômeno.

Ex .: Entender o efeito no preço de venda de um imóvel, de características como área construída, número de cômodos, idade, localização, etc.

II. Prever o valor de uma variável a partir dos valores de outras variáveis.

Ex .: Calcular a probabilidade de ocorrência de um tornado a partir de medições de vento, umidade, temperatura, pressão, etc.

III. Substituir a medição de uma variável pela observação dos valores de outras variáveis.

Ex .: Substituir a medição da quantidade de gordura abdominal feita através de tomografia (muito cara, disponível em poucos consultórios médicos) por medidas de fácil obtenção como circunferência da cintura, circunferência e prega cutânea do abdômen.

3.2. População e Amostra

Podemos inferir (deduzir) determinadas características de uma

população se extraímos uma amostra representativa desta. População: Coleção de unidades

individuais (pessoas ou resultados experimentais) com uma ou mais características comuns, que se pretendem estudar.

Amostra: Conjunto de dados ou

observações, recolhidos a partir de um subconjunto da população, que se estuda com o objetivo de tirar conclusões pra a população de onde foi recolhida.

(15)

População: Coleção de unidades individuais (pessoas ou resultados experimentais) com uma ou mais características comuns, que se pretendem estudar.

Amostra: Conjunto de dados ou observações, um subconjunto escolhido a partir da população.

OBS.: Podemos inferir determinadas características de uma população se extraímos uma

amostra representativa da população.

3.3. Censo e Amostragem

Um censo consiste da coleta dos dados da população inteira. Usualmente, é impraticável observar toda a população:

- A população é muito grande.

Ex .: Respostas de todos os adolescentes brasileiros sobre fumo. - A população é infinita.

Ex .: As medições de poluição em um rio Na maioria dos casos os dados são obtidos via amostragem.

3.4. Parâmetro e estatística

Dois conceitos importantes agora: parâmetro e estatística.

Parâmetro: Descrição numérica de uma característica da população. Será

conhecido apenas se toda a população for observada.

Estatística: Descrição numérica de uma característica da amostra.

Exemplo 1: Uma pesquisa foi realizada com 1000 adolescentes brasileiros sobre o (mau!) hábito de fumar:

_ 280 responderam que “fumam” e _ 720 responderam que “não fumam”.

População: Consiste das respostas de todos os (milhões de) adolescentes brasileiros. Amostra: Consiste das 1000 respostas obtidas na pesquisa.

(16)

Um Censo consiste da coleta dos dados da população inteira. Usualmente, é impraticável observar toda a população. A população é muito grande.

Exemplo: Resposta de todos os adolescentes brasileiros sobre o fumo.

Parâmetro: Descrição numérica de uma característica da população. Será conhecido apenas se toda a população for observada.

Estatística: Descrição numérica de uma característica da amostra.

Exemplo 2: Proporção de adolescentes brasileiros que fumam – parâmetro (Valor desconhecido, pois não há pesquisa com todos os adolescentes do Brasil).

Proporção de adolescentes na amostra que responderam “fumo” – estatística.

3.5. Variável

Podemos definir uma variável, como algum valor ou quantidade que pode variar de uma pessoa a outra, de um item a outro. Em geral, denotamos as variáveis por letras maiúsculas.

Exemplo 3:

_ Estatura é um variável porque este valor variar de uma pessoa a outra.

_ O número de acidentes em uma estrada é uma variável, porque ele pode variar de 0,1,2,3,...

3.5.1. Os tipos de variáveis

Variáveis qualitativas: Atributos ou classificações não numéricas.

Exemplo 4: Sexo (masculino, feminino), Escolaridade (nenhuma, primário, ensino médio, etc).

Essas variáveis se subdividem em:

i) Nominais : Variáveis qualitativas classificadas por nomes ou rótulos, mas a ordenação não az sentido.

ii) Ordinais: Variáveis qualitativas que podem ser ordenadas, mas a operação de diferença não faz sentido.

Variáveis quantitativas: Contagens ou medições numéricas. Exemplo 5: Idade, número de filhos, altura, peso.

Essas variáveis se subdividem em:

i) Discretas: O número de valores possíveis é finito ou infinito enumerável. ii) Contínuas: Têm infinitos valores possíveis numa escala contínua de medição, sem vazios, interrupções ou saltos.

(17)

2) Nem toda variável representada por números é quantitativa. Exemplo 7: Número de telefone.

3) A identificação da natureza da variável é de suma importância para determinar que tipo de operação, tipo de gráfico e tabela pode ser feita com mesma.

Exercício:

O IBGE selecionou aleatoriamente 5000 famílias na região metropolitana de Belo Horizonte para avaliar o perfil sócio – econômico.

Qual é a população amostrada?

A renda média das famílias da região metropolitana de Belo Horizonte, baseada no estudo, é dois salários mínimos. Estatística ou Parâmetro?

3.6. Exemplos de Dados em Diversas áreas do

conhecimento

Exemplo 1: Estatísticas sociais.

(18)

Exemplo 2: Estudos sobre criminalidade.

Tabela 3.1: Índices de criminalidade

(19)

Exemplo 3: Trânsito e Engenharia de tráfego

Gráfico de barras horizontais 3.3: Comparação de Infrações cometidas. Fonte: GPROM/BHTRANS

Exemplo 4: Medicina.

Faixas de referências de exames médicos

A tecnologia permitiu a quantificação de diversas características dos seres vivos através de exames, como os de sangue, tomografia, ecocardiograma, etc.

Uma mesma variável pode ser medida em muitos seres, mas mesmo que todos sejam sadios, produzirá resultados diferentes em cada indivíduo.

Exemplo 5: Medicina.

Taxa de hemoglobina(g/dl) de147 cavalos sadios.

(20)

Pergunta: Se todos são sadios, qual é o valor da taxa de hemoglobina que vamos

considerar normal? A resposta é uma faixa de referência.

Faixa de Referência: Intervalo de valores para os quais o indivíduo é considerado

“normal” para a característica.

Valor dentro da faixa: indivíduo normal. Valor fora da faixa: indivíduo doente.

A construção de uma faixa de referência para uma determinada característica é baseada em valores que uma grande parte(90%, 95%) da população sadia possui.

Faixa de referência de 90% pra taxa de hemoglobina é 8.72 a 15.28 g%.

Exemplo 6: Água e saneamento

Plano de amostragem para controle da qualidade bacteriológica da água em redes de distribuição

Apresentar um plano mensal de amostragem para o controle da qualidade bacteriológica, em redes de abastecimento público, a fim de manter um controle preventivo, sob vigilância permanente, da potabilidade da água, desde que entra no sistema de distribuição até as ligações domiciliares, obedecendo a Portaria 36/GM de 19 de janeiro de 1990 do Ministério da Saúde.

Exemplo 7: Indústria.

• Avaliação de processo; • Melhoria dos processos; • Controle de Qualidade

Exemplo 8: Mercado Financeiro. • Movimentação financeira;

• Cálculo do valor de risco de um ativo de carteira; • Concessão de empréstimo e crédito;

• Banco do Brasil.

Exemplo 9: Arqueologia.

• Análises arqueológicas; • Poucos dados;

(21)

Exemplo 10: Esportes. • Beisebol;

• Vôlei (Bernardinho); • Basquete;

• Futebol (Previsão de partidas);

• Atletismo (Smith & Miller, 1986, JRSS B).

Exemplo 11: Futebol.

Resultados 2003

Os gráficos abaixo mostram as chances de um time ser rebaixado com determinado número de pontos em duas rodadas distintas.

Gráficos de linhas verticais 3.5: Probabilidade de um time ser rebaixado em rodadas distintas

Os gráficos abaixo mostram as chances de um time se classificar para a Libertadores com determinado número de pontos em duas rodadas distintas.

Gráficos de linhas verticais 3.6: Probabilidade se classificar para libertadores em rodadas distintas

Exemplo 12: Política e Marketing. • Pesquisas de opinião; • Perfil dos políticos; • Indicadores de qualidade;

(22)

Exemplo 13: Biologia. • Genética; • Genoma, DNA;

• Milhões de cadeias codificadas; • Leis de Formação.

Exemplo 14: Educação.

• Avaliações educacionais; • Métodos Educacionais;

• Teoria de Resposta ao Item (TRI)

• (modelos) aplicados à avaliação do ENEM.

A seguir, será apresentado as noções de metodologia de pesquisa, para, na sequência, ser abordado o método estatístico de pesquisa.

(23)

Capítulo 4

Noções de Metodologia Científica

Temos os seguintes tipos de conhecimento: I. Conhecimento religioso;

II. Conhecimento filosófico; III. Conhecimento popular; IV. Conhecimento científico.

O conhecimento popular é transmitido de geração pra geração, baseado em imiticação e experiências pessoais.

Já o conhecimento científico é transmitido por intermédio de treinamento apropriado, sendo um conhecimento obtido de modo racional, conduzido por mio de procedimento científico. Vamos nos ater nesse tipo de conhecimento.

4.1. Natureza da ciência

A Palavra ciência pode ser entendida em duas acepções:

i. Latu sensu tem, simplesmente o significado “conhecimento”.

ii. Structo sensu não se refere a um conhecimento qualquer, mas aquele, além de aprender ou registrar fatos, os demonstra por suas causas construtivas ou determinantes.

Conceito de ciência

i. “A ciência é um conjunto de conhecimentos racionais, certos ou prováveis, obtidos metodicamente sistematizados e verificáveis, que fazem referência a objetos de uma mesma natureza.” (Ander – egg).

ii. “Acumulação de conhecimentos sistemáticos.” Para que pesquisar? Adquirir conhecimento.

As pesquisas se classificam em três categorias:

a) Pesquisas para resolver problemas: Descobrir a resposta para um problema especifico ou descrever um fenômeno da melhor forma possível.

b) Pesquisas para formular Teorias: Tentar descobrir relações entre fenômenos e o porquê da existência da relação.

c) Pesquisa para testar teorias: Similar à anterior, mas com a necessidade de se formular precisamente a teoria a ser testada.

(24)

4.2. Conceito de Método

Um método é um procedimento regular, explícito e passível de ser repetido para conseguirmos alcançar um objetivo.

4.3. Método científico

É o caminho da ciência para chegar a um objetivo. A metodologia são as regras estabelecidas para o método científico, por exemplo, observar, formular hipóteses, e elabora instrumentos de pesquisa, etc.

Elementos do método científico:

Meta: O objetivo do estudo.

Modelo: Qualquer abstração do que está sendo trabalhado ou estudado. Dados: As observações realizadas para representar a natureza do fenômeno. Avaliação: Processo de decisão sobre a validade do modelo.

Previsão: Mudanças necessárias no modelo. Exemplos:

1) Cozinhar a partir de uma receita:

Meta: Preparar um prato de comida. Modelo: A receita.

Dados: A degustação durante a preparação. Avaliação: Decisões relativas ao sabor do prato. Previsão: Mudanças na receita.

2) Escrever uma monografia:

Meta: Escrever a monografia. Modelo: Relatório Parcial.

Dados: Comentários do orientador ou outras pessoas. Avaliação: Comparação dos comentários.

Previsão: Um novo relatório.

Há vários tipos de métodos científicos, entretanto abordaremos apenas o experimental e o estatístico.

No próximo capítulo, será apresentado o método estatístico e algumas técnicas de pesquisa, bem como o planejamento e a definição de um problema de interesse.

(25)

Capítulo 5

Técnicas de Pesquisa

5.1. Métodos Experimentais e Estatísticos

Atualmente, quase todo acréscimo de conhecimento resulta do estudo. Se bem que muito desse conhecimento possa ter sido observado unicamente, por acaso, a verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos.

Relembrando: Método científico é o caminho da ciência para se chegar a um objetivo.

O método experimental consiste em manter constantes todas as causas(fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeito, caso existam.

Obs.: É o método preferido no estudo da Física e da Química, etc. Física e Química experimental.

Exemplo 1: Observar o processo de ebulição da água.

Mantém todas as outras condições (fatores) constantes pressão, umidade, temperatura ambiente. E observamos o que acontece quando, esquentamos a água.

Muitas vezes temos a necessidade de descobrir fatos em um campo em que o método experimental não se aplica( por exemplo, nas ciências sociais).

O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas a causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que inferências cabem a cada uma delas.

Exemplo 2: A determinação das causas que definem o preço de uma mercadoria.

Para aplicarmos o método experimental, teríamos de fazer variar a quantidade de mercadoria e verificar se tal fato iria influenciar seu preço. Porém, seria necessário que não houvesse alteração nos outros fatores. Assim, deveria existir no momento da pesquisa:

 Uma uniformidade dos salários;

 O gasto dos consumidores deveria permanecer constante;

 A fixação do nível geral dos preços das outras necessidades, etc. Mas controlar tudo isso é impossível (impraticável).

Por isso, lançamos mão do método científico estatístico.

Relembrando: Estatística é a ciência da coleta, organização, análise e interpretação de dados com o objetivo de conhecimento e tomada de decisão. A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva, enquanto que a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.

O aspecto essencial da Estatística é o de proporcionar métodos inferenciais, que permitam conclusões que transcendam os dados obtidos inicialmente.

(26)

Assim, a análise e a interpretação dos dados estatísticos tornam o diagnóstico de uma empresa (escola), o conhecimento de seus problemas (produtividade), a formulação de soluções apropriadas e um planejamento da ação.

Fases e métodos estatísticos

A validação da pesquisa deve passar, necessariamente pelas fases apresentadas abaixo:

1) Definição do problema :

Saber exatamente o que se pretende pesquisar. 2) Planejamento da pesquisa :

Determinar o procedimento necessário para resolver o problema, com levantar informações sobre o assunto. É importante a escolha das perguntas em um questionário que, na medida do possível, devem ser fechadas.

3) Coleta de dados :

Após cuidadoso planejamento e a devida determinação das características ao fenômeno, partimos para a coleta.

A coleta pode ser:

a) Direta : Quando é feita sobre elementos informativos de registro (nascimentos, casamentos). Quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários.

b) Indireta : Quando é inferida de elementos conhecidos e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Exemplo: Estudo sobre a aprovação dos alunos do curso de Estatística nos cursos de cálculo.

(27)

4) Crítica de dados :

Obtidos os dados, eles devem ser cuidadosamente, criticados à procurar de possíveis falhas e imperfeições em erros grosseiros ou de certo vulto, que possam inferir sensivelmente nos resultados.

Objetivo: Eliminar erros capazes de provocar futuros enganos. 5) Apuração dos dados:

Nada mais é que a soma e o processamento dos dados obtidos a a disposição mediante a critérios de classificação. Pode ser manual, eletromecânica ou eletrônica.

6) Exposição ou apresentação dos dados:

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando o mais fácil o exame daquilo que está sendo objeto de tratamento estatístico.

7) Análise dos resultados:

O objetivo último da estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou a inferência.

Essa fase consiste em tirar conclusões que auxiliem o pesquisador a resolver o seu problema, descrevendo o fenômeno através do cálculo de medidas estatísticas.

5.2. Preparação da Pesquisa

Preparação da pesquisa (Anteprojeto da pesquisa) Decisão (Definição do problema)

É a primeira etapa de uma pesquisa, o momento em que pesquisador toma a decisão de realizá-lo, no interesse próprio, de alguém ou de alguma entidade. Nem sempre é fácil determinar o que se pretende investigar, e a realização da pesquisa é ainda mais difícil, pois exige, do pesquisador dedicação, persistência, paciência e esforço contínuo.

Especificação do objetivo

Toda pesquisa deve ter um objetivo determinado pra saber o que se vai procurar. O objetivo torna explicito o problema, aumentando os conhecimentos sobre determinado assunto. Respondem às perguntas: Por quê? Para quê? Para quem?

Elaboração de um esquema

Desde que se tenha tomado a decisão de realizar uma pesquisa, deve-se pensar na elaboração de um esquema que poderá ser ou não modificado e que facilite a sua viabilidade. O esquema auxilia o pesquisador a conseguir uma abordagem mais objetiva, imprimindo uma ordem lógica ao trabalho.

Para que as fases da pesquisa se processem normalmente, tudo deve ser bem estudado, inclusive a obtenção de recursos materiais, humanos e de tempo.

(28)

Constituição da equipe de trabalho

Esse é outro aspecto importante no início da pesquisa: englobam recrutamento e treinamento de pessoas, distribuição das tarefas e todo o equipamento necessário ao pesquisador. A pesquisa pode ser realizada apenas por uma pessoa. Responde a pergunta: Quem?

Levantamento de recursos e cronograma

Quando a pesquisa é solicitada por alguém ou por uma entidade, que vai patrociná-la, o pesquisador deverá fazer uma previsão de gastos a serem feitos durante a mesma, especificando cada um deles. Seria, portanto, um orçamento aproximado do montante de recursos necessários, não podendo ser rígido. Deve haver recursos financeiros para levara a cabo este estudo, um cronograma, para executar a pesquisa em suas diferentes etapas, não poderá faltar. Responde às perguntas: Quanto? Quando?

Anteprojeto de Pesquisa

1. Definir o assunto ou tema de pesquisa. 2. Especificação de objetivos

Responde ás perguntas: Por quê? Para quê? Para quem? 3. Constituição da equipe de trabalho.

Responde à pergunta: Quem? 4. Levantamento de Recursos.

Responde a pergunta: Quanto? 5. Cronograma.

Para executar a pesquisa em suas diferentes etapas. Responde à pergunta: Quando? 6. Bibliografia básica

Material de consulta.

Exemplo:

1- Perfil dos alunos da disciplina de estatística I, 2°/2010.

2- Avaliar, descrever, conhecer o perfil dos alunos (Quem?) da Estatística. É importante para os professores e departamento (Para quem?) elaborar projetos de pesquisa e disciplinas para os mesmos, já que se conhece muito pouco sobre esses novos alunos (Por quê?).

3- Equipe de trabalho: (Quem?).

Exemplo: João, Maria, José, Joaquim e Thiago. Exemplo: Thiago. (Apenas um).

4- Custo:

(29)

5- Cronograma:

Atividades Agosto Setembro Outubro Novembro Dezembro

Def. Projeto X Elaborar Questões X X Coleta X Apuração e tabulação X Análise e interpretação X X Confecção do relatório e Apresentação X 6- Bibliografia

5.3. Elaboração do Questionário

Após da definição das hipóteses e objetivos, é necessário definir as variáveis e perguntas que comporão o questionário de forma a se obter as informações necessárias para confirmar ou refutar as hipóteses e conjecturas feitas no início do projeto.

Um questionário deve ser:

 Claro e objetivo, priorizando o entendimento das perguntas pelo entrevistado;  Simples e curto;

 Para variáveis nominais ordinais, utlize a escala Likert, isto é, utilize 5 classes;  Possuir um cabeçalho, explicando os objetivos da pesquisa e a sua importância;  Construa as perguntas pensando na codificação e tabulação dos dados, facilitnado

assim as fases de apuração e análise dos mesmos;

 Faça um pré-teste em poucos indivíduos para eliminar possíveis erros antes de entrevistar todos os indivíduos.

Exemplos de questionários:

Exemplo 1:

Questionário

O objetivo é avaliar o acesso a cultura e informação dos alunos, verificando os fatores que influenciam nesse quesito. Podendo assim, levantar idéias de acessibilidade e incentivo à cultura.

1)Qual o seu sexo?

( ) Feminino. ( ) Masculino.

2) Você está trabalhando atualmente? ( ) Sim. ( ) Não.

(30)

3) Você acha que a sua cidade incentiva a promoção de eventos culturais? ( )Sim. ( )Não.

4) Como você avalia o preço relacionado ao acesso cultural em sua cidade? ( ) Barato. ( ) Condizente. ( ) Caro.

5) Você já viajou ou viajaria para alguma realização cultural? ( ) Sim. ( )Não.

6) Sua faculdade ou sem emprego costumam promover eventos ligados à cultura? ( ) Sim. ( )Não.

7) O seu grupo de amigos participa e gosta de eventos culturais? ( )Sim. ( )Não.

8) Se houvesse mais incentivo cultural você acha que freqüentaria mais tais eventos? ( ) Sim. ( )Não.

(31)
(32)

No próximo capítulo, será apresentado os tipos de levantamento de dados, de estudos que podem ser realizados de acordo com a definição do um problema de interesse.

Capítulo 6

(33)

Se os dados não forem coletados de maneira apropriada, eles podem ser de tal modo inútil que nenhuma manipulação estatística poderá salva-los. Toda decisão tomada ou conclusão obtida usando os resultados de um estudo estatístico é tão boa ou tão confiável quanto o processo usado na obtenção dos dados.

6.1. Método de coleta de dados

Vamos estudar quatro formas de se obter conjuntos de dados:  Estudos Experimentais;

 Estudos Observacionais;  Estudo de Simulação;  Pesquisas do tipo survey.

A adoção de um método vai depender da situação em estudo e do objetivo da investigação.

Estudos Experimentais: O pesquisador aplica um tratamento a uma amostra da

população e observa as respostas de interesse. Outra amostra da população é usada com grupo de controle, no qual nenhum tratamento (ou um placebo) é aplicado. As respostas dos grupos tratamento e controle são comparados.

Exemplo:

Estudo sobre o efeito da Vitamina C na gripe.

Grupos comparados: Pessoas que recebem vitamina C (tratamento) e pessoas que recebem um placebo (controle).

O pesquisador pode alocar aleatoriamente (sortear) os participantes do estudo a um desses dois grupos (não precisa, e nem deve ser, uma decisão de cada pessoa).

Estudos Observacionais: O pesquisador observa ou mede as características de

interesse de uma amostra da população, mas não muda as condições existentes, ou seja, não há interferência do pesquisador na definição dos grupos.

Exemplos:

Estudo sobre o efeito do fumo no câncer de pulmão.

Os grupos comparados são pessoas fumantes e não-fumantes. O pesquisador não pode determinar quem vai pertencer a cada um dos grupos (é uma decisão de cada pessoa).

Estudo sobre o efeito da raça na inteligência de cães.

Os grupos comparados são cães de diferentes raças. O pesquisador não pode determinar qual cão vai pertencer a cada uma das raças (é inerente ao cão).

Estudos de simulação: Usam modelos matemáticos, físicos, etc, para reproduzir as

condições de um situação ou processo, muitas vezes com o uso de computadores.

Atados quando a reprodução da “vida real” é impraticável por ser perigosa, antiética, cara ou demorada.

Exemplos:

 Fabricantes de automóveis usam bonecos para crash tests.

 Estudos sobre a velocidade de espalhamento de vírus letais em grandes cidades.

Pesquisas do tipo survey: Investigam características de uma população a partir de

uma amostra, geralmente através de questionários preenchidos em entrevistas, por e-mail, etc.

(34)

 Uma pesquisa eleitoral para conhecer as intenções de votos pra candidatos a governador.

 Uma pesquisa de mercado sobre a preferência de marcas de sabão em pó.

Estudo Transversal: Os dados são coletados em um ponto no tempo.

Exemplo:

Um estudo sobre a presença da larva do mosquito da dengue nas residências de BH em janeiro de 2010.

Estudo longitudinal: Os dados são coletados em vários pontos no tempo.

Exemplo:

O estudo longitudinal de Saúde do Adulto (ELSA Brasil) tem o propósito de investigar a incidência e os fatores de risco para doenças crônicas, em particular, as cardiovasculares e diabetes.

Os sujeitos da pesquisa - com idade entre 35 e 74 anos – farão exames físicos/clínicos e entrevistas em vários momentos ao longo do período do estudo.

Estudo retrospectivo (ou de caso-controle): Os dados são coletados do passado,

voltando-se no tempo (registros, exames, etc).

Exemplo: Estudo sobre o efeito do fumo no câncer de pulmão.

Dois grupos são definidos: “Pessoas com câncer de pulmão”(casos) e ”pessoas sem câncer de pulmão”(controles).

Investiga-se cada pessoa “fumou” ou “não fumou” nos últimos anos. Compara-se as “proporções de fumantes” entre os “casos” e “controles”; Se a proporção de fumantes é significativamente maiôs entre os casos, conclui-se que a ocorrência de câncer de pulmão está associada ao fumo.

Estudo prospectivo (ou corte): Os dados são coletados no futuro, de grupos

(chamados de cortes) que compartilham fatores comuns e diferem apenas na variável estudada.

Exemplo: Estudo sobre o efeito do fumo no câncer de pulmão.

Dois grupos são definidos: “pessoas que fumam” (“expostos”) e “pessoas que não fumam” (“não expostos”).

As pessoas são acompanhadas durante um longo período. A o final do período, observa-se se cada pessoa “teve ou não câncer”.

Comparam-se as “proporções de doentes” entre “expostos” e não expostos:

Se a proporção de doentes é significativamente maior entre os expostos, conclui-se que a ocorrência de câncer de pulmão está associada ao fumo.

Aleatorização: Sorteio dos participantes entre os grupos comparados.

 Garantir grupos iguais em todos os fatores que afeta a resposta, exceto por aquele sendo comparado.

(35)

Fatores controlados: Idade, sexo, hábitos alimentares, etc...

Estabelecimento de Categorias

• Categoria é a classe, o grupo ou o tipo em uma série classificada.

• As perguntas ou as hipóteses da pesquisa, quando formuladas, oferecem base para o estabelecimento de determinadas regras.

Exemplo:

Categoria:

• Sexo – masculino e feminino. Classe social – classe alta, classe média e classe baixa;

• Subcategorias: Classe social – classe alta-alta, alta-média, alta-baixa; média-alta, média-média, média-baixa; baixa-alta, baixa-média, baixa-baixa.

Codificação

Codificar significa organizar os dados em classes ou categorias, atribuindo a cada categoria um item e dando a cada um deles um símbolo (número ou letra).

Sem a codificação é difícil a tabulação, e ela torna-se mais complicada se o número de casos for muito grande.

• Sexo – masculino (0) e feminino (1);

• Classe social – classe alta (A), classe média (M) e classe baixa (B).

Tabulação

A tabulação é definida como sendo “a arrumação de dados em planilhas (tabelas), de maneira a permitir a verificação das relações que eles guardam entre si”.

A tabulação pode ser: • Manual;

• Mecânica; • Eletrônica.

6.2. Conceitos básicos de Amostragem

A amostragem é o processo de retirada de uma amostra da população e é usada intuitivamente um nosso cotidiano. Por exemplo, para verificar o tempero de um alimento em preparação.

Nas pesquisas cientificas, em que se deseja conhecer algumas características de uma população, também é muito comum se observar apenas uma amostra de elementos e, a partir dos resultados dessa amostra obter valores aproximados ou estimativas, para as Características populacionais de interesse.

A seleção dos elementos que serão efetivamente observados, deve ser feito sob uma metodologia adequada, de tal forma que os resultados das amostras sejam informados para avaliar características de toda a população.

(36)

O universo ou população de uma pesquisa depende do assunto a ser investigado, e a amostra, que realmente será submetida à verificação , é obtida ou determinada por uma técnica específica de amostragem.

Há duas grandes divisões no processo de amostragem: A probabilística e não-probabilística.

i) Amostragem probabilística:

A característica primordial é poder ser submetida a tratamento estatístico. Ela se caracteriza pela aleatoriedade da seleção dos indivíduos ou elementos amostrais. A amostra é representativa da população, os resultados obtidos para a amostra podem ser estendidos para a população.

ii) Amostragem não-probabilística :

A característica principal das técnicas de amostragem não-probabilísticas é a de que, não fazendo uso de formas aleatórias de seleção, os dados não se prestam a tratamento estatístico que leva à inferência sobre a população. A amostra não é representativa e os resultados através da mesma são válidos apenas para a amostra.

Exemplo disso são os estudos de casos tão comuns em diversas áreas como geogradia e medicina e etc.

Exemplo 1: Numa pesquisa eleitoral, a três dias de uma eleição municipal, a população pode ser definida como todos os eleitores com domicílios eleitorais no município.

OBS.: Na prática, a população se restringe aos eleitores residentes no município. Os parâmetros devem ser as porcentagens de votos de cada candidato à prefeitura, no momento da pesquisa.

Razões para o uso de amostragem?

1) Economia: Em geral, torna-se bem mais econômico o levantamento de somente uma parte da população.

2) Tempo: Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros em abundância.

3) Confiabilidade dos dados: Quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas respostas.

4) Operacionalidade: É a mais fácil realizar operaões de pequena escala. Um dos problema s típicos nos grandes censos é o controle dos entrevistadores ( recenseadores).

Quando o uso de amostragem não é interessante

1) População pequena: Se a população for pequena (digamos, de 50 elementos) para tomar uma amostra capaz de gerar resultados precisos para os parâmetros da população, necessitamos de uma amostra relativamente grande.

(37)

população no próprio local de trabalho. Essa atitude pode também ser politicamente mais recomendável.

3) Necessidade de alta precisão: A cada dez anos o IBGE realiza um Censo Demográfico pra estudar diversas características da população. Dentre estas características tem-se o parâmetro número de habitantes residentes no país, que é o fundamental para o planejamento do país.

6.2.1. Métodos de Amostragem Probabilística

6.2.1.1.

Amostragem Aleatória Simples (AAS)

A amostragem aleatória simples é, do ponto de vista conceitual e computacional, o método mais direto de se amostra uma população.

Para a seleção de uma amostra aleatória simples precisamos ter uma lista completa dos elementos da população (ou unidades de amostragens apropriadas). Este tipo de amostragem consiste em selecionar a amostra através de um sorteio, sem restrição.

Propriedade: Qualquer subconjunto da população, com o mesmo número de elementos, tem a mesma probabilidade de fazer parte da amostra. Em particular, temos que cada elemento da população tem a mesma probabilidade de pertencer à amostra.

A amostragem aleatória simples pode ser feita com ou sem reposição. Na prática, a amostragem aleatória simples pode ser feita numerando-se a população de 1 a N e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, n números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra.

Exemplo 1: Com o objetivo de estudar algumas características dos alunos de Estatística I 2°/2010, vamos extrair uma amostra aleatória simples de tamanho cinco (n=5).

Na lista de presença, os alunos estão numerados de 1 a 51. Podemos fazer a amostragem de 3 maneiras:

1) Escrevemos os números de 1 a 51, em pedaços iguais de um mesmo papel, colocando-os em uma urna. Retiramos 5 papéis, um a um, sem reposição.

2) Usamos a tabela de números aleatórios, construída de modo que dez algarismos (0 a 9) são distribuídos ao acaso nas linha e colunas.

3) Usar um gerador de números aleatórios de um computador que gere números aleatórios entre 1 a 51.

6.2.1.2.

Amostragem Sistemática

Muitas vezes é possível obter uma amostra de características parecidas com a amostra aleatória simples, por um processo bem mais rápido daquele da amostra aleatória simples, que denominamos amostragem sistemática.

Exemplo 2: Se queremos tirar uma amostra de 5 alunos, dentre um população de 51 alunos, sistematicamente temos que passar pelas seguintes etapas:

i) Tenha uma lista com todos os indivíduos da população.

ii) Determinar o intervalo de amostragem pela relação N/n = 51/5 ≈ 10.

iii) Sortear um número entre 1 a N/n = 5 para iniciar o processo de amostragem. Por exemplo, o 5.

iv) A partir do elemento sorteado, tome indivíduos de N/n em N/n para fazer parte da amostra. (5, 15, 25, 35, 45).

(38)

Exemplo 3: Amostragem sistemática com a população de alunos de Estatística I 2°/2010.

N = 51, n=5, N/n = 51/5 ≈ 10.

Sorteie um número de 1 a 10. Por exemplo, 5, (5, 15, 25, 35, 45).

6.2.1.3.

Amostragem Aleatória Estratificada (AAE)

A técnica da amostragem estratificada consiste um dividir a população em subgrupos, que denominaremos de estratos. Estes estratos devem ser internamente mais homogêneos do que a população, com respeito às variáveis em estudo. Por exemplo, para estudar o interesse dos funcionários de uma empresa, em realizar um programa de treinamento (promoção), poderíamos estratificar esta população por níveis hierárquicos, ou ainda, por setores homogêneos com respeito de que está estudando. Neste contexto, um prévio conhecimento sobre a população em estudo é fundamental.

Sobre os diversos estratos da população, são realizadas seleções aleatórias, de forma independente.

A amostra completa é obtida através da agregação das amostras de cada estrato. Procedimento:

A proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da população, ele também deve corresponder a 20 % da amostra.

Dentro de cada estrato é feito um procedimento de amostragem;

Exemplo 4: Amostragem estratificada dos alunos de Estatística I 2°/2010. 2 estratos: homens e mulheres.

A proporção de mulheres e de homens é 39% e 61 %, respectivamente. N = 51, n = 5, 39% ≈ 2 mulheres, 61% ≈ homens.

Fazemos duas listas com os homens e as mulheres e retiramos 2 mulheres e 3 homens dessas listas por amostragem aleatória simples sem reposição.

6.2.2. Amostragem não-probabilística

A caracterização principal das técnicas de amostragem não-probabilista é a de não fazer uso de formas aleatórias de seleção.

6.2.2.1.

Intencional

O tipo mais comum de amostra não-probabilista é denominado intencional. Nesta, o pesquisador está interessado na opinião (ação, intenção e etc.) de determinados elementos da população, mas não representativos da mesma. Seria o caso onde se deseja saber como pensam os líderes de opinião de determinada comunidade.

O pesquisador não se dirige, portanto, à “massa”, isto é, a elementos representativos da população em geral, mas àqueles que exercem as funções de lideres de opinião na comunidade.

(39)

Técnica utilizada principalmente quando se desejam obter informações detalhadas, durante certo espaço e tempo, sobre questões particulares. A atualização mais comuns de “júris” prende-se, em geral, a estudos realizados por órgãos oficiais, principalmente sobre orçamento familiar ou audiência de programas de rádio e TV.

Funcionamento:

São selecionadas donas de casa “representativas” segundo alguns critérios como os sócios econômicos;

Pode-se que as donas de casa preencham longos relatórios de despesas, com a finalidade de descobrir como são distribuídos os gastos no que se refere ao orçamento.

Geralmente, os componentes dos “júris” recebem certa quantia como “recompensa” pelo trabalho de preencher os relatórios, mas não o suficiente para alterar de modo significativo seu padrão de vida ou influir no tipo de aquisições.

6.2.2.3.

Por Quotas

A técnica não-probabilística mais utilizada em levantamentos de mercado, prévias eleitorais e sondagem de opinião pública, é a de quotas.

A amostragem por quotas pressupões 3 etapas:

1) Classificação da população em termos de propriedades que se presume (ou se sabe) serem relevantes para a característica a estudar, para tanto, é necessário acesso a dados censitários, cadastros, listas e outras fontes de representação da população.

2) Construção de uma “maqueta” (réplica) da população a ser pesquisada, com a determinação (relativas à amostra total) da proporção da população que deve ser colocada em cada classe ou estrato (com base na sua constituição conhecida, presumida ou estimada).

3) Fixação de quotas para cada entrevistador, que terá a responsabilidade de selecionar as pessoas a serem pesquisadas, de tal modo que a amostra total venha conter a proporção de cada classe ou estrato, tal como foi fixado na segunda etapa.

Exemplo: Pesquisa de intenção de voto. Supondo que a população geral é composta de 52% de mulheres, 48% de homens; 14% entre 16 a 25 anos incompletos, 36% entre 25 e 45 anos incompletos, 36% entre 45 e 65 anos incompletos e 14% com mais de 65 anos; 10% da classe sócio-econômica A, 15% da B, 25% da C e 50% da D. Com quotas independentes, o pesquisador deverá entrevistar:

Sexo Idade Classe sócio-econômica M H 52% 48% 16 |--- 25 25 |--- 45 45 |--- 65 65 e mais 14% 36% 36% 14% A B C D 10% 15% 25% 50% Total 100% 100% 100%

Tabela 6.1: Distribuição dos aluno segundo sexo, idade e classe sócio-econêmica

OBS.: Assemelha-se muito com a técnica de amostragem estratificada (probabilística), porém na última faze a escolha do elemento é feito subjetivamente pelo entrevistador, ao invés de ser aleatório;

(40)

Há uma grande polêmica entre os institutos de pesquisa, estatísticos e pessoas que utilizam técnicas não-probabilísticas (Não há nenhum respaldo técnico para o cálculo da margem de erro e tamanho da amostra.).

A seguir, será mostrado como organizar e tabular os dados coletados de acordo com tipo de levantamento de dados estabelecido a priori.

Capítulo 7

(41)

 Cada linha contém os dados de um indivíduo;

 Cada coluna corresponde a uma das variáveis medidas.

O banco de dados tem uma estrutura mais elaborada, adequada para conjuntos de dados maiores e mais complexos.

Exemplo: Ursos Pardos.

Pesquisadores do Instituto Amigos do Urso Pardo estudam os ursos pardos selvagens que vivem em certa floresta do Canadá.

Na fase inicial do estudo, 97 ursos foram identificados.

Os dados de cada urso foram coletados através do preenchimento de uma ficha de coleta.

Fichas de coleta de dados dos ursos Planilha (parcial) do Conjunto de Dados dos Ursos

(42)

Ilustração 7.2: Banco de dados dos Ursos do Instituto

No próximo capítulo, será estudado as possíveis formas de analisar os dados coletados que já estão organizados e tabulados.

Organização do banco de dados no MINITAB e EXCEL

Nas próximas sessões serão utilizados os softwares Minitab e Excel para melhor exemplificação dos exemplos abordados. No Minitab é possível construir tabelas de frequências, fazer análises descritivas, plotagem de gráficos e muitas outras análises como inferência.

O MINITAB tem a estruturação do banco de dados semelhante a muitos outros softwares. De posse do seu banco de dados o mesmo é organizado da seguinte forma:

• As linhas representam os indivíduos ou observações do banco de dados.

• As colunas representam as variáveis referentes aos indivíduos ou observações.

(43)
(44)

Capítulo 8

Análise dos Dados: Tabelas e Gráficos

É muito importante saber o tipo da variável que se prentende estudar, pois ele nos indica o tipo de tabela e gráfico mais adequado para a análise da variável.

8.1. Tabelas

TABELAS

Para a normalização das tabelas, a ABNT recomenda o uso da Norma Tabular do IBGE (1993).

• As tabelas apresentam informações tratadas estatisticamente.

• Seu conteúdo interno deve ser apresentado em fonte Arial, tamanho 10 e espaçamento simples de entrelinhas.

• Devem ser alinhadas preferencialmente às margens laterais do texto e, quando pequenas, centralizadas na página.

Na parte superior da tabela deve constar:

• A palavra Tabela, alinhada à lateral esquerda desta, sucedida do número que a identifica, em algarismos arábicos, conforme a ordem em que aparece no texto;

• O título, escrito preferencialmente com a primeira letra em maiúscula, respeitando nomes próprios e siglas, precedido por um hífen, sem ponto final.

• Devem ser apresentados em fonte Arial, tamanho 12 e espacejamento simples de entrelinhas.

Exemplo:

Tabela 1 - Atitudes perante os direitos civis, de acordo com a classe social Na parte inferior da tabela deve constar:

• A fonte de onde foram extraídos os dados, precedida da palavra Fonte (quando retirada de local impresso). É importante lembrar que nem sempre terá fonte, pois os dados primários são coletados pelo autor do trabalho;

• Opcionalmente, esclarecimentos e observações de natureza geral, precedidos da palavra Nota.

(45)

Exemplo completo de Tabela:

QUADROS

• Seguem as mesmas regras das tabelas.

8.2. Gráficos

As ilustrações são apresentadas no texto na forma de desenhos, esquemas, fluxogramas, fotografias, gráficos, mapas, organogramas, plantas, retratos etc.

• Sua identificação deve aparecer na parte inferior, em fonte Arial, tamanho 10, espaçamento simples de entrelinhas, seguida de seu número de ordem de ocorrência no texto, em algarismos arábicos, precedida da palavra Figura e o mais próximo possível do texto a que se refere.

• Abaixo da identificação, informam-se os dados abreviados (autor, data e paginação) de onde foram extraídos, quando de fonte publicada anteriormente (não se deve esquecer de acrescentar os dados completos da obra na seção REFERÊNCIAS).

(46)

• Quando houver um grande número de figuras distintas (superior a cinco elementos), recomenda-se o uso da terminologia própria para cada tipo (figuras, lâminas, plantas, fotografias, gráficos e outros), conforme os exemplos abaixo.

Referências

Documentos relacionados

Quanto ao tratamento periodontal em pacientes com coagulopatas hereditárias, é correto afirmar: a Polimentos coronarianos devem ser realizados de maneira esporádica, pois

APRENDIZAGEM ATIVA NA EDUCAÇÃO INFANTIL: TRANSFORMANDO A SALA DE AULA EM UM ESPAÇO DE CRIATIVIDADE Eloá Fernanda de Freitas1* Elizabeth Ramalho Soares Bastos2** Resumo: Este artigo

Através das observações realizadas em campo, buscamos enfatizar de forma simples a perspectiva dos conselhos escolares como peça essencial para o desenvolvimento do trabalho

Embora o momento ideal para obtenção de sementes de alta qualidade, seja logo após a maturidade fisiológica, a alta umidade da semente e da própria planta, associada ao

À Deus pelo dom da vida, pela fé e perseverança para vencer os obstáculos. A minha mãe, pela orientação, dedicação e incentivo nessa fase do curso de pós-graduação e

Traçar um perfil das mulheres trabalhadoras não trata apenas de definir características dessas mulheres, mas também de compará-las aos homens trabalhadores, para

Trabalhar com as diferenças, com a diversidade, com o “novo” não é uma tarefa, e somos conscientes, principalmente de que não é apenas o professor que irá conseguir abolir

Após a colheita, normalmente é necessário aguar- dar alguns dias, cerca de 10 a 15 dias dependendo da cultivar e das condições meteorológicas, para que a pele dos tubérculos continue