APOSTILA DE
ESTATÍSTICA
Aluno: ______________________________________
Se todos nós temos perguntas/problemas e buscamos alternativas para os mesmos e, se a pesquisa nos leva a desenvolver o conhecimento, criar alternativas para problemas e a descobrir novos horizontes, então todos podemos ser
pesquisadores.
Geralmente, quando ouvimos falar em pesquisa, nos reportamos a laboratórios cheios de aparelhos sofisticados, tubos de ensaio, produtos químicos etc, ou então a números, dados, porcentagem, ou ainda, a pessoas importantes, cientistas, doutores, professores e outros.
No entanto, a pesquisa não tem endereço certo, quer dizer, não é só em laboratórios que ela se encontra. A pesquisa está próxima de nós, ela faz parte do nosso dia-a-dia. Para pesquisar é necessário, em primeiro lugar, ter um problema ou uma pergunta a resolver. Ou seja, quando nos dispomos conscientemente a resolver um problema, estamos dando início a uma pesquisa.
Passos para a pesquisa
Para realizar uma pesquisa não há uma receita pronta para seguir. Há, no entanto, alguns elementos importantes a observar, dos quais destacamos:
Problema: Na vida, no dia-a-dia, nos deparamos com vários problemas, somos desafiados sempre a tomar decisões e definir rumos. Por exemplo, se estamos desempregados, vamos fazer o levantamento de quais são as qualificações, capacidades, habilidades que possuímos e onde podemos ir buscar trabalho dentro dessas condições. Mas buscamos também saber por que estamos desempregados, se este é um problema que apenas nós estamos enfrentando ou se mais pessoas estão nesta situação. A partir disto, levantamos várias hipóteses, respostas, alternativas para resolver nosso problema.
Temos que ter presente que problema na pesquisa não se refere a uma coisa negativa e sim a algo que nos ajuda a construir e encontrar saídas.
A forma de levantar um problema, de fazer a pergunta, define de certa maneira a perspectiva que daremos à pesquisa. Por isso é importante saber fazer as perguntas, ver quem faz as perguntas e para quem e por que estas perguntas/problemas são considerados importantes. Ou seja, quais são os objetivos que pretendemos atingir com a pesquisa.
Hipóteses: São as várias possibilidades de solução que levantamos para responder o problema, ou seja, são respostas antecipadas que imaginamos a partir do conhecimento que já possuímos acerca do objeto a ser investigado. No entanto precisamos comprovar ou refutar nossas hipóteses para ter um resultado da pesquisa, pois
não podemos ficar no “achismo”, em opiniões, precisamos ter bases concretas, “provas” para realizar nossas pesquisas. Para tanto, precisamos buscar dados, o que implica em ver onde podemos buscá-los, o que precisamos para comprovar nossas hipóteses e qual será o método que vamos usar. Podemos buscar dados, respostas para nossas pesquisas em vários lugares: em livros, revistas, jornais(dados bibliográficos); em arquivos; em fotografias, objetos, ou junto às pessoas, através de entrevistas, questionários etc. Ou seja, às vezes as respostas podem estar onde menos esperamos.
Podemos, por exemplo, chegar ao término da pesquisa e concluir que as hipóteses que levantamos no início da pesquisa não eram verdadeiras. Isso não quer dizer que a pesquisa não tenha sido válida, ao contrário, ela pode nos mostrar justamente por onde não devemos andar, ou ainda, nos mostrar caminhos que antes não havíamos pensado em seguir.
Por que é importante pesquisar?
Quando realizamos qualquer pesquisa, precisamos sempre ter presente por que vamos fazê-la, em que ela vai contribuir para melhorar a vida das pessoas na sociedade.
A pesquisa, antes de tudo, gera conhecimento, pois leva-nos a refletir, pensar, ler, escrever e descobrir novos horizontes. É importante que tornemos públicos os resultados aos quais chegamos, pois se guardamos o conhecimento adquirido para nós, ele não terá importância nenhuma para a sociedade.
A pesquisa nos possibilita também a olhar de forma crítica a realidade, na medida em que ela nos instiga à busca do novo, para a formulação de novas perguntas e para a produção própria e criativa do conhecimento.
Poderíamos iniciar a pesquisa nas escolas e também fora dela, para torná-la mais presente em nossa vida. No entanto, a proposta da pesquisa quebra com a lógica pedagógica de muitas escolas, que se preocupam somente em dar respostas aos alunos. Pois, a pesquisa preocupa-se em fazer perguntas e levar os próprios alunos a buscar soluções, instigando sua criatividade que leva a questionar aquilo que muitos não querem que seja questionado.
* Cristiane Sander, licenciada em história-UNIJUÍ, mestranda em Serviço Social-PUCRS. Abril/2000
3
Introdução
A história da teoria das probabilidades teve início com os jogos de cartas, dados e de roleta.
Esse é o motivo da grande existência de exemplos de jogos de azar no estudo da probabilidade. A teoria da probabilidade permite que se calcule a chance de ocorrência de um número em um experimento aleatório. A estatística surgiu muito antes da probabilidade e tratava principalmente da coleta, organização e apresentação de dados por meio de tabelas e cartas. Com o advento da probabilidade, foi constatado que a estatística poderia ser utilizada para extrair conclusões válidas e tomar decisões razoáveis com base na análise de dados, como em teoria da amostragem e previsões.
Experimento Aleatório
É aquele experimento que quando repetido em iguais condições, podem fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. Quando se fala de tempo e possibilidades
de ganho na loteria, a abordagem envolve cálculo de experimento aleatório Exemplos : - Retirar uma carta de um baralho com 52 cartas e observar seu naipe, sua cor ou seu
número / letra.
- Jogar uma moeda 50 vezes e observar o número de caras ou coroas obtidas - Retirar com ou sem reposição, bolas de uma caixa que contenha determinadas quantidades de bolas pretas e brancas - Arremessar um dado e observar o número da face de cima.
Espaço Amostral
É o conjunto de todos os resultados possíveis de um experimento aleatório. A letra que representa o espaço amostral, é S.
Exemplo: Lançando uma moeda e um dado, simultaneamente, sendo S o espaço amostral, constituído pelos 12 elementos: S = {K1, K2, K3, K4, K5, K6, R1, R2, R3, R4, R5, R6}
1. Escreva explicitamente os seguintes eventos: A = {caras e um número par aparece}, B = {um número primo aparece}, C = {coroas e um número ímpar aparecem}.
2. Idem, o evento em que:
a) A ou B ocorrem;
b) B e C ocorrem;
c) Somente B ocorre.
3. Quais dos eventos A, B e C são mutuamente exclusivos
Resolução:
1. Para obter A, escolhemos os elementos de S constituídos de um K e um número par:
A={K2, K4, K6};
Para obter B, escolhemos os pontos de S constituídos de números primos:
B={K2,K3,K5,R2,R3,R5}
Para obter C, escolhemos os pontos de S constituídos de um R e um número ímpar:
C={R1,R3,R5}.
2. (a) A ou B = AUB = {K2,K4,K6,K3,K5,R2,R3,R5}
(b) B e C = B ∩ C = {R3,R5}
(c) Escolhemos os elementos de B que não estão em A ou C;
B ∩ Ac ∩ Cc = {K3,K5,R2}
3. A e C são mutuamente exclusivos, porque A ∩ C = ∅
Conceito de probabilidade
Se num fenômeno aleatório as possibilidades são igualmente prováveis, então a probabilidade de ocorrer um evento A é:
Por, exemplo, no lançamento de um dado, um número par pode ocorrer de 3 maneiras diferentes dentre 6 igualmente prováveis, portanto, P = 3/6= 1/2 = 50% Dizemos que um espaço amostral S (finito) é equiprovável quando seus eventos elementares têm probabilidades iguais de ocorrência. Num espaço amostral equiprovável S (finito), a probabilidade de ocorrência de um evento A é sempre:
Propriedades Importantes:
1. Se A e A’ são eventos complementares, então:
P( A ) + P( A' ) = 1
2. A probabilidade de um evento é sempre um número entre ∅ (probabilidade de evento impossível) e 1 (probabilidade do evento certo).
5
Probabilidade Condicional
Antes da realização de um experimento, é necessário que já tenha alguma informação sobre o evento que se deseja observar. Nesse caso, o espaço amostral se modifica e o evento tem a sua probabilidade de ocorrência alterada.
Exemplo: Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se ocorrer um sorteio de 2 bolas, uma de cada vez e sem reposição, qual será a probabilidade de a primeira ser vermelha e a segunda ser azul?
Resolução:
Seja o espaço amostral S=30 bolas, bolinhas e considerarmos os seguintes eventos:
A: vermelha na primeira retirada e P(A) = 10/30 B: azul na segunda retirada e P(B) = 20/29 Assim: P(A e B) = P(A).(B/A) = 10/30.20/29 = 20/87
Eventos independentes
Dizemos que E1 e E2 e ...En-1, En são eventos independentes quando a probabilidade de ocorrer um deles não depende do fato de os outros terem ou não terem ocorrido.
Exemplo:Uma caixa tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se sortearmos 2 bolas, 1 de cada vez e respondo a sorteada na urna, qual será a probabilidade de a primeira ser vermelha e a segunda ser azul?
Resolução:
Como os eventos são independentes, a probabilidade de sair vermelha na primeira retirada e azul na segunda retirada é igual ao produto das probabilidades de cada condição, ou seja, P(A e B) = P(A).P(B). Ora, a probabilidade de sair vermelha na primeira retirada é 10/30 e a de sair azul na segunda retirada 20/30. Daí, usando a regra do produto, temos: 10/30.20/30=2/9. Observe que na segunda retirada foram consideradas todas as bolas, pois houve reposição. Assim, P(B/A) =P(B), porque o fato de sair bola vermelha na primeira retirada não influenciou a segunda retirada, já que ela foi reposta na urna.
Probabilidade de ocorrer a união de eventos
Exemplo: Se dois dados, azul e branco, forem lançados, qual a probabilidade de sair 5 no azul e 3 no branco?
Considerando os eventos:
A: Tirar 5 no dado azul e P(A) = 1/6 B: Tirar 3 no dado branco e P(B) = 1/6 Sendo S o espaço amostral de todos os possíveis resultados, temos:
n(S) = 6.6 = 36 possibilidades. Daí, temos:P(A ou B) = 1/6 + 1/6 – 1/36 = 11/36
Exemplo: Se retirarmos aleatoriamente uma carta de baralho com 52 cartas, qual a probabilidade de ser um 8 ou um Rei?
Sendo S o espaço amostral de todos os resultados possíveis, temos: n(S) = 52 cartas.
Considere os eventos:
A: sair 8 e P(A) = 4/52
B: sair um rei e P(B) = 4/52 Assim, P(A ou B) = 4/52 + 4/52 – 0 = 8/52 = 2/13. Note que P(A e B) = 0, pois uma carta não pode ser 8 e rei ao mesmo tempo. Quando isso ocorre dizemos que os eventos A e B são mutuamente exclusivos.
Porque a estatística é importante?
Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já que eles nos capacitam a responder a um vasto número de questões, tais como:
1) Como os cientistas avaliam a validade de novas teorias?
2) Como os pesquisadores médicos testam a eficiência de novas drogas?
3) Como os demógrafos prevêem o tamanho da população do mundo em qualquer tempo futuro?
4) Como pode um economista verificar se a mudança atual no Índice de Preços ao Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio aleatório?
5) Como é possível para alguém predizer o resultado de uma eleição entrevistando apenas algumas centenas de eleitores?
Estes são poucos exemplos nos quais a aplicação da estatística é necessária. Por isso, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou tiram conclusões a partir destes.
Definição de Estatística
“Estatística” é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados. Ela é dividida em:
Estatística Descritiva: parte da Estatística que apenas coleta, descreve, organiza e apresenta os dados. Nela não são tiradas conclusões.
Estatística Indutiva ou Inferência: analisa os dados e obtêm-se as conclusões.
Estatística Descritiva
Fases do Método Estatístico
Coleta de Dados
Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades, custos envolvidos; exame das informações disponíveis; delineamento da amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado.
A coleta de dados pode ser direta ou indireta.
Coleta de
dados Crítica dos
dados Apresentação
dos dados
Tabelas Gráficos
Análises
7
- coleta direta: quando os dados são obtidos na fonte originária. Os valores assim compilados são chamados de dados primários, como, por exemplo, nascimentos, casamentos e óbitos, registrados no Cartório de Registro Civil; opiniões obtidas em pesquisas de opinião pública; ou ainda, quando os dados são coletados pelo próprio pesquisador.
A coleta direta pode ser classificada relativamente ao fator tempo em:
• contínua – quando feita continuamente, como por exemplo, nascimentos e óbitos, freqüência dos alunos às aulas;
• periódica – quando feita em intervalos constantes de tempo, como os censos (de 10 em 10 anos);
• ocasional – quando feita sem época preestabelecida.
- coleta indireta: quando os dados obtidos provêm da coleta direta. Os valores assim compilados são denominados de dados secundários, como, por exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas demográficas publicadas pela Fundação Instituto Brasileiro de Geografia e Estatística, se constitui em uma coleta indireta.
Crítica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, eliminando os erros capazes de provocar futuros enganos de apresentação e análise.
Apresentação dos Dados
Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado.
Características Importantes dos Dados
1- A natureza ou forma de distribuição dos dados como forma de sino, uniforme ou assimétrica.
2- Um valor representativo como uma média 3- Uma medida de dispersão ou variação.
Podemos conhecer alguma coisa da natureza ou forma da distribuição organizando os dados e construindo gráficos.
Estatística Descritiva: Tabelas, Séries Estatísticas e Gráficos Estatísticos
Tabelas
Tabela é um quadro que resume um conjunto de observações.
Ela é composta de:
- título: conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?
(referente ao fato), Quando? (relativo ao lugar), Onde? (correspondente à época);
- corpo: conjunto de linhas e colunas que contém informações sobre a variável em estudo;
- cabeçalho: parte superior da tabela que especifica o conteúdo das colunas;
- rodapé: reservado pare as observações pertinentes, bem como a identificação da fonte dos dados .
Séries Estatísticas
É toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.
Conforme o critério de agrupamento as séries classificam-se em
:
a) Série Cronológica, Temporal, Evolutiva ou Histórica: É a série estatística em que os dados são observados segundo a época de ocorrência. Exemplo:
Vendas da Companhia Alfa - 1990-1994 Ano Vendas (em R$ 1.000,00) 1990 2.181
1991 3.948 1992 5.642 1993 7.550
1994 10.009
Fonte: Departamento de Marketing da Companhia Alfa.
b) Série Geográfica ou de Localização: É a série estatística em que os dados são observados segundo a localidade de ocorrência. Exemplo:
INAMPS - Empresas fiscalizadas em 1998
Regiões Empresas fiscalizadas
Norte 7.495 Nordeste 107.783
Sudeste 281.207
Sul 53.661 Centro-Oeste 15.776 Fonte: Mensário Estatístico do IBGE
c) Série Específica: É a série estatística em que os dados são agrupados segundo a modalidade de ocorrência. Exemplo:
Matriculas no Ensino de Terceiro Grau Brasil—1995 (ciclo básico)
Áreas de ensino Matrículas Ciências Biológicas 62.109 Ciências Exatas e Tecnologia 95.949 Ciências Agrárias 32.419
Ciências Humanas 178.842
Letras 39.883
Artes 37.464
9
Duas ou mais áreas 46.323 Fonte: Serviço de Estatística do Ministério da Educação e Cultura.
d) Distribuição de Freqüências. É a série estatística em que os dados são agrupados com suas respectivas freqüências. Será vista com mais detalhes a seguir. Exemplo:
Número de Acidentes por Dia na Rodovia X em Janeiro de 2003
Número de acidentes por dia Número de dias
0 10
1 7
2 4
3 5
4 3
5 2 Fonte: DNER.
Gráficos Estatísticos
A representação gráfica das séries estatísticas tem por finalidade dar uma idéia, a mais imediata possível, dos resultados obtidos, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Não há apenas uma maneira de representar graficamente uma série estatística. A escolha do gráfico mais apropriado ficará a critério do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados quando da elaboração de um gráfico.
Os principais tipos de gráficos.
a) Gráfico em Colunas
População Gráfico em Colunas
Ano
População do Brasil (milhões)
0 10 20 30 40 50 60 70 80 90 100
1940 1950 1960 1970
População Brasileira 1940 – 1970
Ano População 1940 41 236 315 1950 51 944 397 1960 70 119 071 1970 93 139 037 Fonte: Anuário Estatístico
- 1974 -
b) Gráfico em Barras: É semelhante ao gráfico em colunas, porém os retângulos são dispostos horizontalmente. Eis a configuração do mesmo gráfico anterior:
Esses dois tipos de gráficos são geralmente utilizados para comparar diferentes variáveis ou diferentes valores da mesma variável.
b) Gráficos em Setores: É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado principalmente quando se pretende comparar cada valor da série com o total. Para construí-lo, divide-se o círculo em setores, cujas áreas serão proporcionais aos valores da série. Essa divisão poderá ser obtida pela solução da regra de três.
Total _____ 360 o Parte _____ x o
População Gráfico em Barras
População do Brasil (milhões)
Ano
1940 1950 1960 1970
0 10 20 30 40 50 60 70 80 90 100
Gráfico em Setores
RECEITA DO MUNICÍPIO X DE 1996 a 1998 (milhões) (1996), 90,0
(1998), 150,0
(1997), 120,0