• Nenhum resultado encontrado

ApostEst Lia

N/A
N/A
Protected

Academic year: 2021

Share "ApostEst Lia"

Copied!
27
0
0

Texto

(1)

ESTATÍSTICA

Notas de Aulas

(2)

Sumário

1-INTRODUÇÃO ... 3

2- CONCEITOS BÁSICOS ... 4

3-SOBRE O EXCEL ... 6

4-FORMATANDO A TABELA ... 8

4.1 - Cálculos para a construção da distribuição de frequência ... 8

4.2 – Histograma ... 15

4.3 – Polígono de frequência ... 18

5-REGRESSÃO LINEAR SIMPLES ... 20

5.1 - Cálculo do r (Coeficiente de correlação de Pearson) ... 21

5.2 - Gráfico de Dispersão ... 22

5.3 - Entrar com as informações de X (variável independente) e Y (variável dependente) e selecionar os campos marcados ... 24

5.4 - Resultados ... 25

(3)

1- INTRODUÇÃO

A importância da Estatística

Os métodos estatísticos são usados hoje em quase todos os campos de investigação científica, já que eles nos capacitam a responder a um vasto número de questões, tais como as listadas abaixo:

1) como os cientistas avaliam a validade de novas teorias?

2) como os pesquisadores médicos testam a eficiência de novas drogas? 3) como os demógrafos preveem o tamanho da população do mundo em qualquer tempo futuro?

4) como pode um economista verificar se a mudança atual no Índice de Preços ao Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio aleatório?

5) como é possível para alguém predizer o resultado de uma eleição entrevistando apenas algumas centenas de eleitores?

Estes são poucos exemplos nos quais a aplicação da estatística é necessária. Podemos presumir que a matemática é uma das rainhas das ciências porque ela fornece a estrutura teórica para quase todas as outras ciências. Se você já fez um curso básico de física, já está familiarizado com algumas das leis matemáticas que governam temas tão diversificados como gravidade, energia, luz, eletricidade, etc. Mas também devemos considerar o fato de que as teorias matemáticas estão sendo desenvolvidas todos os dias

em muitas áreas por estatísticos teóricos - pessoas treinadas em teoria estatística e probabilidade. Para citar alguns poucos casos ilustrativos elas são desenvolvidas para teoria dos voos espaciais em física; para teorias do conhecimento do comportamento animal e humano em psicologia; para teorias da migração e dos diferenciais de raça em sociologia; para teorias de epidemias em saúde pública;

De fato, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de profissionais que entram em contato com dados quantitativos ou tiram conclusões a partir destes.

(4)

2-CONCEITOS BÁSICOS

O que é Estatística?

A Estatística compreende os métodos científicos utilizados para coleta, organização, resumo, apresentação e análise, ou descrição, de dados de observação. Também abrange métodos utilizados para tomadas de decisões sob condições de incerteza.

Estatística Descritiva

Inclui as técnicas empregadas para coleta e descrição de dados. Também é empregada na análise exploratória de dados.

Estatística Inferencial

É utilizada para tomar decisões a respeito de uma população, geralmente utilizando dados de amostras. Uma vez que tais decisões são tomadas sob condições de incerteza, faz-se necessário o uso de conceitos relativos à Teoria da Probabilidade.

População

Um dos conceitos fundamentais na Estatística, é empregado para designar um conjunto de indivíduos que possuem pelo menos uma característica, ou atributo, em comum. Alguns autores empregam o termo universo para referir-se a uma população.

Amostra

Refere-se a qualquer subconjunto de uma população. A amostragem é uma das etapas mais importantes na aplicação de métodos estatísticos, envolvendo aspectos como determinação do tamanho da amostra, metodologia de formação e representatividade da amostra com relação à população.

Variável

É usada para atribuição dos valores correspondentes aos dados observados. É importante ressaltar que os dados em questão não são necessariamente numéricos, uma vez que podem dizer respeito a atributos qualitativos observados na população. Por esta razão costuma-se classificar as variáveis nas categorias definidas a seguir.

Variável Numérica. Também chamada variável quantitativa, é utilizada para

representação de dados numéricos, ou quantitativos.

Variável Numérica Discreta. Variável cujo domínio é um conjunto enumerável.

Geralmente corresponde a dados de contagem. Exemplo: Número de defeitos em um componente, total de unidades defeituosas em uma amostra.

Variável Numérica Contínua. Variável cujo domínio é um conjunto não enumerável.

Refere-se a dados de mensuração. Exemplo: Diâmetro de um eixo, peso de um recém-nascido.

(5)

Variável Qualitativa. É utilizada para representação de atributos. Pode ser dicotômica,

ou binária, quando assume apenas dois possíveis valores, ou politômica, também referida como multinomial, quando pode assumir mais de dois possíveis valores.

(6)

3-SOBRE O EXCEL

O Excel é um aplicativo Windows que fornece ferramentas para organizar, analisar e interpretar dados. Este programa dispõe de três funções principais:

Planilhas: A planilha eletrônica é organizada em linhas numeradas e

colunas identificáveis por letras (A, B, C, ...) onde é possível identificar facilmente

cada uma de suas células. A figura abaixo ilustra o exemplo de umaempresa de

aviação que recebeu em determinado período algumas reclamações de passageiros

Bancos de dados: A planilha eletrônica pode ser usada para armazenar

dados. O Excel dispõe funções de banco de dados que permite: consultar, buscar, ordenar, filtrar, calcular estatísticas e administrar facilmente uma grande quantidade de dados utilizando operações de bancos de dados padronizadas

(7)

Gráficos: A função de gráficos permite a representação gráfica dos dados disponível na planilha. A figura abaixo ilustra o exemplo de vendas de veículos motorizados no ano de 2016 pela empresa XX.

Veículos freq. Carros 18440 Caminhões 13778 Motocicletas 4553 Outros 823 49% 37% 12% 2%

Vendas de veículos motorizados em

2016, empresa XX

Carros Caminhões Motocicletas Outros

(8)

4-FORMATANDO A TABELA

A análise estatística se inicia quando um conjunto de dados se torna disponível de acordo com a definição do problema da pesquisa. Um conjunto de dados seja de uma população ou de uma amostra contém muitas vezes um número muito grande de valores. Além disso, esses valores, na sua forma bruta, encontram-se muito desorganizados. Eles variam de um valor para outro sem qualquer ordem ou padrão. Os dados precisam então ser organizados e apresentados em uma forma sistemática e sequencial por meio de uma tabela ou gráfico. Quando fazemos isso, as propriedades dos dados tornam-se mais aparentes e tornamo-nos capazes de determinar os métodos estatísticos mais apropriados para serem aplicados no seu estudo.

Suponhamos o seguinte conjunto de dados:

Ex1: Em um exame vestibular foram cronometrados os tempos, em minutos, gastos por 50 alunos para entregar a prova, conforme os dados abaixo:

Rol – Os dados são colocados em ordem crescente.

Digitar todos os números em uma única coluna → Selecionar a coluna, na barra de ferramentas, clique na página inicial, em seguida em Classificar e filtrar e depois classificar do menor para o maior.

(9)

Amplitude Total (R)

É a diferença entre o valor máximo e o valor mínimo observados no conjunto de dados, isto é:

𝑅 = 𝑥

𝑚á𝑥

− 𝑥

𝑚𝑖𝑛

Exemplo – Para o conjunto de dados do exemplo anterior a amplitude total é

Resultando,

Escolher uma célula e digitar, R=, na célula à direita clicar = A50-A1, enter (obs: qualquer cálculo que você queira que o excel faça, fazer sempre os seguintes passos, escolher uma célula e digitar = e a conta desejada).

Número de Classes (k)

Regra da raiz quadrada:

𝑘 = √𝑛, onde n é o número de elementos da amostra.

(10)

Como temos 50 números na amostra, basta digitar 50 e ok.

Resultando...

Amplitude (largura) da classe – h

ℎ =𝑅

(11)

Arredonde convenientemente.

Distribuição de Frequência

Distribuição de frequência para o tempo de entrega da prova em um exame vestibular (em minutos)

Classe Frequência (fi) Frequência acumul.(fa) Frequência relativa (fr) fr % Ponto Médio (xi) 41├ 45 3 3 0,06 6% 43 45├ 49 6 9 0,12 12% 47 49├ 53 9 18 0,18 18% 51 53├ 57 16 34 0,32 32% 55 57├ 61 5 39 0,1 10% 59 61├ 65 7 46 0,14 14% 63 65├ 69 3 49 0,06 6% 67 69├ 73 1 50 0,02 2% 71 ∑ 𝒇𝒊= 𝟓𝟎 100%

Obs: Classe = tempo (minutos);

Frequência = número de alunos;

Frequência relativa = porção de alunos.

Reproduzindo esta tabela no excel...

O excel não entende 41├ 45, então vamos substituir este intervalo pelo número

anterior ao limite superior, 44,9. Na primeira classe será 44,9, a segunda classe será 44,9+4, para as próximas classes basta clicar na segunda classe, aparecerá uma cruzinha preta, arrastar e o excel fará as mesmas contas, ou seja, 48,9+4 para a próxima classe e assim sucessivamente.

(12)

Deixe o excel construir a frequência

Com a região A6:A13 selecionada, clique em = → fx→ Estatística → frequência→

Ok

Com a tecla Ctrl e a tecla Shift selecionada, para a Matriz_dados selecione todos os números ordenados e para a Matriz_bin selecione os números da Classe e clique ok, agora as teclas Ctrl e Shift podem ser soltas, pronto, o excel calculou todas as frequências.

(13)

Cálculo da frequência acumulada

Primeira frequência acumulada é igual a primeira frequência simples.

Segunda linha da frequência acumulada é igual a segunda linha da fi + a primeira

linha da fa, a partir da terceira linha arrastar e o excel fará tudo sozinho o restante.

Cálculo da frequência relativa ou percentual (fr)

Primeira linha da frequência relativa = (primeira linha da fi )/ ∑fi (para a célula do

∑fi, no nosso exemplo, a célula D14, clicar em F4, desta forma, ela será fixada),

clicar em ok, arrasta e o excel fará para todas as células subsequentes os mesmos cálculos.

(14)

Cálculo do fr(%)

Copiar a coluna do fr e clicar em %, toda a coluna será multiplicada por 100.

Cálculo do ponto médio (xi)

Primeira linha do xi é a média aritmética entre Li e Ls da mesma classe, onde Li

é o limite superior e Ls é o limite superior, para o nosso exemplo,

(15)

Segunda linha do xi= primeira linha do xi+ o valor de h.

Para as linhas subsequentes, arrastar e o excel fará todos os cálculos.

Resultando...

A opção do Histograma pela ferramenta Análise de Dados pode ser utilizada para obter uma distribuição de frequência bem como os gráficos tais como um histograma e um polígono de frequência de percentagem acumulada. Para utilizar a opção Histograma da ferramenta Análise de Dados, os limites de classes superiores dos intervalos de classe devem ser inseridos na planilha que contém os dados a serem analisados.

(16)

Se não tiver instalado Análise de dados no excel:

Selecione arquivo → Opções → Suplementos → Ir → Ferramentas de Análise e Ferramentas de Análise – VBA → ok

Se tiver instalado Análise de dados no excel:

1- Selecione Dados → Análise de dados → Histograma → ok

2- Na área de entrada da caixa de diálogo Histograma, insira o intervalo de da dos $A$1:$A$50 na caixa de edição Intervalo de entrada. Insira o intervalo de dados $C$6:$C$13 na caixa de edição Intervalo do bloco. 3- Na área de Opções de Saída da caixa de diálogo, clique no botão Nova

Planilha e insira Histograma como o nome da nova planilha na caixa de edição à direita deste botão. Selecione as caixas de verificação Percentagem Cumulativa e Resultado do Gráfico. Clique no botão ok.

(17)

O excel irá gerar ambas as distribuições de frequências e de porcentagem acumulada e sobrepor o polígono de percentagem ao histograma. Se fosse desejado somente um histograma, a caixa de verificação Percentagem Cumulativa não seria selecionada na etapa 3.

Observe que este gráfico contém dois erros. Existem gaps (lacunas) entre as barras que correspondem aos intervalos de classe, e existe uma classe adicional , denominada Mais pelo excel. Para eliminar as falhas, precisamos fazer o seguinte:

1- Dê um clique duplo sobre uma barra do gráfico. Isto fará aparecer a caixa de diálogo Formatar Séries de Dados, Opções de Série.

2- Na caixa de edição Largura de Espaçamento, modifique o valor para zero. Clique no botão Ok. O Histograma agora possui barras contínuas.

Para remover a classe adicional, precisamos fazer o seguinte:

1- Primeiro selecione uma célula fora do gráfico. A seguir, clique em uma das barras exibidas no histograma. Um segundo conjunto de pontos de dados fora aparece sobreposto às barras junto com a fórmula que começa com a palavra Série na caixa de edição acima das planilhas de trabalho, na barra de fórmulas.

2- Na barra de fórmulas, modifique a célula final de $B$10 para $B$9 e tecle Enter.

3- Em seguida, clique em um dos pontos de dados do gráfico Percentagens Acumuladas. Modifique a célula final na barra de fórmulas de $C$10 para $C$9 e tecle Enter. Nosso gráfico tem agora o número apropriado de classe.

Para modificar o nome do eixo X, primeiramente selecione uma célula fora da caixa de gráficos e, com o mouse diretamente sobre o rótulo atual do eixo X (bloco), clique o mouse. Uma borda aureolada aparece em volta da palavra Bloco. Clique dentro da borda aureolada e substitua o

(18)

título Bloco por Tempo (minutos). Fazer o mesmo procedimento para trocar o título do gráfico.

Para optar por tipo de gráficos, clique na parte branca, aparecerá três botões, no botão do meio teremos oito tipos de gráficos a escolher.

Observe que o polígono é a representação do formato da distribuição em questão. Uma vez que a área sob a distribuição da percentagem deve ser de 100%, é necessário ligar o primeiro e o último pontos médios com o eixo horizontal de modo a cercar a área da distribuição observada. Isto é alcançado ligando-se o primeiro ponto médio observado com o ponto médio de uma classe “antecedente fictícia” (isto é, 39) que tenha 0% de observações e ligando-se o

último ponto médio observado com o ponto médio de uma classe “fictícia

sucedente” (isto é, 75) que tenha 0% de observações.

(19)

Para obter um polígono de frequência por meio do Assistente de Gráfico, faça o seguinte:

1- Selecione todas as frequências → Inserir Gráficos→ gráfico de linhas. 2- Clicar na parte branca do gráfico, aparecerá três botões, no terceiro botão

→ Selecionar dados → Intervalo de dados do gráfico, selecionar e inserir os pontos médios.

(20)

REGRESSÃO LINEAR SIMPLES

Quando um conjunto de dados é analisado pela regressão linear simples, o resultado é uma equação da forma:

𝑦 = 𝑏0+ 𝑏1𝑥

Quando substituímos o valor de x por certo valor na equação, essa equação fornece uma previsão para o valor y.

A regressão linear simples determina os valores de ‘b0’ e ‘b1’ que ajustam

da melhor maneira os dados, de acordo com um critério específico. Vamos usar o excel para explorar estes significados.

Ex: Um gerente de marketing conduziu um estudo para determinar se há uma relação entre o dinheiro gasto com propaganda e as vendas da empresa.

Os dados são mostrados na tabela abaixo: Procedimento de análise:

Arquivo de dados

(21)

Em uma célula digitar r =, na outra célula seguir os seguintes passos:

= fx → Estatística → correl → ok

Na matriz 1, selecionar os dados de x e na matriz 2, os dados de y → ok

(22)

Selecionar as colunas de X e Y, ir na barra de ferramenta e inserir gráficos de dispersão(X, Y)

(23)

Tirar as linhas de grade (opcional), basta clicar em uma das linhas e deletar.

Clicar em uma das bolinhas do gráfico com o botão direito e escolher → Adicionar linha de tendência → Linear → Exibir equação no gráfico → Exibir valor de R-quadrado no gráfico, e obteremos:

Figura XX

Podemos ainda ter um relatório completo dos resultados.

Exemplo: A analista de mercado tem interesse em estabelecer uma relação entre o valor de venda e a avaliação do imóvel. Para o estudo foi selecionada uma amostra de cinco propriedades. Procedimento de análise: 4) Arquivo de dados y = 50,729x + 104,06 R² = 0,8334 0 50 100 150 200 250 300 0 0,5 1 1,5 2 2,5 3

V

e

nd

as

Gastos

(24)

Se não estiver instalado: arquivo → Opções → Suplementos → ir → Ferramentas de Análise → Análise de Dados → Regressão

(25)

Observação:

(1) Usar quando o intercepto (B0) do modelo não for significativo

(2) Verifica a distribuição de probabilidade da variável dependente

(3) Análise gráfica dos resíduos.

RESUMO DOS RESULTADOS Estatística de regressão R múltiplo 0,989762 R-Quadrado 0,97963 R-quadrado ajustado 0,97284 Erro padrão 0,60553 Observações 5 ANOVA gl SQ MQ F F de significação Regressão 1 52,9 52,9 144,2727 0,001242 Resíduo 3 1,1 0,366667 Total 4 54 Coeficientes Erro

padrão Stat t valor-P

95% inferiores 95% superiores Inferior 95,0% Superior 95,0% Interseção -2,2 0,812404 -2,70801 0,073287 -4,78543 0,385432 -4,78543 0,385432 Variável X 1 2,3 0,191485 12,01136 0,001242 1,690608 2,909392 1,690608 2,909392

RESULTADOS DE RESÍDUOS RESULTADOS DE PROBABILIDADE

Observação Y previsto Resíduos

Resíduos padrão Percentil Y 1 2,4 -0,4 -0,76277 10 2 2 4,7 0,3 0,572078 30 5 3 7 0 0 50 7 4 9,3 0,7 1,334848 70 10 5 11,6 -0,6 -1,14416 90 11

(26)
(27)

REFERÊNCIAS

LARSON, Ron; Betsy F. Estatística Aplicada. 4 ed. São Paulo: Pearson Prentice Hall, 2010.

LEVINE, David M.; Berenson, Mark L.; Stephan, David. Estatística: Teoria e

Aplicações. Rio de Janeiro: LTC, 2000.

NEUFELD, John L. Estatística Aplicada à Administração usando Excel. São Paulo: Pearson Prentice Hall, 2003.

BERNAL, Regina; DA SILVA, Nilza, N. O Uso do EXCEL para Análises

Estatísticas. Disponível em:

http://www.fsp.usp.br/nilza/Apostila_curso_excel_V4.pdf. Acesso em: 05 dezembro 2016.

Referências

Documentos relacionados

Selected studies were included in the meta-analysis if they met the following criteria: 1) case-control or cohort studies; 2) evaluating the association of the rs2435357 and

Para saber como o amostrador Headspace 7697A da Agilent pode ajudar a alcançar os resultados esperados, visite www.agilent.com/chem/7697A Abund.. Nenhum outro software

Considerando a formação da equipe de trabalho, o tempo de realização previsto no projeto de extensão e a especificidade das necessidades dos catadores, algumas

5.2 Importante, então, salientar que a Egrégia Comissão Disciplinar, por maioria, considerou pela aplicação de penalidade disciplinar em desfavor do supramencionado Chefe

Diante das consequências provocadas pelas intempé- ries climáticas sobre a oferta de cana-de-açúcar para a indústria, a tendência natural é que a produção seja inferior

Este trabalho usou narrativas para convocar a todos a pensarem a atuação do pedagogo nos espaços não escolares, principalmente nos CAPS, com ênfase no CAPS-

CAIXA, além do benefício previsto no parágrafo segundo da cláusula 26, o empregado que adotar ou obtiver guarda judicial para fins de adoção de criança fará jus

No processo de musicalização, o instrumento musical é um recurso muito importante no trabalho com as crianças, pois lhes proporciona a aprendizagem em