• Nenhum resultado encontrado

PROBABILIDADE E ESTATÍSTICA

N/A
N/A
Protected

Academic year: 2021

Share "PROBABILIDADE E ESTATÍSTICA"

Copied!
63
0
0

Texto

(1)
(2)

DIREÇÃO ACADÊMICA Célia Jussani

DIREÇÃO GERAL Florindo Corral

DIREÇÃO ADMINISTRATIVA Gustavo Azzolini

COORDENAÇÃO GERAL DE EAD Sandra Regina Giraldelli Ulrich

DIAGRAMAÇÃO E ARTE FINAL Reinado Silveira Carvalho

REVISÃO FINAL Meire Terezinha Müller

PROBABILIDADE E ESTATÍSTICA

AUTORA

Eliana Mara Oliveira Lippe

(3)

FICHA CATALOGRÁFICA

Elaborada pela Biblioteca Central da FAM

L742p Lippe, Eliana Mara Oliveira

Probabilidade e estatística / Eliana Mara Oliveira Lippe ; diagramação e arte final de Reinaldo Silveira Carvalho ; revisão final de Meire Terezinha Müller. -- Americana, 2015.

93 f. : il.

Apostila elaborada para a disciplina EAD Probabilidade e estatística - Faculdade de Americana. Núcleo Geral.

1. Estatística matemática. 2. Probabilidades. I. Carvalho, Reinaldo Silveira. II. Müller, Meire Terezinha. III. Título.

CDU 311.1

Proibida a reprodução total ou parcial por meio de impressão, em forma idêntica, resumida ou modificada em língua portuguesa ou qualquer outro idioma

1ª edição - 2015

(4)

A Faculdade de Americana – FAM é mantida pela Associação Educacional Americanense, está situada Endereço: Av. Joaquim Boer, 733 – Americana-SP; CEP 13477-360 e foi Credenciada pela Portaria MEC nº 766/99 – DOU 18/05/1999.

A história da IES começou quando os dirigentes do então Colégio Bandeirantes, atual Instituto Educacional de Americana, decidiram constituir uma nova entidade mantenedora, a Associação Educacional Americanense, que tem como mantida a Faculdade de Americana.

O projeto de instalação da Faculdade de Americana – FAM foi resultado das condições econômico- educacionais que a região de Americana apresenta, além de experiência dos seus dirigentes como educadores atuantes.

A Associação Educacional Americanense entende que o ensino, a pesquisa e a extensão não podem deixar de responder de forma dinâmica, eficiente e consequente aos problemas sociais que refletem as necessidades da comunidade local, regional e nacional.

Para operacionalizar o projeto de criação dos cursos superiores, a entidade mantenedora consultou especialistas das diversas áreas do conhecimento.

Assim, o projeto FAM foi idealizado com seriedade e acima de tudo com o compromisso de oferecer a universalidade do saber: caráter substancial das instituições que justificam suas funções na comunidade onde estão inseridas.

MISSÃO

A missão da FAM é produzir e disseminar o conhecimento nos diversos campos do saber, contribuindo para o exercício pleno da cidadania mediante formação humanista, crítica e reflexiva, consequentemente preparando profissionais competentes e atualizados para o mundo do trabalho presente e futuro.

VISÃO

"Tornar-se referência no ensino superior, promovendo o desenvolvimento da educação, cultura e conhecimento nas regiões do polo têxtil e metropolitana de Campinas".

VALORES

• Ética, credibilidade e transparência;

• Visão humanista entre ensino, pesquisa e extensão;

• Compromisso social;

• Comprometimento com a qualidade;

• Gestão participativa;

• Profissionalismo e valorização de recursos humanos;

• Universalidade do conhecimento e fomento à interdisciplinaridade

(5)

Prezado (a) Aluno (a),

Seja bem-vindo (a) à FAM – Faculdade de Americana!

Sentimo-nos orgulhosos em tê-lo fazendo parte da história que estamos construindo.

Aluno ingressante, que está dando início a esta fase tão importante, ou você que dá continuidade aos seus estudos, esteja certo de que o seu sonho é parte das nossas metas e que estaremos trabalhando, constantemente, para torná-lo um profissional capaz e um cidadão completo.

Uma equipe empenhada também está à sua disposição para esclarecer quaisquer dúvidas que permaneçam em relação ao curso.

Desejamos a todos bons estudos!

PROF. FLORINDO CORRAL Direção Geral

FAM I Faculdade de Americana

(6)

SUMÁRIO

Amostragem 8

Variáveis 14

Tabela 19

UNIDADE 1

UNIDADE 2

UNIDADE 3

Gráficos 25

Moda 30

UNIDADE 4

Média 34

Mediana 37

Quartis 40

Percentis 43

(7)

Intervalo de Classes 46

Desvio Padrão 53

UNIDADE 5

UNIDADE 6

Amplitudes de Variância 49

Coeficiente de Variação 56

Coeficiente de Correlação 60

(8)

PROBABILIDADE E ESTATÍSTICA Unidade 1

Nesta aula, você estudará:

• Processo de amostragem.

• Definição de população.

• Definição dos métodos de amostragem.

• Escolha da dimensão da amostra.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Defina o que é amostragem.

• Como se define o processo de amostragem?

• Quais os diversos tipos de amostragem?

• Como se define o intervalo de confiança para o P?

Neste tema você verá as principais questões relacionadas à amostragem:

o que é; em que circunstância é aplicada; como determinar. A ideia é compreender na teoria o que é o processo de amostragem e traduzi-lo para a prática diária.

Amostragem

Qual é o primeiro ponto a se pensar quando falamos em Amostragem?

Seria relacionar esse conceito a partir de alguns itens de uma caixa que simbolizassem o total de itens, correto? Sim!

Definimos o conceito de amostragem como um conjunto de todos os elementos que se deseja estudar. A este conjunto denominamos de população. Mas então como definiríamos o termo população? Seria uma coleção de todos os possíveis elementos, objetos ou medidas de interesse.

Conteúdos e Habilidades

Leitura Obrigatória

UNIDADE 1

TEMA 1:

AMOSTRAGEM

Amostragem é um conjunto de todos os elementos que se deseja estudar.

(9)

PROBABILIDADE E ESTATÍSTICA Unidade 1

Alguns exemplos que melhor definem o termo população:

• Conjunto das rendas de todos os habitantes de São Paulo;

• Conjunto de todas as notas dos alunos de Estatística.

Como geralmente o conjunto das amostras é muito grande e dificultaria a combinação para fazer as análises, determinou-se que pode ser utilizada uma amostra, a fim de representar o todo que deveria ser analisado.

Como então pode ser caracterizada uma amostra? É definida como uma porção ou parte de uma população de interesse.

Alguns exemplos que melhor definem a amostra nos dias de hoje seriam:

• Antes da eleição diversos órgãos de pesquisa e imprensa ouvem um conjunto selecionado de eleitores para ter uma ideia do desempenho dos vários candidatos.

• IBGE faz levantamentos periódicos sobre emprego, desemprego, inflação, etc.

• Em pesquisas científicas, pesquisadores utilizam deste recurso para determinar a performance reprodutiva dos animais.

Existe alguns riscos de amostragem O risco é decorrência da quantidade das amostras analisadas. Pequenas quantidades analisadas podem não ser representativas do todo que deveria ser analisado. A teoria da probabilidade pode ser utilizada para fornecer uma ideia do risco envolvido, ou seja, o erro de usar uma amostra ao invés do todo.

Mas como é feita a escolha desta amostra? Os elementos que comporão a amostra devem ser escolhidos ao acaso, pois caso contrário seria considerada amostra viciada.

Baseados nestes conceitos, podemos definir Estatística Indutiva ou Inferencial como sendo a coleção de métodos e técnicas utilizados para se estudar uma população baseados em amostras probabilísticas (aleatória) desta mesma população. Porém quando podemos dizer que a amostra é probabilistica (aleatória)? Ocorre quando todos os elementos da população tiverem probabilidade conhecida - e não zero - de pertencer à amostra. Para isso, a amostra deve satisfazer o critério de amostra aleatória simples (aas).

Amostra é uma porção ou parte de uma população de interesse.

Representação visual de um processo de amostragem.

Fonte: Wikipedia

(10)

PROBABILIDADE E ESTATÍSTICA Unidade 1

Melhor explicando: se N representa o tamanho da população e n<N o tamanho da amostra, então o número de amostras possíveis - de acordo com os critérios com e sem reposição - será:

a) Com reposição: k = número de amostras = Nn b) Sem reposição: k = número de amostras =

Uma caracteristica da população é denominada parâmetro (P). Um parâmetro é uma constante, isto é, um número que representa uma característica única da população. Assim, se P é uma população, os principais parâmetros seriam:

• A média de P µP

• A variância de P δP2

• O desvio padrão de P δP

• A proporção de elementos de P que apresentam determinada caracteristica π

** Exemplos: para a população P = {1, 3, 5, 6} os parâmetros acima seriam:

µP = (1+3+5+6)/4 = 3,75 δP2 = (1+9+25+36)/4 = 3,69 δP = 1,9203 = 1,92

π = ¼ = 25%, onde o numerador representa o número de elementos pares na população.

Importante:

Se a população for infinita ou muito grande, então as retiradas com e sem reposição serão equivalentes, isto é, o fato de realocar o elemento retirado de volta na população não vai afetar em nada a probabilidade de extração do elemento seguinte.

Se, no entanto, a população for finita ou muito pequena, será necessário fazer uma distinção entre os dois procedimentos, pois na extração com reposição as diversas retiradas serão independentes, só não se alterando se for no processo sem reposição.

(11)

PROBABILIDADE E ESTATÍSTICA Unidade 1

Um estimador é uma caracteristica da amostra. Como a amostra é aleatória, um estimador é uma variável aleatória. Assim, tudo o que foi visto em probabilidade sobre variáveis aleatórias, aplica-se aos estimuladores. A distribuição de probabilidade de um estimador é denominada distribuição amostral.

Os principais estimadores são:

• A média da amostra, X que é um estimador da média da população: µ

• A variância amostral, S2 que é um estimador da variância populacional: δ2

• A proporção amostral, P, que é um estimador amostral da proporção populacional π.

Uma estimativa é um valor único de um estimador. Assim X = 2 é uma estimativa. O estimador é a expressão (fórmula) enquanto que a estimativa é o valor particular que ele assume (número).

O erro padrão da média mede a variabilidade entre as médias amostrais e dá a ideia do erro que se comete ao se subsitituir a média da população pela média da amostra. Se a população é grande ou infinita, não mais será possível pensar em construir tabelas para representar a distribuição das médias amostrais. Neste caso, é necessário procurar por modelos probabilísticos que descrevam a distribuição da média amostral. Neste caso, como já explicado acima, a distinção entre amostragem com e sem reposição não será necessário, pois o fator de correção será

“aproximadamente um” e não necessitará ser utilizado.

O tipo de amostragem pode ser classificado em probabilístico ou não probabilistico. A classificação probabilistica ou aleatória é a mais utilizada. Dentro da amostragem não probabilistica temos: a amostragem a esmo, intencional e cotas. Já para a probabilistica, existem a amostragem simples ou ocasional, a sistemática, a estratificada ou por conglomerados. Entenda melhor analisando cuidadosamente o gráfico abaixo:

Um estimador é uma caracteristica da amostra.

O tipo de amostragem pode ser classificado em probabilístico ou não probabilistico.

(12)

PROBABILIDADE E ESTATÍSTICA Unidade 1

a) Amostragem simples é o processo mais utilizado. Todos os elementos da população têm a igual probabilidade de serem escolhidos (para um população finita o processo dever ser sem reposição). O importante é numerar todos os elementos e realizar um sorteio, utilizando a tabela de números aleatórios.

b) Amostragem sistemática trata-se de uma variação da amostragem aleatória simples, conveniente quando a população está naturalmente ordenada, como fichas em um fichário, lista telefônica, etc. Ela é utilizada frequentemente em pesquisas que obrigam que a seleção seja feita durante a etapa de coleta dos dados, por pessoas que não estão familiarizadas com tabelas de números aleatórios ou com uso de software.

c) Amostragem estratificada é um processo de amostragem usado quando nos deparamos com populações heterogêneas, nas quais pode-se distinguir subpopulações mais ou menos homogêneas, denominadas estratos. A partir destes estratos seleciona-se uma amostra aleatória de cada subpopulação, porém sempre guardando as devidas proporcionalidades.

(13)

PROBABILIDADE E ESTATÍSTICA Unidade 1

O dimensionamento da amostra deve ser feito a partir da determinação do tamanho total da amostra. O importante, se possivel, é escolher sempre mais de uma váriavel. Verifique a mensuração da variável (se nominal, ordinal ou intervalar) e considere se a população é finita ou infinita.

Leia o artigo: A importância da estatística na formação do profissional pedagogo, do autor Aloisio Machado da Silva Filho. Disponível em:

http://www.cairu.br/revista/arquivos/artigos/2014/Artigo%20A%20 IMPORTANCIA%20DA%20ESTATISTICA.pdf. Acesso em 09 de setembro de 2014. O artigo propoe uma analise da função estatitica nas mais diversas formações profissionais, principalmente pedagogo.

Leia o artigo: Estatística através de rosas dos ventos para o aeródromo do galeão como auxílio à elaboração do código TAF, do autor Jéssica Motta Guimarães. Disponível em: http://www.redemet.aer.mil.br/Artigos/

Estat%C3%ADstica_atrav%C3%A9s_de_rosas_dos_ventos_para_o_

aeroporto_do_Gale%C3%A3o_como_aux%C3%ADlio_ao_TAF.pdf.

Acesso em 09 de setembro de 2014. O artigo mais aplicado de estatitica com as suas variações.

Neste tema você aprendeu, brevemente, como podemos utilizar a amostragem nas mais variadas circunstâncias estatísticas. Aprendeu também como calculá-la e como diferenciá-la nos mais variados processos.

Amostragem

Partes de um conjunto de todos os elementos que se deseja estudar.

Erro padrão da média

Mede a variabilidade entre as médias amostrais e dá a ideia do erro que se comete ao se subsitituir a média da população pela média da amostra.

Tipo de amostragem

Pode ser classificado em probabilístico ou não probabilístico.

IBGEInstituto Brasileiro de Geografia e Estatística.

Links Importantes

Quando não se conhece o desvio padrão, deve-se utilizar um valor preliminar obtido por processos como fazer uma aproximação ou realizar um estudo piloto, iniciando o processo de amostragem pequeno.

Pode-se utilizar este valor como desvio padrão populacional.

Saiba Mais

Finalizando

Glossário

(14)

PROBABILIDADE E ESTATÍSTICA Unidade 2

Nesta aula, você estudará:

• O que são variáveis.

• Tipos de variáveis.

• Níveis de mensuração.

• Relação entre as variáveis.

Ao final, você deverá ser capaz de responder às seguintes questões:

• O que são variáveis? Dê uma definição.

• Como ela são classificadas?

• Quais os principais tipos de variáveis?

• É possível relacionar a teoria com a prática aplicando o conceito de variáveis?

Neste tema você terá a oportunidade de aprofundar seus conhecimentos sobre variáveis e saber como aplicá-las. A ideia é compreender o conceito - na teoria - e relacioná-lo com a prática diária.

Qual é o primeiro ponto a se pensar quando falamos em Variáveis? São as mais variadas situações que devemos considerar em cada problema em questão.

Para que estudar variáveis? Para aprender a analisar os dados que precisam ser avaliados. Como podemos definir o conceito de variáveis?

São características que são medidas, controladas ou manipuladas em uma pesquisa. Diferem em muitos aspectos, principalmente no papel que a elas é dado em uma pesquisa e na forma como podem ser medidas.

Alguns exemplos que melhor definem as variáveis:

• Em uma pesquisa científica sobre reprodução, deve-se considerar a quantidade de fêmeas por macho para o acasalamento;

• Em uma pesquisa sobre preferência do eleitor por candidatos – do tipo feita pelo IBOPE para as eleições - considerar todos os pontos a favor e contra os candidatos em questão para vencer as eleições.

Conteúdos e Habilidades

UNIDADE 2

TEMA 2:

VARIÁVEIS

Leitura Obrigatória

Variáveis são características que são medidas, controladas ou manipuladas em uma pesquisa.

(15)

PROBABILIDADE E ESTATÍSTICA Unidade 2

A maioria das pesquisas empíricas pertencem claramente a uma dessas categorias gerais: em uma pesquisa correlacional (levantamento) o pesquisador não influencia (ou tenta não influenciar) nenhuma variável, mas apenas as mede e procura por relações (correlações) entre elas, como pressão sanguínea e nível de colesterol. Em uma pesquisa experimental (experimento) o pesquisador manipula algumas variáveis e então mede os efeitos desta manipulação em outras variáveis; por exemplo, aumentar artificialmente a pressão sanguínea e registrar o nível de colesterol.

A análise dos dados em uma pesquisa experimental também calcula (calcula? Não seria analisa?) “correlações” entre variáveis, especificamente entre aquelas manipuladas e as que foram afetadas pela manipulação. Entretanto, os dados experimentais podem demonstrar conclusivamente relações causais (causa e efeito) entre variáveis. Por exemplo, se o pesquisador descobrir que sempre que muda a variável A também muda a varíavel B, então ele poderá concluir que A “influencia” B. Dados de uma pesquisa correlacional podem ser apenas “interpretados”em termos causais com base em outras teorias (não estatísticas) que o pesquisador conheça, mas não podem conclusivamente provar causalidade.

Os tipos de variáveis são:

Variáveis independentes - são aquelas manipuladas, enquanto que variáveis dependentes são apenas medidas ou registradas.

Esta distinção confunde muitas pessoas que dizem que “todas as variáveis dependem de alguma coisa”. Entretanto, uma vez que se esteja acostumado a esta distinção, ela se torna indispensável.

Os termos variável dependente e independente aplicam-se principalmente à pesquisa experimental, onde algumas variáveis são manipuladas, e neste sentido, são “independentes”dos padrões de reação inicial, intenções e características dos sujeitos da pesquisa (unidades experimentais). Espera-se que outras variáveis sejam “dependentes”da manipulação ou das condições experimentais. Ou seja, elas dependem “do que os sujeitos farão”

em resposta. Contrariando um pouco a natureza da distinção, esses termos também são usados em estudos em que não se manipulam variáveis independentes, literalmente falando, mas apenas se designam sujeitos. Por exemplo, se em uma pesquisa compara-se a contagem de células brancas de homens e mulheres, sexo pode ser chamado de variável independente e célula branca de variável dependente.

Há obviamente algum erro em cada medida, o que determina o

“montante de informação” que se pode obter, mas basicamente o fator que determina a quantidade de informação que uma variável pode prover é o seu tipo de mensuração. Sob este prisma as variáveis são classificadas como:

Logo do Instituto Brasileiro de Opinião Pública e Estatística.

Fonte : Ibope.com.br

Em uma pesquisa experimental (experimento) o pesquisador manipula algumas variáveis e então mede os efeitos desta manipulação em outras variáveis.

(16)

PROBABILIDADE E ESTATÍSTICA Unidade 2

• Nominais: permitem apenas classificação qualitativa.

Seus valores possíveis são diferentes categorias não ordenadas, em que cada observação pode ser classificada.

Exemplos: raça, nacionalidade, área de atividade.

• Ordinais: permitem ordenar os itens medidos em termos de qual tem menos e qual tem mais da qualidade representada pela variável, mas ainda não se permite que se diga “o quanto mais”. Também são variáveis qualitativas;

seus valores possíveis são diferentes categorias ordenadas, em que cada observação pode ser classificada. Exemplos:

classe social, nível de instrução.

• Discreta: São variáveis quantitativas. Seus valores possíveis são em geral resultados de um processo de contagem. Exemplos: número de filhos, número de séries escolares cursadas com aprovação.

• Contínua: Também são variáveis quantitativas. Seus valores possíveis podem ser expressos através de números reais e varrem uma escala contínua de medição. Exemplos:

renda mensal, peso e altura.

• Intervalares: permitem não apenas ordenar em postos os itens que estão sendo medidos, mas também quantificar e comparar o tamanho das diferenças entre eles.

As variáveis discretas são obtidas mediante alguma forma de contagem, ao passo que os valores das variáveis contínuas resultam, em geral, de uma medição, sendo frequentemente dados em alguma unidade de medida. Outra diferença entre os tipos de variáveis quantitativas está na interpretação de seus valores. Assim, a interpretação de um valor de uma variável discreta é dada exatamente por este mesmo valor.

Quando dizemos que um casal tem dois filhos, isso significa que o casal tem exatamente 2 filhos. A interpretação de um valor de uma variável contínua, ao contrário, é a de que se trata de um valor aproximado.

Isso decorre do fato de não existirem instrumentos de medida capazes de oferecer precisão absoluta e, mesmo que existissem, não haveria interesse e nem sentido em se querer determinar uma grandeza contínua com todas as suas casas decimais. Logo, se ao executarmos a medição de algum valor de uma variável contínua estamos sempre fazendo uma aproximação, resulta que qualquer valor apresentado de uma variável contínua deverá ser interpretado como uma aproximação compatível com o nível de precisão e com o critério utilizado ao medir.

Duas ou mais variáveis quaisquer estão relacionadas se numa amostra de observação os valores dessas variáveis são distribuídos de forma consistente. Geralmente o objetivo principal de toda pesquisa ou análise científica é encontrar relações entre variáveis. A filosofia da ciência ensina que não há outro meio de representar “significado” exceto em termos de relações entre quantidades ou qualidades, e ambos os casos envolvem relações entre variáveis.

As variáveis diferem em “quão bem”

elas podem ser medidas, isto é, em quanta informação seu nível de mensuração pode prover.

Saiba Mais

Geralmente o objetivo principal de toda pesquisa ou análise científica é encontrar relações entre variáveis.

(17)

PROBABILIDADE E ESTATÍSTICA Unidade 2

As duas propriedades formais mais elementares de qualquer relação entre variáveis são a magnitude (“tamanho”) e a confiabilidade da relação.

• Magnitude: é mais fácil de se medir do que confiabilidade. Por exemplo, se cada homem em nossa amostra tem uma contagem de células brancas maior do que o de qualquer mulher da amostra, poder-se-ia dizer que a magnitude da relação entre as duas variáveis é muito alta em nossa amostra.

• Confiabilidade: é um conceito muito menos intuitivo. Relaciona- se à “representatividade” do resultado encontrado em uma amostra específica de toda a populaçào. Em outras palavras, diz quão provável será encontrar uma relação similar se o experimento fosse feito com outras amostras retiradas da mesma população, lembrando que o maior interesse está na população. O interesse na amostra reside na informação que ela pode prover sobre a população. Se o estudo atender a certos critérios específicos, então a confiabilidade de uma relação observada entre variáveis na amostra pode ser estimada quantitativamente e representada usando uma medida padrão.

Por que a significância de uma relação entre variáveis depende do tamanho da amostra?

Se há muito poucas observações, então há também poucas possibilidades de combinação dos valores das variáveis, e então a probabilidade de obter por acaso uma combinação desses valores que indique uma forte relação é relativamente alta.

Quando é feito um levantamento de dados a respeito de um determinado assunto, eles costumam ser representados em uma tabela de dados brutos, na qual cada linha corresponde a uma observação e cada coluna corresponde a uma variável.

Eventualmente em uma massa de dados há valores que foram coletados em condições anormais (falha do equipamento, queda da energia, erro do operador, erro de leitura, erro de digitação, etc). Esses valores, principalmente quando estão muito afastados dos demais (para mais ou para menos), infelizmente podem afetar de forma substancial o resultado das análises estatísticas. São chamadas observações discrepantes ou outliers. Assim sendo, é útil que tenhamos disponível um critério de detecção de observações discrepantes. Uma vez detectada a presença desta, poderá ser tomada a decisão de repetir aquele experimento, ou meramente expurgar aquele dado da amostra (ou mesmo mantê-lo, se for encontrada uma explicação plausível para aquela discrepância).

(18)

PROBABILIDADE E ESTATÍSTICA Unidade 2

Leia o artigo: Apostila de Estatística, do autor Marcelo Beneti.

Disponível em: http://www.administradores.com.br/artigos/negocios/

apostila-de-estatistica/40665/. Acesso em 10 de setembro de 2014. A apostila fundamenta os principais conceitos relacionados às variáveis estatísticas, dentre outros tópicos.

Leia o artigo: Planejamento estatístico de experimento científico, do autor José Benício Chaves. Disponível em: http://www.dta.ufv.br/artigos/

planestat.htm. Acesso em 10 de setembro de 2014. Definição de como determinar variáveis no campo científico e experimental.

Leia o artigo: A escolha do teste estatístico – um tutorial em forma de apresentação em Power Point, dos autores David Normando; Leo Tjaderhane; Catia Cardoso Quintão. Disponível em: http://www.scielo.br/

pdf/dpjo/v15n1/12.pdf. Acesso em 10 de setembro de 2014. Definição de como determinar a escolha dos testes estatísticos envolvendo variáveis.

Neste tema você aprendeu, brevemente, como utilizar as variáveis e como classificá-las adequadamente nas mais variadas circunstâncias estatísticas.

Variáveis

Amostragem como um conjunto de todos os elementos que se deseja estudar.

Ordinal

Mede a variabilidade entre as médias amostrais e dá a ideia do erro que se comete ao se subsitituir a média da população pela média da amostra.

Intervalares

Pode ser classificado em probabilístico ou não probabilístico.

Discrepante Fora do comum.

Magnitude

Ideia relacionada ao tamanho.

Links Importantes

Finalizando

Glossário

(19)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Nesta aula, você estudará:

• Como preparar uma tabela.

• Como os dados devem ser ordenados.

• Quais os tipos de tabelas existentes.

• Comparação entre as tabelas e os dados obtidos com gráficos.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Como é possível ordenar os dados em uma tabela de acordo com a amostragem?

• Quais os tipos de tabelas?

• É possível relacionar os dados obtidos a partir da tabela aos gráficos?

• Como é possível interpretar os resultados a partir dos dados obtidos com a tabela?

Neste tema você terá a oportunidade de aprofundar mais os seus conhecimentos sobre a preparação de tabelas e como trabalhar com os dados. A ideia é compreender na teoria e relacionar o conhecimento adquirido com a prática diária.

A estatística descritiva é a parte da estatística que desenvolve e disponibiliza métodos para resumo e apresentação de dados estatísticos, com o objetivo de facilitar a compreensão e a utilização das informações ali contidas.

Para melhor descrever o comportamento de uma variável que estudamos no capítulo anterior, é comum apresentar os valores que ela assume organizados sob a forma de tabelas que podem ser de frequências e gráficos.

Conteúdos e Habilidades

UNIDADE 3

TEMA 3:

TABELA

Leitura Obrigatória

Na construção de tabelas de frequência e gráficos, as variáveis são tratadas de forma diferente de acordo com o tipo.

(20)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Qual é a diferença entre essas tabelas? Quando podemos utilizar os dados ordenados na forma de tabela ou gráfico? Qual é o mais representativo?

A reunião ou agrupamento de dados estatísticos, quando apresentados em tabelas, para apreciação ou investigação, determina o surgimento das séries estatísticas. Estas séries resumem um conjunto ordenado de observações através de três fatores fundamentais:

a) Tempo: refere-se à data ou à época em que o fenômeno foi investigado;

b) Espaço: refere-se ao local ou região onde o fato ocorreu;

c) Espécie: refere-se ao fato ou fenômeno que está sendo invetigado e cujos valores numéricos estão sendo apresentados.

Elas podem ser classificadas de acordo com o fator que estiver variando, podendo ser simples ou mistas.

Série simples: são aquelas em que apenas um fator varia.

Podem ser de três tipos:

Série Histórica (temporal ou cronológica ou evolutiva): varia o tempo permanecendo fixos o espaço e a espécie do fenômeno estudado.

Exemplo:

Série geográfica (territorial ou regional): varia o espaço permanecendo fixos o tempo e a espécie do fenômeno estudado.

Exemplo:

Tabela 1: Casos de variola notificados no Brasil de 1993 a 1997. Fonte: Anuários Estatísticos - IBGE

Tabela 2: Necessidades médias de energia em alguns países, em 1973.

Fonte: Necessidades Humanas de Energia - IBGE

(21)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Série especificativa (qualitativa ou categórica): varia a espécie do fenômeno estudado, permanecendo fixos o tempo e o espaço.

Exemplo:

Série mista: são aquelas em que mais de um fator varia ou um fator varia mais de uma vez.

Exemplos:

Série histórica geográfica

Série especificativa geográfica

Tabela 3: Abate de animais, por espécies, no Brasil, em 1993.

Fonte: Necessidades Humanas de Energia - IBGE

Tabela 4: Taxa de atividade feminina urbana (em percentual) em 3 regiões do Brasil, 1981/1990

Fonte: Anuários Estatísticos do Brasil - 1992

Tabela 5: Consumo per capita de alguns tipos de alimentos,

(22)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Série especificativa histórica

Série distribuição de frequências: ocorre quando nenhum dos fatores varia. Nesta série os dados são agrupados em classes (intervalos com limites predeterminados) segundo suas respectivas frequências.

Segundo a natureza dos dados, as distribuições de frequências podem ser de dois tipos :

- Para dados de enumeração.

- Para dados de mensuração.

A tabela é a forma não discursiva de apresentar informações, das quais o dado numérico se destaca como informação central. Sua finalidade é apresentar os dados de modo ordenado, simples e de facil interpretação, fornecendo o máximo de informação num mínimo de espaço.

Quais são os conjuntos de dados que compõem uma tabela?

• Elementos da tabela

Uma tabela estatística é composta de elementos essenciais e elementos complementares. Os elementos essenciais são:

- Título: é a indicação que precede a tabela, contendo a designação do fato observado, local, época, etc.

- Corpo: é o conjunto de linhas e colunas onde estão inseridos os dados.

- Cabeçalho: é a parte superior da tabela, que indica o conteúdo das colunas.

- Coluna indicadora: é a parte da tabela que indica o conteúdo das linhas.

Tabela 6: Taxa de mortalidade (%) de menores de um ano no Brasil, segundo as três principais causas, no período de 1984 a 1987. Fonte:

Informe Epidemologico SUS.

A tabela é a forma não discursiva de apresentar informações

(23)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Já os elementos complementares são:

- Fonte: entidade que fornece os dados ou elabora a tabela.

- Notas: informações de natureza geral, destinadas a esclarecer o conteúdo das tabelas.

- Chamada: informações específicas destinadas a esclarecer ou conceituar dados numa parte da tabela. Deverão estar indicadas no corpo da tabela, em números arábicos entre parênteses, à esquerda nas casas e à direita na coluna indicadora. Deve ser situada no rodapé da tabela.

• Número da tabela

Toda tabela deve ter sempre um número para identificá-la, assim como a sua localização. A numeração deve ser feita em números arábicos, de modo crescente, precedidos da palavra Tabela, podendo ou não estar subordinada a capítulos ou seções. Exemplo: Tabela 5.

• Apresentação dos dados numéricos

Toda tabela deve ter dado numérico para informar a quantificação de um fato específico observado, apresentado em números arábicos.

No sistema inglês, a separação entre o milhar e a centena é feita por vírgulas e a separação da parte inteira decimal é feita por ponto, ou seja, inverso do sistema brasileiro.

• Arredondamento

Quando o algarismo que for abandonado for entre 0 e 4, fica inalterado o último algarismo; porém, quando o primeiro algarismo a ser abandonado estiver entre 5-9, aumenta-se uma unidade no último algarismo a aparecer.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.

Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.

pdf Acesso em 29 de setembro de 2014. A apostila fundamenta os principais conceitos relacionados à preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatística aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_

Toda tabela deve ter sempre um número para identificá-la, assim como a sua localização.

O corpo da tabela deve ser limitado, no mínimo, por três traços horizontais. Recomenda-se não delimitar as tabelas à direita e à esquerda por traços verticais. Se possuir muitas linhas e poucas colunas poderá ser apresentada em duas ou mais partes dispostas lado a lado e separadas por traços duplo.

Saiba Mais

Links Importantes

(24)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Neste tema você aprendeu, brevemente, como ocorrem os elementos da tabela e como classificá-las adequadamente nas mais variadas circunstâncias estatísticas.

Série

Refere-se à classificação para a formação da tabela.

IBGE

Instituto Brasileiro de Geografia e Estatística.

Anuários

É uma publicação anual que registra informações sobre um ou vários ramos de atividade, tais como, ciências, artes, literatura, profissões, economia, etc.

Misto

Assume a identidade de duas classificações.

Cabeçalho

Na terminologia da informática, o headre – ou, simplesmente, cabeçalho – consiste na parte que contém as informações suplementares colocados no começo de um bloco de dados que estão armazenados ou transmitidos.

Finalizando

Glossário

(25)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Nesta aula, você estudará:

• Como preparar gráficos.

• Como os dados devem ser ordenados.

• Quais os tipos de gráficos existentes.

• Comparação com os dados obtidos com as tabelas.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Como é possível ordenar os dados em gráficos de acordo com a amostragem?

• Quais os tipos de gráficos?

• É possível relacionar os dados obtidos com a tabela aos gráficos?

• Como é possível interpretar os resultados a partir dos dados obtidos com o gráfico?

Neste tema você terá a oportunidade de aprofundar mais os seus conhecimentos sobre a preparação de gráficos e como trabalhar com os dados. A ideia é compreender os conteúdos na teoria e relacioná-los com a prática diária.

O primeiro passo para se descrever graficamente um conjunto de dados observados é verificar as frequências dos diversos valores existentes da variável.

Definimos frequência de um dado valor de uma variável (qualitativa ou quantitativa) como o número de vezes que esse valor foi observado.

Denotaremos a frequência do i-ésimo valor observado for fi. Sendo n o número total de elementos observados, verifica-se imediatamente.

ΣΚ i = fi = n

GRÁFICOS

Conteúdos e Habilidades

Leitura Obrigatória

A frequência é uma grandeza física ondulatória que indica o número de ocorrências de um evento (ciclos, voltas, oscilações, etc) em um determinado intervalo de tempo.

(26)

PROBABILIDADE E ESTATÍSTICA Unidade 3

A associação das respectivas frequências a todos os diferentes valores observados define a distribuição de frequências do conjunto de valores observados. Alternativamente, poderemos usar as frequências relativas.

Definimos a frequência relativa, ou proporção de um dado valor de uma variável (qualitativa ou quantitativa), como o quociente de sua frequência pelo número total de elementos observados. Ou seja, denotamos por pi a frequência relativa ou proporção do i-ésimo elemento observado.

Para melhor descrever o comportamento de uma variável que estudamos no capítulo anterior, é comum apresentar os valores que ela assume organizados sob a forma de tabelas. Elas podem ser de frequências e gráficos.

Qual é a diferença entre os gráficos? Quando podemos utilizar os dados ordenados na forma de tabela ou gráfico? Qual é o mais representativo?

Na construção de tabelas de frequência e gráficos, as variáveis são tratadas de forma diferente de acordo com o tipo.

No caso de variáveis qualitativas, a descrição gráfica é muito simples, bastando computar as frequências relativas das diversas classificações existentes, elaborando, a seguir, um gráfico conveniente. Esse gráfico poderá ser um diagrama de barras, um diagrama circular ou outro qualquer tipo de diagrama equivalente.

Tomaremos, por exemplo, 135 candidatos a vagas em um curso de pós-graduação, classificados segundo sua formação específica de graduação, conforme a tabela 1.

Esses dados podem ser graficamente representados de diversas formas. Assim, aqui eles serão representados por meio de um diagrama de barras.

Diagrama ou gráfico circular (pie chart), também chamado diagrama de setores, é uma representação gráfica, utilizada essencialmente para dados qualitativos, que tem por base um círculo, dividido em setores circulares, tantos quantas as categorias apresentadas pelos dados em estudo. As amplitudes dos ângulos dos setores são proporcionais às frequências das categorias que representam. Assim, o círculo representa a forma como o total dos dados se distribui pelas categorias e cada setor representa uma fração do total dos dados.

(27)

PROBABILIDADE E ESTATÍSTICA Unidade 3

A vantagem da representação gráfica está em possibilitar uma rápida impressão visual de como se distribuem as frequências ou as frequências relativas no conjunto de elementos examinados. Entretanto, há que se mencionar ainda a possibilidade de considerarmos distribuições segundo outros critérios que não propriamente a frequência ou a frequência relativa das observações. Como exemplo, tomemos as superfícies das cinco regiões geográficas que compoem o Brasil, apresentadas na tabela 2, conforme dados do IBGE (Instituto Brasileiro de Geografia e Estatística). Calculando-se as porcentagens correspondentes, pode-se construir o diagrama circular dado na Figura 2.

No caso das variáveis quantitativas discretas, a representação gráfica será também, normalmente, feita por meio de um diagrama de barras. A construção do diagrama de barras é feita semelhantemente ao exemplo anterior, desde que se disponha da tabela de frequências. Esta, por sua vez, pode ser facilmente construída se conhecemos todos os valores da variável no conjunto de dados. Como iremos marcar no eixo das abscissas os valores da variável, resulta que, nesse caso, as barras do diagrama serão verticais. Vamos ao título do exemplo: representar graficamente o conjunto dado a seguir, constituído hipoteticamente por vinte valores da variável “número de defeitos por unidade”, obtidos a partir de aparelhos retirados de uma linha de montagem. Sejam os seguintes os valores obtidos:

2 4 2 1 2 3 1 0 5 1 0 1 1 2 0 1 3 0 1 2

Usando a letra x para designar os diferentes valores da variável, podemos construir a distribuição de frequência dada na tabela 3, a partir

Tabela 2: Regiões geográficas do Brasil

(28)

PROBABILIDADE E ESTATÍSTICA Unidade 3

O diagrama de barras, conforme já mencionamos, mostra a distribuição das frequências no conjunto de dados. Tratando-se de variáveis quantitativas, uma outra forma de representação gráfica é também possível, tendo as vezes, interesse, com base nas frequências acumuladas, as quais denotaremos por “F”.

A frequência acumulada, em qualquer ponto do eixo das abscissas, é definida como a soma das frequências de todos os valores menores ou iguais ao valor correspondente a esse ponto. Analogamente, teríamos as frequências relativas acumuladas.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.

Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.

pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_

ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.

Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, quais são e como ocorrem os elementos do gráfico, além de aprender como classificá-los adequadamente nas mais variadas circunstâncias estatísticas.

Tabela 3: Distribuição de Frequência

Links Importantes

Finalizando

(29)

PROBABILIDADE E ESTATÍSTICA Unidade 3

Frequência

Número de vezes que esse valor foi observado.

IBGE

Instituto Brasileiro de Geografia e Estatística.

Anuários

É uma publicação anual que registra informações sobre um ou vários ramos de atividade, tais como ciências, artes, literatura, profissões, economia, etc.

Misto

Assume a identidade de duas classificações.

Cabeçalho

Na terminologia da informática, o headre – ou, simplesmente, cabeçalho – consiste na parte que contém as informações suplementares colocadas no começo de um bloco de dados que estão armazenados ou transmitidos.

Glossário

(30)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Nesta aula, você estudará:

• Como encontrar a moda.

• Como rearranjar os dados para encontrar a moda.

• Como pode ser aplicada.

• Comparação entre as diferentes moda.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para compor a moda?

• É possível extrair a moda a partir de tabelas?

• Como aplicar a moda correta?

• Quais exemplos práticos podemos aplicar para compor a moda?

Em estatística denominam-se medidas de tendência central: a média, a mediana e a moda. Essas medidas dependem da definição de centro de um conjunto de valores ou de uma distribuição que pode ser interpretada de várias maneiras. A moda é o valor mais típico e representativo de uma distribuição. Ela representa o seu valor mais provável. Como a mediana, a moda também não é influenciada pelos valores extremos da distribuição e não permite manipulações algébricas como a fórmula da média.

Existem algumas relações entre as diversas medidas de posição:

1) Para qualquer série, exceto quando no caso de todas as observações coincidirem em um único valor, a média aritmética é sempre maior que a média geométrica, a qual, por sua vez, é maior que a média harmônica.

2) Para uma distribuição simétrica e unimodal, média = mediana

= moda

3) Para uma distribuição positivamente assimétrica, média >

mediana > moda. A distância entre a mediana e a média é cerca de um terço da distância entre a moda e a média.

UNIDADE 4

TEMA 5:

MODA

Conteúdos e Habilidades

Leitura Obrigatória

A moda é o valor mais típico e representativo de uma distribuição.

Ela representa o seu valor mais provável.

(31)

PROBABILIDADE E ESTATÍSTICA Unidade 4

4) Para uma distribuição negativamente assimétrica, média <

mediana < moda. A distância entre a mediana e a média é cerca de um terço da distância entre a moda e a média.

A moda de uma distribuição de frequência pode muitas vezes ser aproximada pelo ponto médio de uma classe modal – a classe com maior densidade de frequência. É possível calcular os valores aproximados da mediana e da moda para dados agrupados quando o último intervalo de classe tem limite superior indeterminado. No caso da mediana isso é imediato e no caso da moda, o seu cálculo somente pode ser feito se a última classe não for a classe modal sendo necessário primeiramente calcular as densidades de frequência.

Infelizmente em algumas situações não é possível calcular a média e temos que contar apenas com a mediana como medida de posição (ou de tendência central) de uma distribuição estatística.

Exemplo 1:

Os dados abaixo se referem à idade de 20 alunos de uma turma de 6o.

Ano.

Idade: {12, 11,12,13,12,11,13,12,12,11,14,13,13,12,11,12,13,14,11,14}

A moda deste conjunto de dados será a idade que mais aparece, ou seja, 12, pois é a idade que aparece mais vezes no conjunto.

Frequência: Em estatística, a frequência (ou frequência absoluta) de um evento i é o número n_i de vezes que o evento ocorreu em um experimento ou estudo.1 :12-19 Essas frequências são normalmente representadas graficamente em histogramas.

Exemplo 2

A tabela abaixo apresenta as notas em matemática de uma turma de 30 alunos.

(32)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Na coluna da esquerda temos as notas na disciplina de matemática e na coluna da direita, quantos alunos obtiveram a respectiva nota. Dessa forma, podemos observar que a nota que mais aparece nesse conjunto de dados é 7. Portanto a Mo =7.

Exemplo 3

Os dados abaixo são referentes ao número dos calçados vendidos em uma loja num determinado dia.

{35,33,36,35,37,36,39,40,43,35,36,42}

Nesse caso, existem dois números de sapatos que aparecem mais vezes: 35 e 36. Logo, a moda pode ser: Mo=35 ou 36. Quando isso ocorre dizemos que o conjunto de dados é bimodal.

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas mas ela não é afetada pelos valores das observações externas

2) sua fórmula não é passível de manipulação algébrica

3) seu valor pode ser obtido, como vimos, em distribuições, com limites superiores indeterminados para a sua última classe

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.

Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.

pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_

ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.

Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, como calcular a moda adequadamente nas mais variadas circunstâncias estatísticas.

Finalizando

Links Importantes

(33)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Média

Somatória dos dados dividida pelo número total de elementos.

Mediana

É o valor do item central da série quando estes são arranjados em ordem de magnitude.

Finito

Número determinado.

Geométrico

É um ramo da matemática preocupado com questões de forma, tamanho e posição relativa de figuras e com as propriedades do espaço.

Glossário

(34)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Nesta aula, você estudará:

• Como encontrar as médias.

• Que tipo de dados podem ser utilizados para compor a média.

• Como pode ser aplicada.

• Comparação entre as diferentes médias.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para compor a média?

• É possível extrair a média a partir de tabelas?

• Como aplicar a média correta?

• Quais exemplos práticos podemos aplicar para compor a média?

A junção de dados para compor a média.

Existem vários tipos de média. Um exemplo é a média arimética não ponderada, que é definida como a soma das observações dividida pelo número de observações. Para que ela possa ser utilizada, devem ser verificadas algumas propriedades, como:

- A média é um valor típico, ou seja, um ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de dados sem mudar o total.

- A soma dos desvios das observações em relação à média é igual a zero.

- A soma dos desvios elevados ao quadrado das observações em relação à média é menor que qualquer soma de quadrados de desvios em relação a qualquer outro número.

Segundo Neder, a ideia básica de selecionar um número tal que a soma dos quadrados dos desvios em relação a este número é minimizada tem grande importância na teoria estatística. Foi denominado de o “princípio dos mínimos quadrados”. Ela é, por exemplo, a base racional do método dos mínimos quadrados que é usado para ajustar a melhor.

Conteúdos e Habilidades

TEMA 6:

MÉDIA

Leitura Obrigatória

(35)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Um outro tipo é a média aritmética ponderada. Nesta, todos os valores observados foram somados atribuindo-se o mesmo peso a todas as observações. A soma dos pesos não pode ser igual a zero. Fora disto, não existe restrição para os valores dos pesos. Se todos os pesos forem iguais a 1, a média ponderada recai em seu caso particular: a média aritmética não ponderada. O mesmo ocorre se todos os pesos forem iguais a uma constante. Portanto, a média aritmética não ponderada na realidade é uma média artimética ponderada com pesos iguais.

Frequentemente encontramos populações cujas unidades elementares podem ser classificadas em duas categorias: uma que tem certo atributo e outra que não tem esse atributo. Nesse caso, estamos interessados na proporção de casos que possuem esse atributo. Uma proporção comumente é pensada como uma fração ou porcentagem, mas também pode ser pensada como um caso especial de média.

A média geométrica de uma amostra é definida como a raiz enésima do produto nos valores amostrais. A média aritmética é maior do que a média geométrica para qualquer série de valores positivos, com exceção do caso em que os valores da série são todos iguais, quando as duas médias coincidem. O cálculo da média geométrica é simples, porém a interpretação e suas propriedades tornam-se mais evidentes quando reduzimos a fórmula à sua forma logarítmica.

A conclusão a que chegamos é que o logaritmo da média geométrica é igual à média aritmética dos logaritmos dos valores da série. Verifica- se que a média geométrica somente tem significado quando todos os valores da série são positivos.

A mais importante aplicação da média geométrica refere-se talvez ao cálculo de taxas de crescimento médias, desde que essas possam ser corretamente medidas somente por esse método.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.

Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.

pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_

ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.

Acesso em 29 de setembro de 2014.

Links Importantes

(36)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Neste tema você aprendeu, brevemente, como ocorreram os elementos do gráfico e como classificá-los adequadamente nas mais variadas circunstâncias estatísticas.

Média

Somatória dos dados dividida pelo número total de elementos.

Aritmética

É o ramo da matemática que lida com números e com as operações possíveis entre eles.

Ponderada

Parâmetro utilizado para atribuir a maior ou a menor grandeza, evidenciando o valor ponderado.

Geométrico

É um ramo da matemática preocupado com questões de forma, tamanho e posição relativa de figuras, e com as propriedades do espaço.

Finalizando

Glossário

(37)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Nesta aula, você estudará:

• Como encontrar a mediana.

• Como rearranjar os dados para encontrar a mediana.

• Como pode ser aplicada.

• Comparação entre as diferentes medianas.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para compor a mediana?

• É possível extrair a mediana a partir de tabelas?

• Como aplicar a mediana correta?

• Quais exemplos práticos podemos aplicar para compor a mediana?

A mediana é o valor numérico que separa a metade superior de uma amostra de dados, uma população ou uma distribuição de probabilidade, a partir da metade inferior. A mediana de uma lista finita de números pode ser encontrada a partir do valor mais baixo para o valor mais alto, sempre pelo meio. Exemplo: {1,3,5,7,11} – a mediana é 5. Se houver número par, não existe mediana, sendo então definido como a média dos valores os dois valores do meio. Exemplo: {1,3,5,7} – a mediana neste caso é a média dos dois valores do meio: (3+5/2)=4. Para estatísticas robustas, ela é fundamental, já que é resistente. Ela é independente de qualquer distância métrica, já uma média geométrica é definida em qualquer número de dimensão.

Uma aplicação da mediana é utilizá-la como medida de localização quando a distribuição é desviada, quando os valores finais não são conhecidos ou quando se exige reduzida importância para ser anexado, por exemplo, uma vez que podem existir erros de medição.

Em termos de notação, alguns autores representam a mediana de uma variável x ou como notação padrão μ1/21 por vezes também M3 . Não há um símbolo amplamente aceito para a mediana, de modo que o uso

Conteúdos e Habilidades

TEMA 7:

MEDIANA

Leitura Obrigatória

A mediana é o valor numérico que separa a metade superior de uma amostra de dados, uma população ou uma distribuição de probabilidade, a partir da metade inferior.

(38)

PROBABILIDADE E ESTATÍSTICA Unidade 4

A mediana então é o valor que ocupa a posição central da série de observações de uma variável, em rol, dividindo o conjunto em duas partes iguais, ou seja, a quantidade de valores inferiores à mediana é igual 1a quantidade de valores superiores à mesma.

Este procedimento pode tornar-se inadequado quando o conjunto de dados for composto por muitos elementos.

Ela pode ser representada por Md, sendo a medida que divide um conjunto de dados ordenado em duas partes iguais: 50% dos valores ficam abaixo e 50% ficam acima da mediana. Existem dois casos diferentes para o cálculo da mediana, mas em ambos o primeiro passo a ser tomado é a ordenação dos dados.

1º. caso: quando o n é ímpar:

Determinamos, primeiramente, a posição mais central (p) do conjunto de dados ordenado

p = n+1/2

A mediana será o valor do conjunto de dados que ocupa a posição p, ou seja, Md = xp

Exemplo:

Se X = tempo (h)

Para xi = 4, 5, 7, 9, 10, temos:

p = n+1/2 –> 5+1/2 = 3, logo

Md = xp = x3 = 7h

2. caso: quando o n é par:

Neste caso, temos duas posições centrais no conjunto de dados ordenado, denotadas por p1 e p2. Ao utilizarmos a expressão p = n+1/2, obtemos um valor não inteiro. As posições p1 e p2 são os dois inteiros mais próximos do valor de p. A mediana será a média aritmética simples dos valores do conjunto de dados que ocupam as posições p1 e p2, ou seja,

Md = xp1 + xp2/2

Exemplo:

Se X = tempo (h)

Para x1 = 4, 5, 7, 9, 10, 12, temos:

p = n+1/2 = 6+1/2 = 3,5 (p1 = 3 e p2 = 4), logo

Md – xp1 + xp2/2 = X3+x4/2 = 7+9/2 = 8h

(39)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas mas ela não é afetada pelos valores das observações externas

2) sua fórmula não é passível de manipulação algébrica

3) seu valor pode ser obtido, como vimos, em distribuições, com limites superiores indeterminados para a sua última classe

4) a mediana é a estatística mais adequada para descrever observações que são ordenadas ao invés de medidas.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.

Disponível em: http://www.norg.uminho.pt/emgpf/documentos/Aplicada.

pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_

ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.

Acesso em 29 de setembro de 2014.

Neste tema você aprendeu, brevemente, como calcular a mediana adequadamente nas mais variadas circunstâncias estatísticas.

Média

Somatória dos dados dividida pelo número total de elementos.

Mediana

É o valor do item central da série quando estes são arranjados em ordem de magnitude.

Finito

Número determinado.

Geométrico

Links Importantes

Finalizando

Glossário

(40)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Nesta aula, você estudará:

• Como encontrar o percentis.

• Quais ferramentas são necessárias para encontrar o percentis.

• Como pode ser aplicado.

• Comparação entre os diferentes percentis.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o percentil?

• É possível extrair o percentil a partir de tabelas?

• Como aplicar o percentil nas mais variadas situações ?

• O percentil é o ponto final do dado que pode ser obtido ?

A mediana é o valor que divide a amostra em duas partes iguais, deixando exatamente 50% das observações de cada lado. Também poderíamos dividir em quatro partes iguais, cada uma contendo 25% dos dados.

Nesse caso cada uma das partes seria um quartil.

O primeiro quartil escreve-se abreviadamente Q1/4 correspondendo a 25% dos dados. O segundo quartil Q2/4, corresponde à mediana. O terceiro quartil Q3/4, corresponde a 75% das observações. O seu cálculo é análogo ao da mediana. Começa-se por determinar a respectiva classe observando as frequências relativas acumuladas.

Conteúdos e Habilidades

TEMA 8:

QUARTIS

Leitura Obrigatória

(41)

PROBABILIDADE E ESTATÍSTICA Unidade 4

A amostra também pode ser dividida em 10 partes de 10% cada, originando os decis ou em 100 partes de 1% obtendo-se os percentis.

Denomina-se quartis os valores de uma série que a dividem em quatro partes iguais. Precisamos, portanto, de 3 quartis (Q1, Q2 e Q3) para dividir a série em quatro partes iguais. O quartil 2 (Q2) sempre será igual a mediana da série. O método mais prático é utilizar o principio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas “3 medianas” em uma mesma série.

Exemplo 1:

Calcule os quartis da série: {5,2,6,9,10,13,15} .

O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: {2,5,6,9,10,13,15}. O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md=9 que será = Q2.

Temos agora {2,5,6} onde o Q1=5 e {10,13,15} e o Q3=13, como sendo os dois grupos de valores iguais proporcionados pela mediana (quartil 2). Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes

(42)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Exemplo 2:

Calcule os quartis da série: {1,1,2,3,5,5,6,7,9,9,10,13}

- Quarti 2 = Md = (5+6)/2 = 5,5

- Quartil 1 será a mediana da série à esquerda de Md: {1,1,2,3,5,5,}

→ Q1 = (2+3)/2 = 2,5

- Quartil 3 será a mediana da série à direita de Md: {6,7,9,,9,10,13}

→ Q3 = (9+9)/2 = 9

Importante

1) seu valor é afetado pelo número de observações e como elas estão distribuídas mas ela não é afetada pelos valores das observações externas

2) para facilitar encontrar o quartil, divida o valor por quatro e encontrará: Q1; Q2; Q3;Q4.

Leia o artigo: Estatística Aplicada, da autora Edite Manuela Fernandes.

Disponível em: http://www.norg.uminho.pt/emgpf/documentos/

Aplicada.pdf Acesso em 29 de setembro de 2014. A apostila fundamenta or principais conceitos relacionados a preparação da tabela e suas aplicações, dentre outros tópicos.

Leia o artigo: Conceito de estatítisca aplicada, do autor Henrique Dantas Neder. Disponível em: http://www.ecn26.ie.ufu.br/TEXTOS_

ESTATISTICA/NOTAS%20DE%20AULA%20DE%20ESTATISTICA.pdf.

Acesso em 29 de setembro de 2014.

Quartil

É o valor obtido a partir da divisão por quatro.

Variância

É o agrupamento de dados.

Média aritmética

Média de todos os dados da amostra.

População

É o agrupamento de dados.

Links Importantes

Glossário

(43)

PROBABILIDADE E ESTATÍSTICA Unidade 4

Nesta aula, você estudará:

• Como encontrar o percentis.

• Quais ferramentas são necessárias para encontrar o percentis.

• Como pode ser aplicado.

• Comparação entre os diferentes percentis.

Ao final, você deverá ser capaz de responder às seguintes questões:

• Todos os dados podem ser utilizados para encontrar o percentil?

• É possível extrair o percentil a partir de tabelas?

• Como aplicar o percentil nas mais variadas situações ?

• O percentil é o ponto final do dado que pode ser obtido ?

O percentil é uma ferramenta da matemática e da estatistica muito uitlizada em pediatria, que serve para comparar individualmente uma criança, com um grupo modelo de outras 100 crianças com a mesma idade (Per cem = per cento = por cem = porcento). As curvas de percentis são representações gráficas com linhas que permitem fazer estas comparações. Os devios no posicionamento de um indivíduo numa curva de percentil, não devem ser interpretados como presença de doença. Os percentis são só e apenas, o modo de comparar em relação a determinados parâmetros, indivíduos do mesmo sexo e com a mesma idade.

O crescimento é um importante indicador do bem estar de uma criança e está sujeito a muitas influências. Entre elas destacam-se a genética da própria criança, a sua alimentação e a ausência de doenças. Uma alteração de qualquer de um destes fatores isoladamente ou em conjunto, vai influenciar e modificar o seu crescimento. As curvas de percentis usam-se na idade pediátrica mais do que qualquer outra idade, de modo a monitorar o crescimento e os desvios, para que se possa intervir em caso de necessidade. Há diversas tabelas e curvas de percentis para além do crescimento. As curvas de percentis são difíceis de se construir

Conteúdos e Habilidades

TEMA 9:

PERCENTIS

Leitura Obrigatória

Referências

Documentos relacionados

Tendo em vista que a manipulação provoca uma diminuição do comportamento sexual e alterações no sistema olfatório, e que feromônios oriundos de ratos machos

23 - Produção de leite no período de 01.01 a 31.12 e participação no total da produção, segundo as Unidades da Federação e os 20 municípios com as maiores produções - 2006..

Primeiramente, a partir das informações presentes no Anuário do transporte aéreo 2010, da Agência Nacional de Aviação Civil - ANAC, foi composta uma matriz de

7.2.4 - Rendimento médio mensal real de todos os trabalhos das pessoas de 10 anos ou mais de idade, ocupadas na semana de referência, com rendimento de trabalho, por Grandes

O Suplemento de Cultura da Pesquisa de Informações Básicas Municipais 2006 disponibiliza informações fundamentais sobre um campo específi co de coleta de dados com o objetivo

111 - Municípios, total e com Política Municipal de Saneamento Básico, por abrangência política de alguns serviços, segundo as Grandes Regiões e as classes de tamanho da

Na seleção de produtos, em cada detalhamento geográfico para os quais são divulgados os índices e para cada atividade, buscou-se identificar aqueles responsáveis por, no mínimo,

1.1.2 - Estimativas, total e percentual, de escolares frequentando o 9 º ano do ensino fundamental em escolas que informaram possuir sala ou laboratório de informática para uso