• Nenhum resultado encontrado

Aula 00 Estatística Descritiva. Prof. Arthur Lima. Noções de Probabilidade e Estatística para Técnico Bancário Novo da CEF

N/A
N/A
Protected

Academic year: 2021

Share "Aula 00 Estatística Descritiva. Prof. Arthur Lima. Noções de Probabilidade e Estatística para Técnico Bancário Novo da CEF"

Copied!
107
0
0

Texto

(1)

Aula

00

Estatística

Descritiva

Noções de Probabilidade e Estatística para Técnico

Bancário Novo da CEF

(2)

Sumário

SUMÁRIO ...2

APRESENTAÇÃO ... 3

ORGANIZAÇÃO DO CURSO ... 5

RAMOSDAESTATÍSTICA... 6

CONCEITOSINTRODUTÓRIOSDEESTATÍSTICA... 6

TABELASEGRÁFICOS ... 8

Tabelas estatísticas ... 8

Gráficos estatísticos ... 13

Simetria de uma distribuição de dados ... 15

MEDIDASESTATÍSTICAS ... 17

Média ... 18

Cálculo da média para uma lista de dados (“dados em rol”) ... 18

Cálculo da média para uma tabela de frequências ... 21

Cálculo da média para dados agrupados em classes ... 24

Propriedades da média aritmética ... 27

Média aritmética ponderada ... 29

Mediana ... 32

Moda ... 38

Simetria – média, mediana e moda ... 43

VALORESPERADO ... 45

QUESTÕES COMENTADAS PELO PROFESSOR ...48

LISTA DE QUESTÕES... 85

GABARITO ... 103

(3)

Apresentação

Olá, tudo bem? Sou o professor Arthur Lima. Seja muito bem-vindo a esse meu curso! Aqui na DIREÇÃO CONCURSOS sou responsável pelas disciplinas de Matemática, Raciocínio Lógico, Matemática Financeira e Estatística. Também sou um dos coordenadores do site.

Caso não me conheça, sou Engenheiro Aeronáutico pelo Instituto Tecnológico de Aeronáutica (ITA). Fui aprovado nos concursos de Auditor-Fiscal e Analista-Tributário da Receita Federal, e exerci o cargo de Auditor por 6 anos. Na Receita Federal, atuei no combate à fraude na importação e exportação no Porto de Manaus e no Aeroporto de Guarulhos. Além disso, assumi a função de chefe da Divisão de Fiscalização Aduaneira, que tem sede em Brasília e é responsável pela fiscalização do comércio exterior em todo o Brasil.

Antes da Receita Federal, fui engenheiro na EMBRAER S/A por 5 anos. Sou professor há 11 anos, sendo 4 em preparatórios para vestibular e 7 em preparatórios para concursos públicos. Ao longo deste tempo pude ver muitos alunos sendo aprovados nos concursos públicos mais disputados do país – e pude ver inúmeros alunos que tinham MUITA DIFICULDADE em exatas superarem o “trauma” e conseguirem excelentes desempenhos em suas provas. Espero que o mesmo aconteça contigo! Sempre me preocupo muito em atender os alunos com maior dificuldade, pois sei que o ensino de exatas no Brasil é muito ruim. Estaremos juntos nesta jornada até a sua APROVAÇÃO, combinado? E vamos encurtar este caminho!

É com MUITA ALEGRIA que inicio este curso de PROBABILIDADE E ESTATÍSTICA. A programação de aulas, que você verá mais adiante, foi concebida especialmente para a sua preparação focada no concurso para Técnico Bancário Novo da CAIXA ECONÔMICA FEDERAL (CEF). Tomei por base o edital lançado dia 09 DE SETEMBRO DE 2021, e cobriremos TODOS os tópicos exigidos pela banca CESGRANRIO, ok? Nada vai ficar de fora, este curso deve ser o seu ÚNICO material de estudo! E você também não perderá tempo estudando assuntos que não serão cobrados na sua prova. Deste modo, você aproveita o tempo da melhor forma possível, estuda de modo totalmente focado, e aumenta as suas chances de aprovação.

Neste material você terá:

Curso completo em VÍDEO

teoria e exercícios resolvidos sobre TODOS os pontos do edital

Curso completo escrito (PDF)

teoria e MAIS exercícios resolvidos sobre TODOS os pontos do edital

Acesso direto ao professor

(4)

Você nunca estudou PROBABILIDADE E ESTATÍSTICA para concursos? Não tem problema, este curso também te atende. Nós veremos toda a teoria que você precisa e resolveremos centenas de exercícios para que você possa praticar bastante cada aspecto estudado. Minha recomendação, nestes casos, é que você comece assistindo as videoaulas, para em seguida enfrentar as aulas em PDF. E fique à vontade para me procurar no fórum de dúvidas sempre que for necessário.

Caso você queira tirar alguma dúvida antes de adquirir o curso, basta me enviar um email ou um direct pelo Instagram:

(5)

Organização do curso

Como já adiantei, neste curso nós veremos o que foi exigido pela banca CESGRANRIO no edital publicado dia 09 DE SETEMBRO DE 2021. Os tópicos cobrados foram os seguintes:

Concurso CEF – CARGO: TÉCNICO BANCÁRIO NOVO Disciplina: Noções de Probabilidade e Estatística

Conteúdo: 1 - Representação tabular e gráfica. 2 - Medidas de tendência central (média, mediana, moda, medidas de posição, mínimo e máximo) e de dispersão (amplitude, amplitude interquartil, variância, desvio padrão e coeficiente de variação). 3 - Cálculo de probabilidade. 4 - Teorema de Bayes e Probabilidade condicional. 5 - População e amostra. 6 - Correlação linear simples.

Para cobrir este edital integralmente, o nosso curso está organizado da seguinte forma:

Aula Data Conteúdo do edital

00 10/09

1 - Representação tabular e gráfica; 2 - Medidas de tendência central (média, mediana, moda, medidas de posição, mínimo e

máximo); 5 - População e amostra;

01

11/09

Medidas de

dispersão (amplitude, amplitude interquartil,

variância, desvio padrão e coeficiente de variação);

11/09

Teste de Direção

02

13/09

Princípios de contagem (Pré-requisito para

Probabilidade)

03

13/09

Cálculo de Probabilidade. Probabilidade condicional e

independência

13/09

Teste de Direção

04

14/09

Covariância e Correlação Linear Simples

(6)

RAMOS DA ESTATÍSTICA

A Estatística se divide em dois ramos principais:

a) Estatística Descritiva (ou Dedutiva): tem por objetivo descrever um conjunto de dados, resumindo as

suas informações principais. Fazem parte deste ramo tanto as técnicas para coletar os dados (técnicas de amostragem) quanto as técnicas para o cálculo dos principais parâmetros (características) daquele grupo de dados coletados. Também fazem parte deste ramo da Estatística as técnicas para a apresentação de dados em tabelas e gráficos, bem como o cálculo de medidas utilizadas para resumir estes dados (média, moda, mediana, desvio padrão, etc.).

b) Estatística Inferencial (ou Indutiva): tem por objetivo inferir/induzir, a partir das informações de um

conjunto de dados (amostra), informações sobre um conjunto mais amplo (população). A teoria da Probabilidade faz parte deste ramo, pois nela o nosso objetivo é, a partir do conhecimento de um fenômeno (ex.: lançamento de um dado), inferir possíveis resultados para a ocorrência de um determinado evento. Também fazem parte da estatística inferencial os testes de hipóteses, que visam obter conclusões sobre uma população a partir da análise de um subconjunto desta (amostra).

Nesta aula veremos os aspectos introdutórios da Estatística Descritiva e também conheceremos as principais medidas de posição ou de tendência central: as famosas Média, Mediana e Moda.

CONCEITOS INTRODUTÓRIOS DE ESTATÍSTICA

Para começarmos o estudo da Estatística Descritiva precisamos conhecer alguns conceitos básicos:

- População: é o conjunto de todas as entidades sob estudo. Por exemplo, podemos realizar um estudo estatístico sobre a população da cidade de São Paulo, ou então sobre a população de alunos matriculados na escola A, ou então sobre a população de animais de estimação do meu bairro. Repare que todos os integrantes de uma determinada população possuem uma característica em comum que os permite reunir em um único grupo: morar em São Paulo, estar matriculado na escola A, ser animal de estimação no meu bairro, etc.

- Censo: quando efetuamos o censo de uma população, analisamos todos os indivíduos que compõem aquela população. Por exemplo: podemos contar um por um os moradores de Brasília, ou todos os alunos da escola A, ou todos os animais de estimação de meu bairro. Normalmente o nosso interesse não é simplesmente contá-los, mas sim verificar um determinado atributo, ou característica que esses indivíduos possuem. Exemplificando, pode ser que queiramos saber, de todos os moradores de Brasília, quantos são homens, ou quantos tem mais de 1,80m de altura, ou quantos ganham mais que R$1.000,00 por mês.

- Amostra: em muitos casos é inviável, custoso ou desnecessário, observar um por um dos membros de uma determinada população. Se queremos saber qual o percentual de homens na população de Brasília, podemos analisar um subconjunto daquela população, isto é, uma amostra. Se a amostra for suficientemente grande (e bem escolhida, de acordo com o que veremos nesta aula), é possível que o percentual de homens da

(7)

- Variável: é um atributo ou característica (ex: sexo, altura, salário etc.) dos elementos de uma população que pretendemos avaliar. Conforme o nosso estudo e o nosso objetivo, podemos olhar variáveis diferentes de uma mesma população. Por exemplo, podemos fazer uma análise da população de São Paulo a respeito do salário e idade de cada cidadão.

- Observação: trata-se do valor que a variável assume para um determinado membro da população. Ex.: a observação da variável SEXO referente a João, membro da população brasiliense, tem valor “Masculino”. Já a observação da variável “idade“ referente ao professor Arthur Lima, morador de São Paulo, é igual a 35 anos.

Uma variável pode ser classificada em:

- qualitativa, quando não assume valores numéricos, podendo ser dividida em categorias. Ex.: o sexo dos moradores de Brasília é uma variável qualitativa, pois pode ser dividido nas categorias Masculino ou Feminino. Se o objetivo fosse verificar quantos moradores possuem AIDS, teríamos outra variável qualitativa, dividida nas categorias SIM e NÃO.

- quantitativa, quando puder assumir diversos valores numéricos. Ex.: a altura dos moradores é uma variável quantitativa: 1,80m; 1,55m; 1,20m; 2,10m etc. O mesmo ocorre com os salários desses moradores. As variáveis quantitativas podem ser ainda divididas em:

contínuas: quando a variável pode assumir infinitos valores entre dois números. Ex.: a variável Altura é contínua. Se alguém tem exatamente 1,80m, e outra pessoa tem 1,81m, você concorda que existem infinitas alturas entre essas duas? Por exemplo, é possível que alguém tenha 1,80000001m. Ou 1,80000000001m. E assim por diante.

discretas: quando a variável só pode assumir uma quantidade finita de valores entre dois números. Ex.: se uma pessoa tem 3 irmãos e outra pessoa tem 7 irmãos, quantas possibilidades temos entre as duas? Ora, temos 4, 5 ou 6 irmãos apenas. É um número finito de possibilidades (três), de modo que a variável “quantidade de irmãos de uma pessoa” é discreta.

Chamamos uma variável de Variável Aleatória quando ela pode assumir, de maneira aleatória (“ao acaso”), qualquer dos seus valores. Em estatística trabalharemos sempre com variáveis aleatórias, que representamos por letras maiúsculas. Ex.: X pode ser a variável “idade dos moradores de Brasília”. Utilizamos letras minúsculas para representar valores específicos daquela variável. Exemplificando, x = 25 anos é um dos valores possíveis para a variável aleatória X.

(8)

- variáveis nominais: são aquelas definidas por “nomes”, não podendo ser colocadas em uma ordem crescente. Ex.: a variável “sexo dos moradores de um bairro” é nominal, pois só pode assumir os valores “masculino” ou “feminino”. Veja que não há uma ordem clara entre esses dois possíveis valores (não há um valor maior e outro menor).

- variáveis ordinais: são aquelas que podem ser colocadas em uma ordem crescente, mas não é possível (ou não faz sentido) calcular a diferença entre um valor e o seguinte. Ex.: numa escola onde as notas dos alunos sejam dadas em letras (A, B, C, D ou E), sabemos que a menor nota é “E” e a maior é “A”. Embora seja possível ordenar as notas, não podemos mensurar quanto seria, por exemplo, a subtração A – B.

- variáveis intervalares: são aquelas que podem ser colocadas em uma ordem crescente, e é possível calcular a diferença entre um valor e o seguinte. Ex.: se as notas dos alunos forem dadas em números (de 0 a 10), sabemos que a nota 5 é maior que a nota 3, e que a diferença entre elas é 5 – 3 = 2.

Antes de prosseguir, trabalhe esta questão:

CESPE – CORREIOS – 2011) Julgue os itens seguintes, relacionados aos conceitos de estatística.

( ) Escolaridade e número de filhos são exemplos de variáveis quantitativas ordenável e discreta, respectivamente.

RESOLUÇÃO:

A variável “Escolaridade” pode assumir valores como: Nível Fundamental, Nível Médio, Nível Superior, Pós-Graduação etc. Trata-se, portanto, de uma variável qualitativa, e não quantitativa. Isto já torna o item ERRADO. Já a variável número de filhos é, de fato, quantitativa. Trata-se realmente de uma variável discreta, uma vez que o número de filhos pode ser {0, 1, 2, 3 ...}, mas não pode assumir qualquer valor entre 0 e 1, ou entre 1 e 2, por exemplo.

Resposta: E

TABELAS E GRÁFICOS

Tabelas estatísticas

Como já vimos, a estatística descritiva tem por objetivo descrever um conjunto de dados, resumindo as suas informações principais. Para isso, as tabelas e gráficos estatísticos são ferramentas muito importantes. Vamos começar tratando das tabelas.

Para descrever um conjunto de dados, um recurso muito utilizado são tabelas como essa abaixo, referente à observação da variável “Sexo dos moradores de Brasília”:

(9)

Valor da variável

Frequências (Fi)

Masculino 23

Feminino 27

Note que na coluna da esquerda colocamos as categorias de valores que a variável pode assumir, e na coluna da direita colocamos o número de Frequências, isto é, o número de observações (ou repetições) relativas a cada um dos valores. Note que foi analisada uma amostra de 50 pessoas, das quais 23 eram homens e 27 mulheres. Estes são os valores de frequências absolutas. Podemos ainda representar as frequências relativas (percentuais): sabemos que 23 em 50 são 46%, e 27 em 50 são 54%. Portanto, teríamos:

Valor da variável

Frequências relativas (Fi)

Masculino 46%

Feminino 54%

Se essa amostra foi bem escolhida, ela nos dá uma boa estimativa de como é distribuída a população brasiliense: cerca de 46% são homens e 54% mulheres. Quanto maior a amostra (e mais bem escolhida), mais nos aproximaremos dos percentuais que seriam obtidos na análise de toda a população.

Note que a frequência relativa é dada por Fi / n, onde Fi é o número de frequências de determinado valor da variável, e n é o número total de observações.

Agora, veja a tabela abaixo, referente à observações da variável Altura dos moradores de Brasília:

Valor da variável

Frequências (Fi)

1,50m 15 1,51m 5 1,53m 4 1,57m 2 1,60m 10 1,63m 8 1,65m 1 1,71m 20

(10)

1,73m 10

1,75m 3

1,83m 2

Quando temos uma variável como esta, que pode assumir um grande número de valores distintos, é interessante “resumir” os dados, criando intervalos de valores para a variável (que chamaremos de classes). Veja um exemplo:

Classe

Frequências (Fi)

1,50| – 1,60 26

1,60| – 1,70 19

1,70| – 1,80 33

1,80| – 1,90 2

O símbolo | significa que o valor que se encontra ao seu lado está incluído na classe. Por exemplo, 1,50| - 1,60 nos indica que as pessoas com altura igual a 1,50 são contadas entre as que fazem parte dessa classe, porém as pessoas com exatamente 1,60 não são contabilizadas.

Assim, temos as seguintes formas de criar as classes, onde “li” é o limite inferior da classe (menor valor, ex.: 1,50) e “Li” é o limite superior (o maior valor, ex.: 1,60):

li| – Li : limite inferior incluído na classe li – |Li : limite superior incluído na classe

li| – |Li : limite inferior e superior incluídos na classe li – Li : limite inferior e superior excluídos da classe

Veja abaixo novamente a última tabela, agora com a coluna Frequências absolutas acumuladas à direita: Classe Frequências (Fi) Frequências absolutas

acumuladas (Fac)

1,50| – 1,60 26 26

1,60| – 1,70 19 45

1,70| – 1,80 33 78

(11)

A coluna da direita exprime o número de indivíduos que se encontram naquela classe ou abaixo dela. Isto é, o número acumulado de frequências do valor mais baixo da amostra (1,50m) até o limite superior daquela classe. Veja que, para obter o número 45, bastou somar 19 (da classe 1,60| - 1,70) com 26 (da classe 1,50| - 1,60). Isto é, podemos dizer que 45 pessoas possuem altura inferior a 1,70m (limite superior da última classe). Analogamente, 78 pessoas possuem altura inferior a 1,80m.

De posse das frequências absolutas acumuladas, podemos calcular as frequências relativas acumuladas, que nada mais é que o percentual de indivíduos cujo valor da variável (altura) é inferior a um determinado limite. Veja isso na coluna da direita da tabela abaixo:

Classe Frequências (Fi) Frequências absolutas acumuladas (Fac) Frequências relativas acumuladas (Frc) 1,50| – 1,60 26 26 32,50% 1,60| – 1,70 19 45 56,25% 1,70| – 1,80 33 78 97,50% 1,80| – 1,90 2 80 100%

Portanto, podemos concluir que 32,50% dos indivíduos observados possuem menos de 1,60m. Já 56,25% possuem menos de 1,70m, e 97,50% tem menos de 1,80. Por fim, todos os indivíduos (100%) tem altura inferior a 1,90m, já que o maior valor observado foi 1,83m.

Note que, para calcular o valor das frequências relativas acumuladas (Frc), bastou dividir o valor das frequências absolutas acumuladas (Fac) por n, que é o total de observações (n = 80 neste exemplo).

Antes de prosseguirmos, vejamos um exercício sobre tabelas estatísticas.

Instruções: Para resolver a questão seguinte, considere a tabela de frequências relativas abaixo, que mostra a

distribuição dos valores arrecadados, em 2008, sobre determinado tributo, referente a um ramo de atividade escolhido para análise. Sabe-se que:

I. As frequências absolutas correspondem às quantidades de recolhimentos, sendo as frequências relativas do segundo e terceiro intervalos de classe iguais a x e y, respectivamente.

(12)

FCC – SEFAZ/SP – 2009 – Adaptada) A porcentagem de recolhimentos com valores arrecadados maiores ou iguais a R$ 3.000,00 é (A) 70% (B) 65% (C) 55% (D) 45% (E) 40% RESOLUÇÃO:

Observe que as frequências relativas somam 1, ou seja, 100%. Ou seja: 0,10 + x + y + 0,20 + 0,10 = 1

x = 0,60 – y

Como foi dito que o número de recolhimentos do terceiro intervalo é o dobro 0do número de recolhimentos do segundo, então também podemos dizer que as frequências relativas do terceiro intervalo (y) são o dobro das freqüências relativas do segundo (x):

y = 2x Substituindo y por 2x na primeira equação, temos:

x = 0,60 – 2x 3x = 0,60

x = 0,20 Com isso,

y = 2x = 2.0,20 = 0,40 Com isso, temos a seguinte tabela:

(13)

Assim, a porcentagem de valores arrecadados iguais ou superiores a 3000 reais é a soma das frequências relativas das três classes mais altas:

0,40 + 0,20 + 0,10 = 0,70 = 70% Resposta: A

Gráficos estatísticos

Gráficos também são muito utilizados no estudo da Estatística Descritiva. O principal deles, conhecido como Histograma, é um gráfico de barras que representa, no seu eixo horizontal, as classes de valores que uma variável pode assumir, e em seu eixo vertical os valores das frequências de cada classe. Para exemplificar, vamos utilizar os dados da tabela abaixo, que já usamos anteriormente:

Classe Frequências (Fi) Frequências absolutas acumuladas (Fac) Frequências relativas acumuladas (Frc) 1,50| – 1,60 26 26 32,50% 1,60| – 1,70 19 45 56,25% 1,70| – 1,80 33 78 97,50% 1,80| – 1,90 2 80 100%

(14)

Note que, de fato, temos 26 frequências na classe 1,50|-- 1,60; 19 na classe 1,60|-- 1,70; e assim sucessivamente. Podemos traçar ainda o gráfico das frequências absolutas acumuladas, que normalmente é representado por uma linha como esta abaixo:

Este gráfico de frequências acumuladas acima, onde ligamos os pontos extremos (limites superiores) das classes de valores, é conhecido como ogiva. Chamamos a figura formada no gráfico de polígono de frequências. Note que, no gráfico de frequências acumuladas, colocamos apenas o limite superior de cada classe de dados. Veja, por exemplo, que 78 frequências ocorrem abaixo de 1,80m.

(15)

Da leitura deste gráfico, podemos inferir que 97,5% das frequências são iguais ou inferiores a 1,80m.

Simetria de uma distribuição de dados

Observe agora o seguinte Histograma, relativo à observação das idades dos moradores de um determinado bairro:

O colchete [ indica que o intervalo é fechado naquela extremidade, e o parêntese ) indica que o intervalo é aberto naquela extremidade. Isto é, no intervalo [10, 20), sabemos que estão contidas as pessoas com exatamente 10 anos, mas não estão contidas as pessoas com 20 anos.

(16)

Note que esse gráfico possui um pico na classe de 30 a 40 anos, e à medida que as classes se afastam desta (para a esquerda ou para a direita), a quantidade de frequências é igual, dando um aspecto de simetria (ex.: temos 15 frequências tanto no intervalo 20 - |30 como no intervalo 40 - |50).

Podemos ter também histogramas assimétricos. Neste abaixo, temos uma assimetria à direita (assimetria positiva), pois temos o pico em 10-20 anos e os dados se estendem para a direita (sentido positivo), assumindo valores de até 70 anos.

Já o histograma abaixo apresenta um caso de assimetria à esquerda (negativa) , onde os dados se estendem para a esquerda (sentido negativo):

(17)

Antes de prosseguirmos, vejamos um exercício sobre gráficos estatísticos. ESAF – IRB - 2006) No campo estatístico, ogivas são:

a) polígonos de frequência acumulada.

b) polígonos de frequência acumulada relativa ou percentual. c) histograma de distribuição de frequência.

d) histograma de distribuição de frequência relativa ou percentual. e) o equivalente à amplitude do intervalo.

RESOLUÇÃO:

A ogiva, como vimos ao estudar os gráficos estatísticos, é uma figura formada no gráfico contendo, no eixo horizontal, os pontos extremos (limites superiores) dos intervalos de classes de dados, e no eixo vertical as frequências acumuladas. Reveja abaixo o exemplo que usamos na aula:

Como você pode ver, trata-se de um gráfico de frequências acumuladas. Resposta: A

MEDIDAS ESTATÍSTICAS

Além dos gráficos e tabelas, outro recurso importante para a estatística descritiva é o uso de medidas estatísticas. Estas medidas tem por objetivo auxiliar o entendimento de um conjunto de dados, resumindo-os e apresentando as suas características mais relevantes. Dividimos as medidas estatísticas em alguns grupos: medidas de posição (ou de centralidade, ou de tendência central), medidas de dispersão (ou variabilidade), medidas de assimetria e curtose etc.

Nesta aula veremos as medidas de posição (ou tendência central). Trata-se de medidas estatísticas que nos fornecem pontos de referência para interpretar uma distribuição de dados. São “posições características”

(18)

que podem ser usadas para resumir toda a distribuição. A título de exemplo, ao invés de apresentar toda uma distribuição de idades dos eleitores de uma cidade, eu poderia fornecer-lhe apenas a idade média destes eleitores. Este valor é um resumo daquela distribuição – e como todo resumo, ele acaba por omitir algumas informações.

As principais medidas de posição são: média, moda e mediana.

Média

Certamente você ouve falar sobre alguma “média” praticamente todo dia: média salarial da sua categoria profissional, média de idade de um grupo de pessoas, velocidade média de um carro, expectativa média de vida dos brasileiros, etc. Acredito que você tenha uma noção de que a média é um número que, de alguma forma, representa uma característica de um grupo.

Por exemplo, se eu te disser que a idade média dos jogadores da seleção de futebol do Paquistão é de 23 anos, que imagem vem à sua mente? Por mais que provavelmente você não conheça nenhum jogador do Paquistão, você deve imaginar um grupo de jovens em torno de 23 anos, certo? Dificilmente você vai imaginar um grupo de crianças, ou um grupo de idosos... Portanto, a média aritmética é uma medida que tenta resumir as características de um grupo em um único número. Ao invés de listar as idades de todos os jogadores de futebol, é bem mais fácil eu te falar a idade média deles. Se eu te disser que a seleção da Jamaica tem idade média de 30 anos, você vai conseguir fazer uma comparação entre os dois times, concorda? Vai imaginar que os jogadores da Jamaica tendem a ser mais velhos que os do Paquistão – embora possam existir jogadores paquistaneses mais velhos que alguns dos jamaicanos.

Ao longo das próximas seções nós vamos aprender como calcular a média em diversas situações. Veremos que, conforme os dados nos forem apresentados, o cálculo deve ser feito de forma diferente. Também vamos conhecer algumas propriedades da média que nos permitem realizar análises mais rápidas. E, por fim, falaremos de outros tipos de média, além da média aritmética, que é a mais comum de todas (e mais cobrada em prova).

Cálculo da média para uma lista de dados (“dados em rol”)

De maneira geral, a média é o resultado da divisão entre: - a soma de todos os valores da variável observada; e - a quantidade de valores da variável.

Isto é,

𝑀é𝑑𝑖𝑎 = 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠

Imagine que temos 4 colegas de turma reunidos, e a variável X que representa o número de irmãos que cada um tem. Descobrimos que as quantidades de irmãos de cada um são: {2, 3, 5, 5}. Ou seja, um colega tem 2 irmãos, outro colega tem 3 irmãos, e outros dois colegas possuem 5 irmãos cada um. Qual é a quantidade média de irmãos que esses colegas possuem? Repare que basta fazermos:

(19)

𝑀é𝑑𝑖𝑎 = 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑑𝑎𝑑𝑒 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠= 2 + 3 + 5 + 5 4 = 15 4 = 3,75 𝑖𝑟𝑚ã𝑜𝑠

Portanto, em média os colegas possuem 3,75 irmãos. Note que é impossível uma pessoa ter exatamente “3,75 irmãos”. É preciso ter muito cuidado ao interpretar o valor obtido com a média. De qualquer forma, perceba que 3,75 é um número que se situa entre o menor (2) e o maior (5) valores da distribuição. Isto sempre vai acontecer. Não é possível ter uma média inferior ao menor valor, e nem superior ao maior valor.

De maneira mais técnica, a fórmula para o cálculo da média de uma variável aleatória X é:

1 n i

Xi

Média

n

=

=

(leia: a média é igual ao somatório dos valores Xi, com i variando de 1 até n, dividido por n)

Esta fórmula, que é a mesma da anterior, deve ser usada quando a questão nos fornecer uma lista de valores. Alguns autores chamam isso de “dados em rol”. Nestes casos, como vimos, basta somar todos os valores e dividir esta soma pela quantidade de valores.

Veja comigo essa questão:

CEPERJ – SEFAZ/RJ – 2013) Um filme foi exibido em um cinema em 8 diferentes sessões, ao longo de todo o dia. O número de presentes em cada sessão é mostrado na tabela abaixo:

O número médio de pessoas por sessão corresponde a: A) 68 B) 72 C) 76 D) 81 E) 85 RESOLUÇÃO:

Veja que temos uma lista de dados, que podemos representar assim: {88, 102, 90, 76, 94, 82, 80, 68). São OITO valores ao todo. Para calcular a média de uma lista de dados, basta fazer:

(20)

Ou seja,

Média = (88 + 102 + 90 + 76 + 94 + 82 + 80 + 68) / 8 Média = 85

Resposta: E

A partir da fórmula da média, podemos escrever também que:

Soma dos valores = Média x Quantidade

Este jeito de visualizar a fórmula pode ser muito útil em algumas questões. Veja esta:

VUNESP – PREF. SJC – 2012) A média aritmética de alturas de 10 alunos de um time de futebol é 175 cm. Dois novos alunos entram para o time, e a nova média de alturas passa a ser 178 cm. Se a diferença entre as alturas desses dois novos jogadores é 6 cm, o maior dos dois mede, em cm,

(A) 188. (B) 190. (C) 192. (D) 194. (E) 196. RESOLUÇÃO:

No início do enunciado, sabemos que a média de altura é 175cm, e a quantidade de jogadores é 10. Portanto, Soma das alturas = Média x Quantidade

Soma das alturas = 175 x 10 Soma das alturas = 1750cm

Vamos chamar este valor simplesmente de “S”. Sejam A e B as alturas dos dois novos jogadores. Após a inclusão dos dois, a média passa a ser de 178cm, e o total de jogadores passa a ser 12. Assim:

Média = Soma dos valores / quantidade 178 = (S + A + B) / 12

178 = (1750 + A + B) / 12 178 x 12 = 1750 + A + B

(21)

Foi dito ainda que a diferença de altura entre esses dois novos jogadores é de 6cm. Ou seja, A – B = 6

A = B + 6 Substituindo A por “B + 6” na equação A + B = 386, temos:

(B + 6) + B = 386 2B = 380 B = 190cm

A = B + 6 = 190 + 6 = 196cm Assim, o mais alto dos dois novos jogadores mede 196cm.

Resposta: E

Cálculo da média para uma tabela de frequências

Em algumas questões o examinador vai nos fornecer uma tabela de frequências, como esta abaixo:

Altura (X

i

)

Frequências (f

i

)

1,50m 2

1,51m 2

1,53m 1

1,57m 10

Como ler essa tabela? Basta você saber que as frequências são o número de repetições de cada valor da nossa variável Altura. Isto é, temos 2 pessoas com 1,50m, temos outras 2 pessoas com 1,51m, apenas 1 pessoa com 1,53m, e um total de 10 pessoas com 1,57m.

Para calcularmos a altura média a partir de uma tabela de frequências como esta, devemos usar a seguinte fórmula (por favor não se assuste com a “cara” dela, você verá que o seu uso é relativamente simples):

𝑀é𝑑𝑖𝑎 =

(𝑋

𝑖

× 𝑓

𝑖

)

𝑛

𝑖=1

𝑛

𝑖=1

𝑓

𝑖

(22)

Nessa fórmula, Xi representa cada um dos valores que a variável X (ex.: altura) pode assumir, e fi representa a frequência (repetição) referente a cada um desses valores.

Embora a fórmula pareça estranha, a sua aplicação é bem simples. Basta você aproveitar a própria tabela que o examinador forneceu e criar uma nova coluna, na qual você vai calcular Xi.fi, isto é, vai multiplicar os dados das duas colunas fornecidas. Veja:

Altura (X

i

)

Frequências (f

i

)

X

i

.f

i

1,50m 2 1,50 x 2 = 3,00

1,51m 2 1,51 x 2 = 3,02

1,53m 1 1,53 x 1 = 1,53

1,57m 10 1,57 x 10 = 15,7

Feito isto, podemos somar todos os valores da coluna Xi.fi, obtendo o termo

𝑛

𝑖=1

(𝑋

𝑖

× 𝑓

𝑖

)

, e também somar todos os termos da coluna fi, obtendo o termo

𝑛

𝑖=1

𝑓

𝑖

. Veja na tabela a última linha que incluí:

Altura (X

i

)

Frequências (f

i

)

X

i

.f

i 1,50m 2 1,50 x 2 = 3,00 1,51m 2 1,51 x 2 = 3,02 1,53m 1 1,53 x 1 = 1,53 1,57m 10 1,57 x 10 = 15,7 15 23,25

Agora basta dividir um valor pelo outro, obtendo:

𝑀é𝑑𝑖𝑎 =

(𝑋

𝑖

× 𝑓

𝑖

)

𝑛

𝑖=1

𝑛

𝑖=1

𝑓

𝑖

=

23,25

15

= 1,55𝑚

(23)

CÁLCULO DA MÉDIA ARITMÉTICA PARA UMA TABELA DE FREQUÊNCIAS 1. Criar uma coluna para calcular Xi . fi

2. Somar todos os valores da coluna Xi . fi

3. Somar todos os valores da coluna das frequências (fi)

4. Dividir a soma dos valores da coluna Xi . fi pela soma das frequências (fi) Veja esta questão antes de avançar no seu estudo:

A tabela apresenta o número de acertos dos 600 candidatos que realizaram a prova da segunda fase de um concurso, que continha 5 questões de múltipla escolha.

VUNESP – TJM/SP – 2017) A média de acertos por prova foi de (A) 3,57. (B) 3,43. (C) 3,32. (D) 3,25. (E) 3,19. RESOLUÇÃO:

Repare que temos uma tabela de frequências, em que os números de acertos são os valores da variável analisada (Xi), e os números de candidatos com cada quantidade de acertos são as frequências (fi).

Podemos aproveitar a tabela fornecida para incluir uma coluna na qual multiplicamos Xi.fi, ou seja,

Número de acertos (Xi) Número de candidatos (fi) Xi . fi 5 204 5x204 = 1020 4 132 4x132 = 528 3 96 3x96 = 288 2 78 2x78 = 156 1 66 1x66 = 66 0 24 0x24 = 0

(24)

Somando a coluna Xi.fi temos o valor 2058. E somando a coluna das frequências, temos 600 (como o próprio enunciado já havia dito). Portanto,

Resposta: B

Cálculo da média para dados agrupados em classes

Veja esta tabela:

Classes (intervalos) de alturas

Frequências (f

i

)

1,49 a 1,51m 2

1,51 a 1,53m 2

1,53 a 1,55m 1

1,55 a 1,57m 10

Veja que os dados estão agrupados em intervalos. Podemos dizer que 2 pessoas do grupo possuem altura entre 1,49m e 1,51m, assim como 10 pessoas do grupo possuem altura entre 1,55m e 1,57m. Compreendeu a leitura da tabela? Então vamos avançar.

Quando os dados estão agrupados em classes, temos APENAS UMA modificação a fazer em relação ao cálculo anterior: devemos substituir os intervalos pelos seus respectivos pontos médios. Como assim? Ao invés de considerar o intervalo de 1,49m a 1,51m, por exemplo, nós vamos SUBSTITUIR pelo valor 1,50m, que está exatamente no meio entre 1,49 e 1,51. Da mesma forma, nós vamos substituir o intervalo de 1,51 a 1,53 pelo valor 1,52m, que está exatamente no meio. Chamamos estes valores do meio de PONTOS MÉDIOS. Intuitivo, não acha?

Nesse nosso exemplo a identificação dos pontos médios é relativamente fácil. Mas talvez você não ache tão simples assim encontrar o ponto médio do intervalo: 1,71 a 1,87m. Como fazer nesse caso? Basta somar os dois extremos e dividir essa soma por 2. Veja:

𝑃𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 =1,71 + 1,87

2 = 1,79𝑚

Na tabela abaixo eu incluí uma terceira coluna em nossa tabela, na qual eu calculei os pontos médios:

Classes de alturas

Frequências (f

i

)

PM

i

(25)

1,51|--1,53 2 (1,51+1,53)/2 = 1,52

1,53|--1,55 1 (1,53+1,55)/2 = 1,54

1,55|--1,57 10 (1,55+1,57)/2 = 1,56

Pronto, essa é a ÚNICA MODIFICAÇÃO. Nós vamos utilizar os pontos médios (PMi) no lugar dos intervalos. A fórmula para o cálculo da média fica:

𝑀é𝑑𝑖𝑎 =

(

𝑃𝑀

𝑖

× 𝑓

𝑖

)

𝑛

𝑖=1

𝑛

𝑖=1

𝑓

𝑖

Veja que eu marquei em vermelho o PMi, pois esta é a única mudança dessa fórmula para a anterior. O próximo passo consiste em calcular os valores das multiplicações PMi x fi, multiplicando essas duas colunas. Veja:

Classes de alturas

Frequências (f

i

)

PM

i

PM

i

. f

i

1,49|--1,51 2 1,50 1,50x2 = 3,00

1,51|--1,53 2 1,52 1,52x2 = 3,04

1,53|--1,55 1 1,54 1,54x1 = 1,54

1,55|--1,57 10 1,56 1,56x10 = 15,6

Agora podemos somar todos os elementos da coluna PMi.fi, obtendo o termo

𝑛𝑖=1

(𝑃𝑀

𝑖

× 𝑓

𝑖

)

da nossa fórmula. E podemos somar todos os termos da coluna fi, obtendo o termo

𝑛

𝑖=1

𝑓

𝑖

da fórmula. Ficamos com:

Classes de alturas

Frequências (f

i

)

PM

i

PM

i

. f

i

1,49|--1,51 2 1,50 3,00

1,51|--1,53 2 1,52 3,04

1,53|--1,55 1 1,54 1,54

(26)

15 23,18 Agora só precisamos dividir uma soma pela outra:

𝑀é𝑑𝑖𝑎 =

(𝑃𝑀

𝑖

× 𝑓

𝑖

)

𝑛 𝑖=1

𝑛𝑖=1

𝑓

𝑖

=

23,18

15

= 1,545𝑚

Deu para me acompanhar? Espero que sim . Veja abaixo o passo a passo deste cálculo:

CÁLCULO DA MÉDIA ARITMÉTICA PARA UMA TABELA COM INTERVALOS DE CLASSES 1. Criar uma coluna para calcular os pontos médios de cada classe (PMi)

2. Criar uma coluna para calcular PMi . fi 3. Somar todos os valores da coluna PMi . fi

4. Somar todos os valores da coluna das frequências (fi)

5. Dividir a soma dos valores da coluna PMi . fi pela soma das frequências (fi)

Pratique esta fórmula resolvendo a seguinte questão:

IDECAN – BOMBEIROS/DF – 2017) A média aritmética da distribuição de frequências a seguir é:

A) 4,9. B) 5,2. C) 5,3. D) 5,5.

RESOLUÇÃO:

Estamos diante de uma tabela na qual os valores estão em intervalos de classes. O primeiro passo para calcular a média é, portanto, obter os pontos médios de cada classe:

(27)

O próximo passo consiste em obter os valores das multiplicações PMi.fi, que entrarão em nossa fórmula. Vejamos:

A soma da coluna PMi.fi é igual a 520. Já a soma da coluna das frequências fi é 100. Logo,

Resposta: B

Propriedades da média aritmética

Vejamos algumas propriedades relativas à média de um conjunto de dados. Elas são muito cobradas em prova. Para isso, observe a distribuição: {1,2,2,5,5}.

A média desta distribuição é 3, afinal:

𝑀é𝑑𝑖𝑎 =1 + 2 + 2 + 5 + 5

5 =

15 5 = 3

(28)

Se somarmos 2 unidades em cada elemento desta distribuição, ficamos com {3,4,4,7,7}. Qual será a média desta nova distribuição? Será que precisamos calcular novamente? A resposta é: NÃO precisamos calcular novamente, basta aplicar uma propriedade da média:

- se somarmos um mesmo valor (neste caso o 2) a todos os termos de uma distribuição, a média também é acrescida deste mesmo valor. Ou seja, se antes a média era 3, agora ela passa para 3+2=5.

Da mesma forma, se subtrairmos 2 unidades da nossa distribuição, ficamos com: {-1,0,0,3,3}. A média desta distribuição é igual a 1. Isto porque basta pegar a média original (3) e subtrair 2 unidades.

Portanto, guarde essa propriedade:

Somando-se ou subtraindo-se um valor constante em todas as observações, a média desse novo conjunto será somada ou subtraída do mesmo valor.

E se eu quiser multiplicar todos os elementos da minha distribuição original por 2? Neste caso, ficarei com a distribuição {2,4,4,10,10}. Qual será a sua média? Basta eu multiplicar a média original (3) pelo mesmo valor (2), obtendo 3x2 = 6.

Esta mesma lógica vale para a divisão. Portanto, fique com mais esta propriedade:

Multiplicando-se ou dividindo-se todos os valores observados por um valor constante, a média desse novo conjunto será multiplicada ou dividida pelo mesmo valor.

Outra propriedade interessante é a seguinte:

A soma das diferenças entre cada observação e a média é igual a zero

Para exemplificar, como na nossa distribuição original a média era 3, veja quanto dá a soma das diferenças entre cada observação e esta média:

(1-3) + (2-3) + (2-3) + (5-3) + (5-3) = -2 – 1 – 1 + 2 + 2 =

0

Por fim, repare que o valor da média é calculado utilizando todos os valores da amostra. Portanto, qualquer alteração nesses valores poderá alterar a média. Assim, costumamos dizer que:

(29)

Exemplificando essa propridade: se substituirmos o valor 5 pelo valor 50 na nossa distribuição original, a média muda significativamente, concorda?

Uma última propriedade:

Existe uma única média para um determinado conjunto de valores

Quando temos um grupo de números, esse grupo terá um ÚNICO VALOR representado a sua média. Isso não é necessariamente verdadeiro para outras medidas de posição. Uma distribuição pode ter mais de uma MODA, por exemplo (ou mesmo não ter nenhuma moda).

Veja essa questão, que é relativa às propriedades da média:

DOM CINTRA - PREF. PALMAS - 2010) A média aritmética das 25 notas de uma prova de matemática foi igual a 6,0. Se o professor aumentar 0,5 em cada uma dessas 25 notas, e, em seguida, calcular a média de todas elas, o valor encontrado por ele será de:

a) 5,5 b) 6,0 c) 6,5 d) 7,0 e) 7,5 RESOLUÇÃO:

Aqui podemos usar uma das propriedades da média: se somarmos uma constante k a todos os membros de uma amostra, a nova média será igual à anterior, somada de k. Portanto, se somamos k = 0,5 na nota de cada um dos alunos, basta somar 0,5 na média anterior e obtemos a nova média: 6 + 0,5 = 6,5.

Resposta: C

Média aritmética ponderada

Imagine o seu boletim de Matemática no colégio. As notas de cada um dos 4 bimestres letivos foram, respectivamente: 5, 5, 6, 8. Qual foi a sua nota média? Neste caso temos:

- soma das notas = 5 + 5 + 6 + 8 = 24 - quantidade de notas = 4

(30)

Agora imagine que a sua escola dá pesos diferentes para as notas de cada bimestre, sendo que o 1º bimestre tem o menor peso e o 4º tem o maior peso. Suponha que o peso do 1º bimestre é 1, do 2º é 2, do 3º é 3 e do 4º é 4. Qual seria a sua nota média, aplicando-se os respectivos pesos? Estamos diante de um cálculo de média ponderada, isto é, uma média onde cada um dos valores observados tem um peso diferente, ou uma ponderação diferente. O cálculo é muito similar àquele que vimos ao trabalhar com tabelas, usando a fórmula:

1 1

(

)

n i n i

Xi

Fi

Média

Fi

= =

=

Simplesmente vamos usar, no lugar das frequências fi, os valores dos pesos. Você pode fazer o cálculo montando uma tabela como esta:

Nota (Xi) Peso do bimestre (fi)

5 1

5 2

6 3

8 4

Podemos criar a coluna para fazer a multiplicação entre as notas e os pesos:

Nota (Xi) Peso do bimestre (fi) Xi . fi

5 1 5x1 = 5

5 2 5x2 = 10

6 3 6x3 = 18

8 4 8x4 = 32

Veja que a soma dos termos da coluna de Xi . fi é 65. Já a soma dos pesos (coluna fi) é 10. Efetuando a divisão, temos a média:

65

6,5

10

(31)

Se preferir, você pode fazer o cálculo sem utilizar a tabela. Basta jogar os valores diretamente na fórmula, como fiz a seguir:

1 1

(

)

5 1 5 2 6 3 8 4

1 2 3 4

n i n i

Xi Fi

Média

Fi

= =

 +  +  + 

=

=

+ + +

65

6,5

10

Média =

=

Compare essa nota com aquela média obtida no cálculo de média aritmética simples (6,0). Observe que, como o 4º bimestre tem um peso maior, e justamente nesse bimestre tiramos uma nota maior (8), a média foi “puxada” para cima, indo de 6 para 6,5. Este é o efeito da ponderação: a média é “puxada” em direção aos valores correspondentes aos maiores pesos.

Sobre este assunto, trabalhe a próxima questão:

CEPERJ – SEFAZ/RJ – 2013) A avaliação dos alunos em determinada disciplina é feita por meio de 4 provas, que possuem peso diferente na composição da nota final. A nota de determinado aluno em cada prova e o seu peso respectivo estão indicados na tabela abaixo:

A nota final desse aluno é: A) 7,12 B) 7,50 C) 7,63 D) 8,00 E) 8,17 RESOLUÇÃO:

Aqui podemos utilizar a média ponderada para calcular a nota final:

Média = (1 x 7 + 2 x 8 + 2 x 9,5 + 1 x 6) / (1 + 2 + 2 + 1) = 8 Resposta: D

(32)

Mediana

É a observação “do meio” quando os dados são organizados do menor para o maior. Abaixo da mediana encontram-se 50% (metade) das observações, e a outra metade encontra-se acima da mediana. Vamos aprender a calcular a mediana nas situações mais comuns em prova.

Cálculo da mediana para uma lista de dados (dados em rol)

Observe esses 5 valores: {9,4,5,1,8}. Como temos uma lista de dados, para encontrar a mediana nós precisamos seguir dois passos:

1. Colocar os dados em ordem crescente;

2. Encontrar a posição que divida os dados em duas metades; 3. A mediana será o valor que está nesta posição.

Colocando os valores em ordem crescente, temos: {1,4,5,8,9}

Repare que temos 5 números. O 3º número é aquele que divide os dados em duas metades, pois temos 2 números antes dele e 2 números depois dele. Esta é a posição da mediana.

Olhando a 3ª posição, vemos o número 5, que é o valor da mediana desta distribuição.

Como esta era uma distribuição pequena, fica fácil ver que o 3º valor é o que divide a distribuição em duas metades. Em distribuições maiores, você pode encontrar a posição da mediana com fórmula (𝑛+1)2 , onde n é o número de elementos da distribuição. Em nosso exemplo, como a distribuição tinha n = 5 termos, a posição da mediana deveria ser (5+1)2 =62= 3.

ATENÇÃO: se a distribuição tiver um número par de termos, o cálculo de (𝑛+1)

2 não dará um resultado exato.

Para exemplificar, veja esta distribuição que possui n = 6 elementos: {0,1,6,8,9,10}

Como os dados estão em ordem crescente, podemos ir direto para o cálculo da posição da mediana, que é (𝑛+1)2 =(6+1)2 =72= 3,5. A mediana deveria estar na posição “3,5”. Como esta posição não existe, o que devemos fazer é calcular a média entre os termos da 3ª e 4ª posições da distribuição. Como o 3º termo é 6 e o 4º termo é 8, a mediana será:

(33)

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =(6 + 8)

2 =

14 2 = 7

Cuidado para não confundir a posição da mediana com o valor da mediana. Pratique o conceito resolvendo este exercício:

ESAF – SEFAZ/SP – 2009) Determine a mediana das seguintes observações:

17, 12, 9, 23, 14, 6, 3, 18, 42, 25, 18, 12, 34, 5, 17, 20, 7, 8, 21, 13, 31, 24, 9 a) 13,5 b) 17 c) 14,5 d) 15,5 e) 14 RESOLUÇÃO:

Primeiramente devemos colocar as observações em ordem crescente:

3, 5, 6, 7, 8, 9, 9, 12, 12, 13,14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 34, 42

Temos ao todo 23 observações, ou seja, n = 23. Como n é ímpar, então a mediana será a observação na posição:

A 12ª observação é igual a 17. Portanto, Mediana = 17. Resposta: B

Cálculo da mediana para dados em uma tabela de frequências

Quando os dados estão dispostos em uma tabela de frequências, podemos utilizar esta ferramenta para encontrar a mediana. Veja a tabela a seguir:

Alturas (Xi) Frequências (fi)

1,50m 15

1,51m 5

(34)

1,57m 2 1,60m 10 1,63m 8 1,65m 1 1,71m 20 1,73m 10 1,75m 3 1,83m 2

Observe que temos 80 dados. Além disso, veja que os valores da variável altura estão ordenados do menor para o maior nessa tabela. Portanto, a mediana será o valor da posição (80+1)/2 = 40,5. Isto é, a mediana será a média entre os valores da 40ª e 41ª posições.

Para encontrar o 40º e o 41º valores, precisamos obter as frequências acumuladas.

Valor da variável Frequências (Fi) Frequências absolutas acumuladas (Fac) 1,50m 15 15 1,51m 5 20 1,53m 4 24 1,57m 2 26 1,60m 10 36 1,63m 8 44 1,65m 1 45 1,71m 20 65 1,73m 10 75 1,75m 3 78 1,83m 2 80

(35)

Veja que até a altura 1,60m temos 36 pessoas. Temos mais 8 pessoas na altura 1,63m (abrangendo do 37º até o 44º). Portanto, tanto a posição 40 como a posição 41 possuem altura igual a 1,63m. Assim, a mediana será a média entre os valores dessas duas posições, que é:

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =1,63 + 1,63

2 = 1,63𝑚

Cálculo da mediana para dados em intervalos de classes (interpolação linear)

Caso os dados sejam dispostos em uma tabela com intervalos de classes, o método para obtenção da mediana será conhecido como interpolação linear. Vamos aprender a usá-lo por meio de um exemplo. A tabela abaixo apresenta os intervalos de alturas de uma certa população, como já vimos anteriormente nesta aula. Com base nisso, vamos obter a altura mediana.

Classe Frequências (Fi) Frequências absolutas acumuladas (Fac)

1,50| – 1,60 26 26

1,60| – 1,70 19 45

1,70| – 1,80 33 78

1,80| – 1,90 2 80

1º passo: calcular a divisão n/2, onde n é o número total de frequências, obtendo a posição da mediana.

Em nosso exemplo, n = 80 indivíduos, portanto a posição da mediana é 80/2 = 40 (muito cuidado, pois quando usamos esse método não calculamos (n+1)/2, como vimos anteriormente).

2º passo: identificar a classe onde se encontra a mediana

Observe a coluna de frequências acumuladas (caso ela não tenha sido fornecida, prepare-a). Veja que o elemento da posição 40 encontra-se na classe 1,60|--1,70 (pois esta classe vai do 26 ao 45). Portanto, essa é a classe mediana.

3º passo: montar a proporção entre as frequências acumuladas e os limites da classe da mediana

Neste passo vamos montar duas retas paralelas, como você vê abaixo, uma delas com as frequências acumuladas e a outra com os valores de alturas correspondentes:

Frequências :26 40 45 |---|---| Valores: 1,60 X 1,70

(36)

Repare que eu associei (coloquei um abaixo do outro):

- a última frequência da classe anterior (26) com o limite de altura daquela classe (1,60), que também é o limite inferior da classe da mediana;

- a frequência da mediana (40) com o valor da mediana (X), que buscamos;

- a última frequência da classe da mediana (40) com o limite de altura dessa classe (1,70). Feito isso, basta montar a proporção abaixo:

𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑣𝑒𝑟𝑚𝑒𝑙ℎ𝑜 𝑑𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠 𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠 = 𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑣𝑒𝑟𝑚𝑒𝑙ℎ𝑜 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑠𝑒𝑔𝑚𝑒𝑛𝑡𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 Ou seja,

45 - 40

1,70 - X

=

45 - 26 1,70 - 1,60

Feito isso, basta terminar o cálculo para encontrar o valor de X, que neste caso é X = 1,67m. Esta é a mediana pelo método da interpolação linear. Exercite este método com a questão abaixo:

FCC – SEFAZ/SP – 2006) O histograma de frequências absolutas abaixo demonstra o comportamento dos valores arrecadados de um determinado tributo, no ano de 2005, em uma região a ser analisada:

Observação: Considere que todos os intervalos de classe do histograma são fechados à esquerda e abertos à direita.

Utilizando as informações contidas nesse histograma, calculou-se a média aritmética destes valores arrecadados, considerando que todos os valores incluídos num certo intervalo de classe são coincidentes com o ponto médio deste intervalo. Também calculou-se a mediana de tais valores pelo método da interpolação linear. Então, o módulo da diferença entre a média aritmética e a mediana é igual a:

a) R$100,00 b) R$400,00 c) R$800,00 d) R$900,00

(37)

e) R$1000,00 RESOLUÇÃO:

Para facilitar o nosso trabalho, vamos escrever os dados do gráfico em tabela, e já calcular o ponto médio de cada intervalo de classe:

Assim, a média será:

1 1

(

)

1,5 200 2,5 400 3,5 500 4,5 600 5,5 300

3,7

200 400 500 600 300

n i n i

PMi Fi

Média

Fi

= =

+

+

+

+

=

=

=

+

+

+

+

Veja que os valores no gráfico estão em milhares de reais, portanto a média é de R$3700,00.

Para obter a mediana, veja’ que temos n = 2000 frequências ao todo. Pelo método da interpolação linear, a mediana será o termo correspondente à posição n/2 = 1000. Esta posição encontra-se no intervalo de 3 a 4 mil reais, como você pode ver na tabela abaixo:

Montando a proporção, temos:

(38)

|---|---| Valores: 3 X 4 |---|---| Assim, temos:

=

=

4

1100 1000

4 3

1100

600

3,8

X

X

Portanto, a mediana é igual a R$3800,00 reais. A diferença entre a média e a mediana é de R$100,00. Resposta: A

Propriedades da mediana

Para finalizar o estudo da Mediana, note que ela é um único número para um determinado conjunto de observações. Não existem duas medianas para o mesmo conjunto.

Veja também que o valor da mediana não é afetado pela troca de algum valor extremo (máximo ou mínimo) na distribuição. Para exemplificar, veja essas duas distribuições:

3, 5, 6, 7, 8, 9, 9, 12, 12, 13,14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 34, 42 e

3, 5, 6, 7, 8, 9, 9, 12, 12, 13,14, 17, 17, 18, 18, 20, 21, 23, 24, 25, 31, 57, 88

Apesar de eu ter trocado dois termos extremos da primeira para a segunda distribuição, ambas possuem a mesma mediana. Repare que a média se altera (neste caso, a média da segunda distribuição certamente seria maior).

Moda

A moda é o valor da observação com maior número de frequências, ou repetições (isto é, é o valor que está “na moda”). Ao contrário da média e da mediana, que são valores únicos, uma amostra pode ter 1, 2 ou mais modas (ser unimodal, bimodal etc.). Veja este conjunto de idades:

{ 5, 6, 6, 7, 7, 8, 8, 8, 9, 11}

Note que a idade 8 é a que aparece mais vezes (3 vezes). Portanto, a moda deste conjunto é igual a 8. Já na tabela de alturas, que reproduzo novamente, a moda é a altura de 1,71m, pois ela aparece 20 vezes:

(39)

Valor da variável

Frequências (Fi)

1,50m 15 1,51m 5 1,53m 4 1,57m 2 1,60m 10 1,63m 8 1,65m 1 1,71m 20 1,73m 10 1,75m 3 1,83m 3

Para fixar o que vimos até aqui, resolva a questão abaixo:

ESAF – SEFAZ/CE – 2006) O conjunto de notas dos alunos de uma determinada prova é: {10, 5, 3, 4, 5, 10, 3, 8, 9, 3}. Assim, podemos dizer que a moda, média e mediana deste conjunto são, respectivamente:

a) 3, 6 e 5. b) 3, 4 e 5. c) 10, 6 e 5. d) 5, 4 e 3. e) 3, 6 e 10. RESOLUÇÃO:

Em exercícios que solicitam a moda, a média e a mediana, devemos ser “espertos” e começar calculando as mais fáceis, partindo então para as mais difíceis. Muitas vezes será possível acertar a questão sem precisar calcular todas as medidas de posição. Portanto, recomendo a seguinte ordem:

1º - calcular a moda; 2º - calcular a mediana; 3º - calcular a média.

(40)

Repare que você só vai calcular a média, que é o valor mais trabalhoso, caso as informações anteriores não sejam suficientes para marcar o gabarito correto. Vamos lá?

A moda é aquela nota que mais se repete. Neste caso, a nota 3 repete-se três vezes, portanto esta é a moda. Viu como foi rápido? Entretanto, ficamos entre as alternativas A, B e E. Vamos partir para o cálculo da mediana. Colocando os dados em ordem crescente:

3, 3, 3, 4, 5, 5, 8, 9, 10, 10

Veja que temos n = 10 notas. Como n é um número par, a mediana será a média aritmética das duas notas centrais. Calculando (n+1)/2 = (10+1)/2 = 5,5, vemos que as notas centrais são a da 5ª e 6ª posições. Na quinta posição temos uma nota 5, e na sexta posição outra nota 5. Portanto, a mediana será (5 + 5)/2 = 5.

Ainda ficamos entre as alternativas A e B, o que nos obriga a partir para o cálculo da média. A média é calculada pela soma das notas, dividido pela quantidade de notas:

3

3

3

4

5

5

8

9 10 10

60

6

10

10

X

=

+ + + + + + + +

+

=

=

Resposta: A

Moda de Czuber e Moda de King

Os problemas mais difíceis envolvendo moda são aqueles onde é dada uma tabela com classes de valores para a variável, como esta abaixo (que também já utilizamos nessa aula):

Classe Frequências (Fi)

1,50| – 1,60 26

1,60| – 1,70 19

1,70| – 1,80 33

1,80| – 1,90 2

Para calcular a moda, você precisará seguir os seguintes passos:

1. Descobrir qual é a classe modal (CM). A classe modal é aquela que apresenta o maior número de frequências. Neste caso, trata-se da classe 1,70| - 1,80, que apresenta 33 frequências. Já sabemos que a moda está ali dentro, isto é, será um valor entre 1,70 e 1,80. Veja que o limite inferior dessa classe é li = 1,70. Note ainda que todas as classes tem amplitude de 0,10m, isto é, a diferença entre o menor (li) e maior (Li) valor da classe é de 0,10m.

2. Identificar a classe posterior (post) e a classe anterior (ant). Neste caso, a classe posterior é a de 1,80| - 1,90, que possui 2 frequências; e a classe anterior é a de 1,60| - 1,80, com 19 frequências.

(41)

3. Aplicar uma das duas fórmulas abaixo, dependendo do método de cálculo da moda indicado pelo exercício: Moda de King: fpost Moda li c fant fpost    = +  +    

Nesta fórmula, li é o limite inferior da classe modal (li = 1,70), c é a amplitude da classe modal (c = Li – li), fpost é o número de frequências da classe posterior (fpost = 2) e fant é o número de frequências da classe anterior (fant = 19). Portanto, a moda será:

2 1, 70 0,10 1, 7095 2 19 Moda= + = m +     Moda de Czuber: 2 ( ) fcm fant Moda li c fcm fant fpost   −  = +  − +    

Nessa fórmula fcm é o número de frequências da classe modal, que neste caso é fcm = 33. Portanto, a moda em nosso exemplo será:

33 19

1,70

0,10

1,731

2 33 (19

2)

Moda

=

+

=

m

+

Note que os valores obtidos são diferentes, motivo pelo qual você precisará saber as duas fórmulas. Se a questão não especificar o método, sugiro tentar primeiramente o método de Czuber.

E note um grande diferencial do método de Czuber: ele é o único que leva em conta, no cálculo, as frequências da Classe Modal! Exercite esta fórmula com a questão abaixo:

(42)

FCC – BACEN – 2006) O valor da moda, obtida com a utilização da Fórmula de Czuber*, é igual a (desprezar os centavos na resposta) Dados: *

max

2. max (

)

Z

Zant

Moda

Li

h

Z

Zant

Zpost

=

+

+

em que:

Li = limite inferior da classe modal h = intervalo de classe modal Zmax = freqüência da classe modal

Zant = freqüência da classe anterior à classe modal Zpost = freqüência da classe posterior à classe modal

a) R$3201,00 b) R$3307,00 c) R$3404,00 d) R$3483,00 e) R$3571,00 RESOLUÇÃO:

Veja que a classe que apresenta maior número de frequências é aquela entre 3000-4000 reais, com Zmax = 16 frequências. Essa é a classe modal. O seu limite inferior é Li = 3000 reais, e o seu intervalo é de h = 1000 reais. A classe anterior é a de 2000-3000 reais, que possui Zant = 8 frequências. E a classe posterior é a de 4000-5000 reais, que possui Zpost = 10 frequências.

Assim, podemos aplicar a fórmula de Czuber:

max 2. max ( ) 16 8 3000 1000 2.16 (8 10) 8 3000 1000 3571,42 14 Z Zant Moda Li h Z Zant Zpost Moda Moda − = + − + − = + − + = + = Resposta: E

(43)

Propriedades da moda

Finalizando o estudo da Moda, veja que o seu valor não é afetado pelos valores extremos (mínimos e máximos) da distribuição. Isto é, a moda destas duas distribuições abaixo é a mesma:

{ 5, 6, 6, 7, 7, 8, 8, 8, 9, 11} e

{ 1, 2, 6, 7, 7, 8, 8, 8, 9, 11}

Além disso, lembre-se que uma distribuição pode não possuir nenhuma moda (ser amodal), ter uma única moda (ser unimodal), duas modas (ser bimodal), ou até mais.

Simetria – média, mediana e moda

Conhecendo a média, mediana e moda de uma amostra, podemos determinar a simetria daquela distribuição de dados. Veja isso na tabela abaixo:

Simetria

Média, Mediana e Moda

Simétrica Média = Mediana = Moda

Assimétrica positiva (à direita) Média > Mediana > Moda Assimétrica negativa (à esquerda) Média < Mediana < Moda

Você não precisa decorar essa tabela. Inicialmente, veja um exemplo de distribuição simétrica, e perceba que, de fato, a média, mediana e moda encontram-se na mesma posição:

Média, Mediana e

(44)

Quanto às distribuições assimétricas, basta lembrar que uma curva com assimetria negativa tem esse nome porque possui uma “cauda” para o lado esquerdo, isto é, para o sentido negativo do eixo horizontal; e uma curva com assimetria positiva possui uma cauda voltada para o sentido positivo do eixo horizontal.

A existência de um prolongamento para um dos lados afeta a média, “puxando-a” naquele sentido. Por exemplo, na curva com assimetria negativa, a média é “puxada” para a esquerda, tornando-se a menor das três medidas de posição. A moda corresponde ao pico da curva (maior número de frequências), que neste caso é “puxado” para a direita, tornando a moda o maior dos três valores:

No caso da assimetria positiva, a cauda se estende para a direita, puxando a média para este lado. A moda é puxada para a esquerda, pois há um pico de frequências à esquerda. Veja:

Sobre este assunto, veja essa questão:

média mediana moda

(45)

ESAF – IRB – 2006) Sendo a moda menor que a mediana e, esta, menor que média, pode-se afirmar que se trata de uma curva

a) Simétrica.

b) Assimétrica, com frequências desviadas para a direita. c) Assimétrica, com frequências desviadas para a esquerda. d) Simétrica, com frequências desviadas para a direita. e) Simétrica, com frequências desviadas para a esquerda. RESOLUÇÃO:

No gráfico de distribuição de frequências, a moda se localiza na posição onde temos um pico de frequências. Se a moda é o menor valor, ela está deslocada para o lado esquerdo do eixo de valores (eixo horizontal). Isto significa que temos um pico de frequências à esquerda. Teremos também um prolongamento dos dados para a direita, o que “puxa” a média para este lado, tornando-a maior que as demais medidas de posição:

Assim, estamos diante de uma distribuição Assimétrica Positiva (à direita). Resposta: B

VALOR ESPERADO

Chamamos de valor esperado de uma variável aleatória a soma dos produtos entre cada valor que a variável pode assumir e a probabilidade de cada valor ser obtido. Imagine, por exemplo, a variável aleatória X = “número de carros em uma casa”. A partir da análise de uma amostra de casas, você monta a tabela abaixo:

Número de carros em uma casa: X

Probabilidade: p(x)

0 10% 1 40% 2 30% 3 15% 4 5% Mais de 4 0

(46)

Veja, por exemplo, que a probabilidade de entrar em uma casa com exatamente 3 carros é de 15%. Isto é, p(X = 3) = 15%. Assim, ao escolher aleatoriamente uma casa, o número esperado de carros ali presentes é dado por:

( )

( )

E X

=

x p x

( ) 0 10% 1 40% 2 30% 3 15% 4 5% 1, 65

E X =  +  +  +  +  =

Portanto, espera-se encontrar 1,65 carros em uma casa escolhida aleatoriamente. Ou melhor, o valor esperado da variável aleatória X é igual a 1,65. Obviamente você nunca encontrará em uma casa um número fracionário de carros, mas ao avaliar várias casas, espera-se que em média você encontre 1,65 carros por casa.

Utilizamos ainda os nomes “Esperança de X” ou “Expectância de X” como sinônimos do “Valor esperado de X”. E utilizamos o símbolo E(X).

Assim, a rigor a esperança matemática, valor esperado ou expectância da variável aleatória X é dada por:

1

( )

i

( )

i i

E X

x

p x

 =

=

A fórmula acima é válida para variáveis aleatórias discretas, de modo que p(xi) representa a probabilidade de cada valor xi que a variável X pode assumir.

Algumas variáveis aleatórias apresentam a mesma probabilidade para qualquer dos valores possíveis. Em um dado não-viciado, por exemplo, a probabilidade de obter qualquer dos valores {1, 2, 3, 4, 5, 6} é igual a 1/6. Neste caso dizemos que estamos diante de um espaço amostral equiprovável, ou seja, todos os valores possíveis do espaço amostral da variável X possuem a mesma probabilidade. Nestes casos, o valor esperado é igual à média aritmética dos possíveis valores da variável aleatória. No caso do dado, temos:

1

1

1

1

1

1

1

( )

( )

1

2

3

4

5

6

3,5

6

6

6

6

6

6

i i i

E X

x

p x

 =

=

=  +  +  +  +  +  =

Repare que o valor encontrado é justamente a média dos valores do conjunto {1, 2, 3, 4, 5, 6}. Isto é, a esperança matemática da variável aleatória X é justamente o valor médio desta variável.

No caso das variáveis aleatórias contínuas, a fórmula da esperança é essencialmente a mesma, porém usando a Integral (operação que você não precisa conhecer). A título de curiosidade, seria:

( )

( )

E X

x

f x dx

 −

=

,

onde f(x) é a função de densidade de probabilidade de X

Finalizando, seguem algumas propriedades do Valor Esperado que julgo serem interessantes você conhecer:

a) E(k) = k → a esperança de uma função constante é igual à própria constante. Ex.: se uma variável X é tal que só assume o valor k = 7, então E(X) = 7.

Referências

Documentos relacionados

à sua atuação como lobista junto ao Partido dos Trabalhadores. PABLO KIPERSMIT também não soube informar o porquê dos pagamentos, uma v e z que nunca contratou serviços

ABSTRACT: The toxicological effects of crude ethanolic extracts (CEE) of the seed and bark of Persea americana have been analyzed on larvae and pupae of

Se o esquecimento ocorreu entre o 15° e 24° dia, o risco de redução da eficácia é iminente pela proximidade do intervalo sem ingestão de comprimidos (pausa). No entanto, ainda se

No nível operacional off-line é feita antecipadamente a programação de recursos e sequenciamento de atividades, tipicamente com um horizonte de planejamento de

Com o objetivo de compreender como se efetivou a participação das educadoras - Maria Zuíla e Silva Moraes; Minerva Diaz de Sá Barreto - na criação dos diversos

(2006) que apenas faz a separação do Valor de Consumo em três dimensões, porém não realiza nenhuma verificação empírica destas três dimensões com mais nenhuma

Para isso, dizem os analistas, é preciso que o governo, seja ele qual for, adote ação concentrada, com medidas de compromisso fiscal para manter a dívida pública em

Atención: el soporte de la palanca de cambios es un accesorio para la Playseat Evolution que permite fi jar la palanca de cambios del volante del Logitech G25.. a la