PROBABILIDADE E
ESTATÍSTICA
PROFESSORA: Michele Agra de Lemos Martins Eng. Civil, M.Sc.
Maceió-AL 2014.2
UNIVERSIDADE FEDERAL DE ALAGOAS CENTRO DE TECNOLOGIA
SUMÁRIO DA AULA
ERROS
ELABORAÇÃO DE GRÁFICOS NO EXCEL
MEDIDAS DE LOCALIZAÇÃO
MÉDIA
MEDIANA
MODA
ERROS
FONTES DE ERRO
Suponha que você está diante do seguinte problema: você está em cima de um edifício que não sabe a altura, mas precisa determiná-la. Tudo que tem em mãos é uma bola de metal e um cronômetro. O que fazer?
onde:
• 𝑆 é a posição final;
• 𝑆0 é a posição inicial;
• 𝑣0 é a velocidade inicial;
• 𝑡 é o tempo percorrido;
• 𝑔 é a aceleração gravitacional.
ERROS
FONTES DE ERRO
A bolinha foi solta do topo do edifício e marcou-se no cronômetro que ela levou 2s para atingir o solo. Com isso podemos concluir, a partir da equação, que a altura do edifício é de 19,6 metros.
Essa resposta é confiável? Onde estão os erros?
• Resistência do ar,
• Velocidade do vento,
• Forma do objeto, etc.
• Estes erros estão associados, em geral, à simplificação do modelo matemático.
Erros de modelagem
• Precisão dos dados de entrada (ex. precisão na leitura do cronômetro);
• Forma como os dados são armazenados (máquina);
• Operações numéricas efetuadas;
• Erro de truncamento.
ERROS
ERRO DE ARREDONDAMENTO E TRUNCAMENTO
Diferença entre a aproximação calculada de um
número e o seu valor matemático exato.
Surge devido ao fato de algumas propriedades
básicas da aritmética real não valerem quando
executadas no computador, pois, enquanto na
matemática alguns números são representados
por infinitos dígitos, na máquina isso não é
possível.
Notação Valor exato Aproximação Erro
1/7 0,1428571429 0,142857 1,429−7 2/9 0,22222222222 0,222222 0,00000022222
ERROS
TÉCNICAS DE ARREDONDAMENTO
A maioria dos números têm representações decimais infinitas, que eventualmente devem ser arredondadas.
Na utilização de equipamento eletrônico para processar uma determinada operação aritmética, se o número obtido não é representável exatamente, o mesmo será representado do forma aproximada.
Há duas maneiras de estabelecer o limite para o último dígito:
• Truncamento:
Exemplo: 0,1428571429 ≈ 0,14285 • Arredondamento:
DIAGRAMAS DE RAMOS E FOLHAS
Dispositivo
semi-gráfico
que estabelece uma forma de organização e
apresentação de dados semelhante a
distribuição de frequências
e
ao histograma.
Considere os dados da tabela abaixo (resistências de corpos de prova):
105 221 183 186 121 181 180 143
97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Que porcentagem dos corpos de prova cai abaixo
DIAGRAMAS DE RAMOS E FOLHAS
O diagrama de ramos e folhas é adequado para
representações visuais
informativas
de um conjunto de dados
𝑥
1, 𝑥
2, … , 𝑥
𝑛, em que cada
número
𝑥
𝑖consiste em,
no mínimo, dos dígitos
.
Etapas para construir um diagrama de ramos e folhas
1. Divida cada número 𝑥𝑖 em duas partes: um ramo, consistindo em 1 ou mais dígitos
iniciais, e uma folha, consistindo dos dígitos restantes;
2. Liste os valores do ramo em uma coluna vertical;
3. Ao lado do ramo, registre a folha para cada observação;
4. Escreva as unidades para os ramos e folhas no gráfico.
GRÁFICOS NO EXCEL
ESTATÍSTICA
DESCRITIVA:
As medidas de tendência central são assim denominadas por indicarem
um
ponto em torno do qual se concentram os dados
.
Este ponto tende a ser o centro do conjunto de dados.
Os principais são:
a mediana, a moda e a média aritmética
.
É a soma de todos os valores observados da variável dividida pelo
número total de observações.
Sob uma visão geométrica a média de uma distribuição é o centro de
gravidade, representa o ponto de equilíbrio de um conjunto de
dados.
É a medida de tendência central mais utilizada para representar a
massa de dados.
Seja (
𝑥
1, … , 𝑥
𝑛) um conjunto de dados. A média é dada por:
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA ARITM. SIMPLES
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA ARITM. SIMPLES
Se
𝑛
observações de uma amostra forem
representadas por
𝑥
1, 𝑥
2, … , 𝑥
𝑛, a média amostral será:
1 n i ix
x
n
Quando a população tiver um número finito de
observações (
𝑁
), a média populacional será:
1Exemplo:
1- Média de gols por partida em um total de 5 jogos: 1 2 2 3 5
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA ARITM. SIMPLES
Considere o número de filhos, por família, para um grupo de 8 famílias:
0, 1, 1, 2, 2, 2, 3, 4
Este resultado eleva em 48,15% o número médio de filhos por família. Assim, ao observar a média, pode-se pensar que a maior parte das famílias deste grupo tem três filhos quando, na verdade, apenas uma tem três filhos.
filhos por família
filhos por família
Entretanto, incluindo ao grupo uma nova família com 10 filhos, a média passa a ser:
𝑥 =
0 + 1 ∙ 2 + 2 ∙ 3 + 3 + 4
8
= 1,875
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA ARITM. SIMPLES
𝑥 =
0 + 1 ∙ 2 + 2 ∙ 3 + 3 + 4 + 10
9
= 2,778
Aparências podem enganar!
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA ARITM. SIMPLES
EXEMPLOResultados
26 27 25 27 34 28 29 24 17 25 26 27 Determinar a média aritmética dos resultados de resistência àcompressão apresentados:
12
1 1
26
27
25 ... 17
25
26
27
Determinar a média aritmética dos resultados de resistência à compressão
apresentados.
40
1 1
49
50
50...
69
71
58, 375
40
40
n
i i
i i
x
x
x
n
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA ARITM. SIMPLES
Em algumas situações, os números que queremos sintetizar têm graus
de importância (pesos) diferentes.
A média aritmética ponderada dos números
𝑥
1, 𝑥
2, … , 𝑥
𝑛, com pesos
𝑝
1, 𝑝
2, … , 𝑝
𝑛,
será:
EXEMPLO:
Composição de nota considerando trabalho, lista e prova com
pesos diferentes.
1 1 n i i i p n i ix p
x
p
Sempre que possível, as medidas estatísticas devem ser calculadas antes
de os dados serem agrupados;
Muitas vezes só conhecemos os dados provenientes da distribuição de
frequência.
Média para dados agrupados
Nesse caso, considere que, em cada classe, todos os valores são iguais ao ponto
médio da classe
𝑥𝑖 – Ponto médio da i-ésima classe 𝑛𝑖 – Frequência absoluta da i-ésima classe
𝑘 – Número de classes
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA
𝑥 =
𝑛𝑖=1𝑛
𝑥
𝑖𝑛
𝑖=
𝑥
𝑖𝑛
𝑛
𝑖𝑛
𝑖=1
= 𝑥
𝑖𝑓
𝑖 𝑛Exemplo:
Calcular o valor médio da resistência do concreto cujos dados estão agrupados na tabela abaixo.
Média para dados agrupados
1 1
.
k i i i k i ix n
x
n
6 1 6 1.
50.8
54.7
58.9
62.6
66.6
70.4
2348
58, 70
8
7
9
6
6
4
40
i i i i i
x n
x
n
Média para dados agrupados
MEDIDAS DE TENDÊNCIA CENTRAL:
MÉDIA
Comparação
–
Dados agrupados e não agrupados
58, 375
x
58, 70
x
Média para dados agrupados
Valor que ocupa a
posição central da série
de observações de uma
variável,
em rol
, dividindo o conjunto em duas partes iguais, ou seja,
a quantidade de valores inferiores à mediana é igual à quantidade de
valores superiores a mesma.
Cálculo da mediana, independentemente do tamanho da amostra:
1. Ordenar as observações em ordem crescente ou decrescente (rol).
2. Calcular a posição central, 𝑝, que a mediana ocupa no conjunto de dados
:
3. Obter a mediana pela equação
𝑝 = 0.5 (𝑛 + 1)
onde 𝑥 é o valor encontrado no rol, 𝐼𝑝 é a parte inteira de 𝑝 e𝐹𝑝 é a parte fracionária (ou decimal).
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
EXEMPLO:
1- O número de gols por partida em um total de 5 jogos: 3 2 1 2 5 2- O número de gols por partida em um total de 6 jogos: 5 3 2 1 2 5
Ex. 1:
rol: 1 2 2 3 5
𝑥
A posição p da mediana é
𝑝 = 0,50 (𝑛 + 1) = 0,50 (5 + 1) = 3
Ex. 2:
rol: 1 2 2 3 5 5
A posição p da mediana é
𝑝 = 0,50 (𝑛 + 1) = 0,50 (6 + 1) = 3,5
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
𝑥 = 𝑥𝐼𝑝 + 𝐹𝑝 𝑥𝐼𝑝+1 − 𝑥𝐼𝑝 = 2 + 0.5 ∙ 3 − 2 = 2,5 𝑥
Exemplo: Suponha o rol da idade dos alunos da disciplina Estatística e Probabilidade do curso de Estatística da UFAL:
18, 18, 19, 20, 20, 20, 20, 20, 20, 21, 21, 22, 23, 24, 25, 25, 25, 26, 29, 30, 35, 37
A posição p da mediana é
𝑝 = 0,50 (𝑛 + 1) = 0,5 (22 + 1) = 11,5 Portanto:
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
Exemplo:
Ache a mediana para o caso da amostra de medidas de níveis de chumbo no ar.
5,40 1,10 0,42 0,73 0,48 1,10
Colocando os resultados em ordem crescente:
0,42 0,48 0,73 1,10 1,10 5,40
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
𝑝 = 0,5 (𝑛 + 1) = 0,5 (6 + 1) = 3,5
𝑥 = 𝑥𝐼𝑝 + 𝐹𝑝 𝑥𝐼𝑝+1 − 𝑥𝐼𝑝 = 0,73 + 0,5 ∙ 1,1 − 0,73 = 0,915
Exemplo:
Agora ache a mediana para o caso da amostra de medidas de níveis de
chumbo no ar, substituindo o valor 5,40 mg/m
3pelo valor 1,20 mg/m
31,20 1,10 0,42 0,73 0,48 1,10
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
Colocando os resultados em ordem crescente:
0,42 0,48 0,73 1,10 1,10 1,2
𝑝 = 0,5 (𝑛 + 1) = 0,5 (6 + 1) = 3,5
𝑥 = 𝑥𝐼𝑝 + 𝐹𝑝 𝑥𝐼𝑝+1 − 𝑥𝐼𝑝 = 0,73 + 0,5 ∙ 1,1 − 0,73 = 0,915
Comparação entre média e mediana
Resultados ordenados 0,42 0,48 0,73 1,10 1,10 5,40Caso 1
Resultados ordenados 0,42 0,48 0,73 1,10 1,10 1,20Caso 2
0,915
x
~
x
~
0,915
1,538
x
x
0,838
A mediana é a mesma (0,915) em ambos os casos
O exemplo ilustra os seguintes fatos:
A média é muito sensível a valores extremos
A mediana não sofre muito com a presença de alguns valores muito altos
ou muito baixos
Comparação entre média e mediana
O algoritmo para cálculo da mediana pressupõe que as observações
estejam em ordem crescente e igualmente espaçadas dentro de cada
classe;
Nesses casos, a mediana pode ser obtida por interpolação linear
Exemplo:
Determinar a mediana dos
resultados de resistência à
compressão agrupados na
tabela ao lado.
MEDIANA PARA DADOS AGRUPADOS
MEDIANA PARA DADOS AGRUPADOS
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
Como existem 40 dados, a mediana é o 20º elemento, e pertence à
MEDIANA PARA DADOS AGRUPADOS
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
Para determinar o 20º elemento, interpolaremos, obtendo:
Classe da
mediana
20 − 15
𝑥 =
24 − 15
60 − 56 𝑥 = 2,22
MEDIANA PARA DADOS AGRUPADOS
MEDIDAS DE TENDÊNCIA CENTRAL:
MEDIANA
Para determinar o 20º elemento, interpolaremos, obtendo:
Classe da
mediana
𝑥 = 𝑙𝑖𝑛𝑓 + 𝑛
Valor (ou valores) que apresenta(m) a maior frequência da variável entre
os valores observados.
Para o caso de valores individuais, a moda pode ser determinada
imediatamente observando-se o rol ou a frequência absoluta dos
dados.
Exemplo:
1- O número de gols por partida em um total de 5 jogos: 1 2 2 3 5 O valor de maior frequência – único valor: 𝑀𝑜 = 2
2- O número de gols por partida em um total de 6 jogos: 1 2 2 3 5 5 Os valores de maior frequência – dois valores: Mo = 2 e 5
Unimodal
Bimodal
Exemplo:
Outros exemplos:
a) 2 4 7 9 11 17
b) 2 4 4 7 7 7 9 11 17 17
c) 2 2 2 4 4 4 7 7 7
d) 2 2 2 4 4 4 7 7 7 9
e) -1 0 0 1 1 2 3 3 4 4 5 6 6
MultimodalMEDIDAS DE TENDÊNCIA CENTRAL:
MODA
Não possui moda (amodal)
Unimodal: Mo = 7
Não possui moda (amodal)