ESTATÍSTICA
UNIVERSIDADE FEDERAL DE ALAGOAS
CENTRO DE TECNOLOGIA
CURSO DE ENGENHARIA CIVIL
PROFESSOR: HELENO PONTES BEZERRA NETO
SUMÁRIO DA AULA
Métodos de coleta e apresentação dos dados
•
Dados observacionais
•
Dados de experimentos planejados
•
Populações e amostras
•
Variáveis
•
Representação gráfica de amostras
MÉTODO ESTATÍSTICO
Definição do problema, objetivos
Planejamento da pesquisa
Execução da pesquisa
Obtenção dos dados
Análise dos dados
Metodologia da área de
estudo
Metodologia estatística
ESTATÍSTICA DESCRITIVA X INDUTIVA
4
DADOS
Estatística descritiva
Estatística indutiva ou
Inferência estatística
O que quero com eles?
Descrevê-los ou
resumi-los enquanto grupo
Tirar/Inferir conclusões
População
ESTATÍSTICA
ESTATÍSTICA
DESCRITIVA
ESTATÍSTICA
INDUTIVA
Permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento
preocupa-se com a coleta, organização e apresentação dos dados (amostrais), sem inferir sobre a população
Análise e interpretação dos dados Inferência de características
Conclusões importantes podem ser inferidas da análise dos dados amostrais. No entanto,
6
ESTATÍSTICA DESCRITIVA X INDUTIVA
De uma população pode-se retirar diversas amostras
cada
amostra tem sua estatística
estamos diante de valores que
variam de amostra para amostra
• Medida numérica que descreve alguma característica de uma população;
• Ex: média da população (µ), variância populacional (σ2),
desvio-padrão populacional (σ)
PARÂMETRO
• Medida numérica que descreve alguma característica de uma amostra;
• Ex: média amostral (𝑿 ), a variância amostral (S2), desvio-padrão
amostral (S)
ESTATÍSTICA DESCRITIVA X INDUTIVA
População amostragem Teoria da
Inferência Estatística
Amostra aleatória
ESTATÍSTICAS
(CONHECIDAS)
PARÂMETROS
INTRODUÇÃO
8
DADOS
Para que
servem?
Como são
coletados?
Como extrair
informações
INTRODUÇÃO
ESTUDOS OBSERVACIONAIS
EXPERIMENTOS PLANEJADOS
EX.:
Estatística esportiva
COLETA DE DADOS
10
Estudo no qual o processo ou sistema em estudo pode ser observado e os dados são coletados à medida que se tornam disponíveis.
Dados obtidos diretamente da observação do processo ou sistema
Dados obtidos através da análise de séries históricas
ESTUDOS OBSERVACIONAIS
EXEMPLOS:
• Sondagem para determinar a resistência do solo;
• Análise do histórico de tensões no topo de uma linha de ancoragem de um navio FPSO.
Sondagem de simples reconhecimento à percussão STP
COLETA DE DADOS
ESTUDOS OBSERVACIONAIS Time (s) 200 150 100 50 0 L in e 1 E ff e c tiv e T e n s io n ( k N ) a t E n d A 500 400 300 200 100 0 -100Minimum Maximum Mean Allowable Tension Compression Limit
T e n s io n ( k N ), t = -0 .0 0 0 1 0 t o 2 0 0 .0 0 0 s 500 400 300 200 100
SÉRIE TEMPORAL DE TRAÇÃO
COLETA DE DADOS
12 EXPERIMENTO PLANEJADO
Permite fazer variações propositais nas variáveis controladas de sistemas e processos, observar os dados de saída e, então, determinar quais variáveis são importantes.
Melhora o desempenho do produto ou processo
Maior confiabilidade
Menor custo global
Redução do tempo do projeto
EXEMPLOS:
• Estudos em túneis de vento de aerodinâmica de veículos e aeronaves com modelos reduzidos;
• Projeto de risers para produção de
CONCEITOS FUNDAMENTAIS
• Subconjunto de uma população, com tamanho finito
• todos os seus elementos serão examinados no estudo estatístico desejado.
AMOSTRA
• Conjunto de elementos com pelo menos uma característica comum
• Inclui a totalidade dos elemento/sujeitos a serem estudados
CONCEITOS FUNDAMENTAIS
14 A pesquisa por população é mais precisa do que a por amostragem.
Mas nem sempre a pesquisa por população é viável.
CONCEITOS FUNDAMENTAIS
• Processo de escolha de uma amostra da população
AMOSTRAGEM
• Conjunto dos dados obtidos de todos os membros da população.
• A palavra tem origem no latim “census” que significa "estimativa".
CONCEITOS FUNDAMENTAIS
16
• É o fato de que sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado sempre.
VARIABILIDADE
• O tamanho da amostra é um função da confiabilidade desejada, do custo e do tempo necessário para o levantamento de dados ou experimentos.
ERROS
1. Ato ou efeito de errar.
2. Juízo falso; desacerto, engano.
3. Incorreção, inexatidão.
4. ...
Os erros que afetam um resultado experimental podem ser
ERROS
18
Erros sistemáticos (ou determinados ou não-amostrais)
São erros que decorrem de um vício no processo de medida, não
tendo, por isso, caráter aleatório; são erros constantes que podem
ser evitados ou cuja grandeza pode ser determinada.
É possível ter controle sobre eles!
Ex.:
Erro de calibração de equipamentos
ERROS
Erros aleatórios (ou indeterminados ou amostrais)
• São pequenas variações que surgem entre medições sucessivas feitas pelo mesmo observador, com o maior cuidado, em condições tão idênticas quanto possível.
• Decorrem de fatores não controlados na realização de análises/medições e seu efeito consiste em produzir ao acaso acréscimos ou decréscimos no valor obtido para a grandeza em questão.
• Embora não seja possível compensar o erro aleatório de um resultado final, ele pode geralmente ser reduzido aumentando-se o número de observações.
EXATIDÃO E PRECISÃO
20
•
Concordância entre o resultado e o valor verdadeiro, ou o
mais provável.
•
Dessa forma,
os erros sistemáticos provocam erro
constante e assim afetam a exatidão de um resultado.
EXATIDÃO
•
A precisão pode ser definida como a concordância de
uma série de medidas da mesma grandeza.
PRECISÃO
A exatidão exprime a correção (qualidade de correto) de uma medida, enquanto a precisão exprime a sua “reprodutibilidade” ou “repetibilidade”.
EXATIDÃO E PRECISÃO
Precisão:
pressupõe-se que, se a mesma for repetida várias vezes a
variação da mesma em relação ao valor médio medido é baixa
EXATIDÃO E PRECISÃO
ERRO ABSOLUTO E ERRO RELATIVO
•
O erro absoluto é a diferença entre o valor observado, ou
medido, e o valor verdadeiro da grandeza observada.
•
É uma medida da exatidão da medida.
ERRO ABSOLUTO
•
O erro relativo é o quociente entre o erro absoluto e o
valor verdadeiro. Usualmente expresso em percentagem.
ERRO RELATIVO
ERRO ABSOLUTO E ERRO RELATIVO
24 EXEMPLO: Sabe-se que o valor da resistência à compressão de um determinado concreto é 35 MPa.
Três técnicos, usando a mesma metodologia e os mesmos equipamentos, fizeram a determinação da resistência utilizando corpos de prova e obtiveram os seguintes resultados:
Técnico A
Técnico B
Técnico C
36
40
31
35
38
39
34
39
32
35
38
40
37
37
38
ERRO ABSOLUTO E ERRO RELATIVO:
EXEMPLO
Técnico A B C
Valor médio 35 38 35
Faixa dos valores 33 - 37 36 - 40 31 - 40
Erro relativo médio (%) 2,86 8,57 11,43
Valor
ERRO ABSOLUTO E ERRO RELATIVO:
EXEMPLO
26
1. O técnico A foi aquele que obteve os valores mais exatos, ou seja, mais próximos do valor real. Seus resultados dispõem-se em ambos os lados do valor real e isso pode ser atribuídos a erros aleatórios;
2. O técnico B apresentou resultados com boa precisão, mas não são exatos. Há neste caso uma forte tendência de existência de erro sistemático, pois os valores obtidos foram todos superiores ao valor real;
3. O técnico C, embora o valor médio tenha coincidido com o valor real, apresentou valores sem exatidão e sem precisão.
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
NÍVEL DE MENSURAÇÃO
QUALITATIVAS: suas
realizações são atributos
dos elementos pesquisados.
QUANTITATIVAS
(intervalares): suas realizações são números resultantes de
contagem ou mensuração
Nominais: apenas identificar as categorias Ordinais: é possível ordenar as categorias Discretas: podem assumir apenas alguns valores Contínuas: podem assumir infinitos valores
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
28
DADOS BRUTOS: dados originais na forma com que foram coletados (não
foram numericamente organizados ou ordenados)
DADOS ELABORADOS (ROL): dados numéricos arranjados em ordem
crescente ou decrescente
A forma de representar os dados depende da sua natureza
Para dados qualitativos a enumeração e a tabulação são as formas mais
simples de representá-los
Para os dados quantitativos a forma de representação mais simples é a
distribuição de frequência
A distribuição de freqüência é a distribuição dos dados em classes ou
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Tabela
Dados brutos não permitem, de maneira fácil e rápida, a obtenção de
informações; torna-se difícil detectar a existência de algum padrão;
É necessário trabalhar os dados para transformá-los em informações e
compará-los com outros resultados;
Sumários e apresentações de dados bem constituídos são essenciais ao
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
CVDOT
Características para descrição de um conjunto de dados (amostra)
Tempo (
Changes over
T
ime
)
O
utliers
Distribuição de frequências (
D
istribution
)
Variação (medidas de dispersão) (
V
ariation
)
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
32
As técnicas de organização e apresentação de dados permitem:
Detectar
erros e inconsistências
ocorridos em um processo
Determinar as principais características dos dados (
CVDOT
)
Propiciar familiaridade com os dados de coleta de dados
Objetivos:
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Coleta de dados
Etapa de obtenção dos valores que serão manuseados
Exemplo: Tração efetiva no topo de um mangote
Effective Tension (kN)
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
34
Confecção do Rol
1. Etapa de ordenação dos valores (ordem crescente) 84.18582 84.94612 87.61359 90.02599 91.87231 98.08106 98.26376 98.26376 105.8 110.913 112.5423 114.6179 117.5956 119.8015 120.0429 125.2499 125.5945 126.4716 129.1179 134.5704 141.6716 145.7873
2. Cálculo da amplitude de variação (𝐴)
𝐴 = 𝑥𝑚á𝑥 − 𝑥𝑚𝑖𝑛
𝐴 = 145.7873 − 84.18582 = 61.60144
Com o Rol e com a amplitude obtida a partir dele, pode-se ter uma ideia tanto da distribuição quanto da variação
Faixa de variação (amplitude total)
Distribuição (ordenação)
C
V
D
OT
MenorCOLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Quando o volume de dados é grande, ordenar resultados pode ser
trabalhoso;
Para grandes volumes de dados, uma listagem ordenada representa pouco
Para esses casos, uma simplificação apropriada seria o agrupamento dos
dados em classes representativas (faixas ou intervalos de valores)
Grupamento em classes
Quantas classes?
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
36 DIVISÃO DE CLASSES: ASPECTOS A CONSIDERAR
As classes devem abranger todas as observações
O extremo superior de uma classe é o extremo inferior da classe subsequente
Cada valor observado deve enquadrar-se em apenas uma classe
A quantidade de classes, de modo geral:
• Não deve ser inferior a 5 ou superior a 25
• Deve estar entre 5 e 10, idealmente
𝑘 = 1 + 3,32 log 𝑛
Onde de observações/dados 𝑛 é o número (tamanho da amostra)COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
DIVISÃO DE CLASSES
Aplicando ao nosso exemplo:
n = 22
k = 1 + 3,32 . log 22 k = 5,4568
arredondando por excesso tem-se: k = 6
Decorre da fórmula de Sturges
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
38
h é o tamanho de cada classe (inteiro, arredondado por excesso)
A é a amplitude total do conjunto de observações
k é o número de classes TAMANHO DAS CLASSES
ℎ =
𝐴
𝑘
Aplicando ao nosso exemplo:
𝐴 = 61.60144 𝑘 = 6
ℎ = 61.601446 = 10.266
Arredondando (sempre por excesso): ℎ = 11
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
6 classes, com tamanho de cada classe igual a 11 implica em 66 valores (amplitude maior que a observada)
Para garantir boa representação dos dados, o aumento deve ser dividido entre os extremos
Classes
82 93
93 104
104 115
115 126
126 137
137 148
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
40
Frequência é o número de vezes que um valor aparece no domínio de uma classe.
Distribuição de frequências
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Distribuição de frequências: Elementos
Ponto Médio da classe (Xi): É a média dos pontos extremos da classe
Frequência da classe (ni): É a quantidade de observações da classe, que se
supõe concentrada no respectivo ponto médio
Frequência relativa da classe (fi):
Frequência acumulada (Ni) até a i-ésima classe: Indica a quantidade de
observações inferiores ao limite superior da i-ésima classe
𝑓𝑖 = 𝑛𝑛𝑖
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
42 Distribuição de frequências: Construção
1. Ponto médio das classes (𝑿𝒊)
Classe 𝑋𝑖
82 93 87.5
93 104 98.5
104 115 109.5
115 126 120.5
126 137 131.5
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Distribuição de frequências: Construção
2. Frequência absoluta de cada classe (𝒏𝒊)
Classe 𝑋𝑖 𝑛𝑖
82 93 87.5 5
93 104 98.5 3
104 115 109.5 4
115 126 120.5 5
126 137 131.5 3
137 148 142.5 2
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
44 Distribuição de frequências: Construção
3. Frequência relativa de cada classe (𝒇𝒊)
Classe 𝑋𝑖 𝑛𝑖 𝑓𝑖 𝑓𝑖 (%)
82 93 87.5 5 0.227273 22.72727
93 104 98.5 3 0.136364 13.63636
104 115 109.5 4 0.181818 18.18182
115 126 120.5 5 0.227273 22.72727
126 137 131.5 3 0.136364 13.63636
137 148 142.5 2 0.090909 9.090909
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Distribuição de frequências: Construção
Classe 𝑋𝑖 𝑛𝑖 𝑓𝑖 𝑓𝑖 (%) 𝑁𝑖
82 93 87.5 5 0.227273 22.72727 5
93 104 98.5 3 0.136364 13.63636 8
104 115 109.5 4 0.181818 18.18182 12
115 126 120.5 5 0.227273 22.72727 17
126 137 131.5 3 0.136364 13.63636 20
137 148 142.5 2 0.090909 9.090909 22
TOTAL 22 1 100
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
46 Distribuição de frequências: Construção
5. Frequência relativa acumulada de cada classe (𝑭𝒊)
Classe 𝑋𝑖 𝑛𝑖 𝑓𝑖 𝑓𝑖 (%) 𝑁𝑖 𝐹𝑖 𝐹𝑖(%)
82 93 87.5 5 0.227273 22.72727 5 0.227273 22.72727
93 104 98.5 3 0.136364 13.63636 8 0.363636 36.36364
104 115 109.5 4 0.181818 18.18182 12 0.545455 54.54545
115 126 120.5 5 0.227273 22.72727 17 0.772727 77.27273
126 137 131.5 3 0.136364 13.63636 20 0.909091 90.90909
137 148 142.5 2 0.090909 9.090909 22 1 100
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
São representações pictóricas dos dados
São muito valiosos para a visualização dos resultados
GRAFÍCOS
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
48
Histograma
Polígono de frequência
Ogiva
Gráfico em barras (ou em colunas)
Gráfico de pontos
Gráfico de setores
Gráfico em linha
Pictograma
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Gráfico representativo de uma distribuição de frequências, através de retângulos justapostos;
Em um histograma, os retângulos possuem as bases sobre um eixo dividido de acordo com o tamanho das classes, centro nos pontos médios das classes e áreas proporcionais às freqüencias
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
50 Gráfico que se obtém unindo-se por uma poligonal os pontos
correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios;
O histograma e o polígono de frequência são gráficos alternativos e contém a mesma informação. A escolha entre um e outro depende da preferência do analista de dados
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
52 OGIVA
Gráfico que permite descrever dados quantitativos por meio da frequência acumulada.
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
Mais adequado para variáveis discretas, mas também pode ser utilizado para variáveis qualitativas ordinais, ou ainda, para variáveis qualitativas nominais cujos nomes das categorias são pequenos (não apresenta muitos valores distintos).
Neste gráfico, cada valor observado é representado por retângulos de mesma base e alturas proporcionais as frequências.
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
54 Adequado para representar variáveis qualitativas.
Consiste num círculo de raio arbitrário representando o todo, dividido em setores, que correspondem às partes de maneira proporcional.
Fórmula: ϴ = fi x 360o
Gráfico de Pizza para a variável idade.
12 15 17 18 19 20
Tabela 1. Tabela de Frequências da variável idade, para um grupo de
12 pessoas.
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
EX.: Construa o gráfico de barras e pizza para o exemplo: variável produção de barris de petróleo no ano de 2012.
0 5 10 15 20 25 30
Produção
no ano de 2012
2052 2082 2122 2180 2.180 2.122 2.214
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
56 GRÁFICO DE LINHA
É indicado para mostrar tendências e evolução de uma variável contínua por outra variável contínua;
Em um gráfico de linhas, ao contrário dos gráficos de barras, as séries podem ser longas.
COLETA, ORGANIZAÇÃO E APRESENTAÇÃO DE DADOS
PICTOGRAMA