0.00 0.05 0.10 0.15 0.20 0.25 Histograma e Normal pdf xhist yhist
Figura 4.11: Histograma e distribuição Normal
2 2δ = 2ξ q ∑ni=1 y2 i n = s ∑ni=1(yi− y∗i)2 ∑ni=1y2i
Normalmente estes indicadores são relativos à percentagem da média correspondente.
Uma técnica gráfica para avaliar a qualidade do ajustamento pode ser desenhar simultanea- mente a curva da pdf e o respetivo histograma.
4.6
Os testes de hipóteses
Os testes de hipóteses indicam-nos se é razoável ou não assumir que uma amostra aleatória vem de uma específica distribuição.
Existem alguns testes onde a hipótese nula e alternativa são consideradas da seguinte forma: • H0: Os dados da amostra são da distribuição escolhida
• HA: Os dados da amostra não são da distribuição testada
Estes testes são chamados às vezes como teste globais e são de distribuição livre, ou seja, não dependem da função de densidade de probabilidade (pdf).
O teste qui-quadrado é o mais antigo teste de ajuste que remonta a Karl Pearson (1900). O teste pode ser pensado como uma comparação formal de um histograma com a densidade ajustada.
Uma característica importante do teste qui-quadrado é que pode ser aplicado para distribuições univariadas em que conseguimos calcular a função distribuição acumulada.
O teste é aplicado para variáveis com dados agrupados; para dados não agrupados podemos elaborar um histograma ou uma tabela de frequências antes de gerar o teste da qui-quadrado. No entanto, o valor do teste da qui-quadrado depende da forma como se agruparam os dados. Outra desvantagem do teste é que requer um número de amostras suficiente de modo a que a aproximação da qui-quadrado possa ser válida.
O teste do qui-quadrado pode ser aplicado quer a distribuições discretas ou contínuas, en- quanto outros testes como Kolmogorov-Smirnov e Anderson-Darling estão restritos a distribuições contínuas.
Para estimar parâmetros de modelos com amostras o teste do qui-quadrado é definido pelas hipóteses:
• H0: os dados seguem a distribuição especificada • HA: os dados não seguem a distribuição escolhida
Para o cálculo do ajustamento do qui-quadrado, os dados são divididos em K classes e o teste estatístico é definido desta forma:
χ2= k
∑
i=1 (Oi− Ei)2 EiOnde Oié a frequência observada para a classe i e Eié a frequência esperada para a classe i.
A frequência esperada é calculada pela distribuição acumulada. A estatística do teste é dis- tribuída segundo uma variável aleatória χ2com k-p-1 graus de liberdade (p é o número de parâmet-
ros estimados pelos dados da amostra).
A hipótese que os dados sejam de uma população com uma distribuição específica é aceite se χ2 é menor o valor da função qui-quadrado com k - p-1 graus de liberdade e um nível de
significância de α. O teste do qui-quadrado é sensível á escolha das classes.
No sofware R existem três maneiras de realizar o teste da qui-quadrado. No caso de dados discretos podemos usar goodfit()incluido no vcd package (está disponível no CRAN website):
library(vcd) instala o vcd package
gf<-goodfit(x.poi,type= "poisson",method= "MinChisq") Goodness-of-fit test for poisson distribution
X2 d f P( X2)
Pearson 2.878727 7 0.8959896
plot(gf,main="Dados agrupados vs Distribuição de Poisson ")
H0 é aceite quando o p-value é maior que o nível de significância fixado, que será pelo menos de 5%.
4.6 Os testes de hipóteses 53 0 2 4 6 0 1 2 3 4 5 6 7 8 Number of Occurrences sqr t(Frequency)
Dados agrupados vs Distribuição de Poisson
Figura 4.12: Ajustamento de Poisson
Quando estamos a trabalhar com variáveis contínuas e todos os seus parâmetros são conheci- dos podemos usar chisq.test():
calculo das frequêncais relativas esperadas
p<-c((pgamma(3,shape=3.5,rate=0.5)-pgamma(0,shape=3.5,rate=0.5)), (pgamma(6,shape=3.5,rate=0.5)-pgamma(3,shape=3.5,rate=0.5)), (pgamma(9,shape=3.5,rate=0.5)-pgamma(6,shape=3.5,rate=0.5)), (pgamma(12,shape=3.5,rate=0.5)-pgamma(9,shape=3.5,rate=0.5)), (pgamma(18,shape=3.5,rate=0.5)-pgamma(12,shape=3.5,rate=0.5))) chisq.test(x=f.os,p=p,rescale.p=T) teste qui-quadrado
Chi-squared test for given probabilities data: f.os
X-squared = 2.8361, df = 4, p-value = 0.5856
Não podemos rejeitar a hipótese nula dado que o p-value é ligeiramente superior, por isso provávelmente a amostra pertence à distribuição gamma com os parâmetros de forma de 3.5 e de taxa de 0.5.
O teste de Kolmogorov-Smirnov é usado para decidir se uma amostra vem de uma população com uma distribuição específica. Baseia-se numa comparação entre a função de distribuição em-
pírica (ECDF) e um pdf teórico definido como F(x) = Z x α F(x, θ )dy onde F(x, θ ) é a função pdf.
Dado n dados ordenados com pontos x1, x2, . . . xn, a função empírica acumulada é definida
como:
Fn(Xi) = N(i)/n
onde N (i) é o número de pontos de Xi(Xisão ordenados do menor para o maior valor). Esta é
uma função degrau que aumenta em 1/n ao valor de cada ponto.
A estatística de teste utilizado é:
Dn= sup |F(xi) − Fn(xi)|
1 ≤ i ≤ n
que Dné o extremo superior entre diferencias do valor absoluto entre a distribuição acumulada
empírica e teórica.
A hipótese sobre a forma de distribuição é rejeitada se a estatística de teste, Dn, é maior do que o valor crítico obtido a partir de uma tabela, ou, o que é o mesmo, se o valor p é menor do que o nível de significância.
O teste Kolmogorov-Smirnov é mais poderoso do que o qui-quadrado quando o tamanho da amostra não é muito grande. Para amostras de tamanho grande ambos os testes têm o mesmo potencial.
A limitação mais grave de Kolmogorov-Smirnov é que a distribuição deve ser totalmente es- pecificada, isto é, os parâmetros de localização, dimensão e forma não podem ser estimados a partir da amostra de dados.
Devido a esta limitação, muitos analistas preferem utilizar o teste de Anderson-Darling no ajuste. No entanto, o teste de Anderson-Darling só é possível para algumas distribuições específi- cas
No R podemos realizar o teste Kolmogorov-Smirnov usando a função ks.test().
Aplicando este teste a uma amostra pertencente a uma weibull com parâmetros conhecidos (forma=2 e escala=1), temos:
ks.test(x.wei,"pweibull", shape=2,scale=1) One-sample Kolmogorov-Smirnov test
data: x.wei
D = 0.0623, p-value = 0.4198
4.6 Os testes de hipóteses 55 0.0 0.5 1.0 1.5 2.0 0.0 0.2 0.4 0.6 0.8 1.0 ECDF e Weibull CDF x pw eib
ull(x, scale = 1, shape = 2)
Figura 4.13: Ajustamento da distribuição Weibull
Aceitamos a hipótese nula de que os dados seguem uma distribuição normal porque o p-value é suficientemente maior que o nível de significância usualmente referido na literatura de estatística.
Capítulo 5
Estudo de Caso
Neste capítulo desenvolve-se um exemplo de aplicação utilizando as metodologias e ferramen- tas que descrevemos nos capítulos anteriores. Começamos por descrever sucintamente a empresa e desenhar um modelo conceptual do sistema real, assumindo algumas premissas que simplificam a realidade do serviço, circunscrevendo a área de realização de tarefas geograficamente. No nosso entender, as simplificações realizadas não distorcem a realidade e permitem que o comportamento dos cenários de simulação imitem o comportamento do sistema real. Existem sempre algumas exceções na forma como o serviço é desenvolvido ou executado.
A análise de dados permite-nos ter uma geração de ordens de trabalho aleatórias, bastante idêntica à realidade, o que nos permite dar maior robustez e fiabilidade à nossa simulação.
Desenvolvemos quatro cenários diferentes do nosso modelo geral, de forma, a poder comparar a melhor solução e fundamentar as opções de dimensionamento das equipas técnicas. No final são discutidos os resultados obtidos.
5.1
A empresa e o seu modelo de negócio
A empresa em análise tem uma equipa de colaboradores jovem e dinâmica, de três efetivos e três estagiários. Dedica-se à instalação e manutenção de sistemas na área da climatização e energias alternativas.
Situa-se na região de Viseu e já teve, na anterior gerência, uma cobertura nacional, estando agora só focalizada a realizar serviços na zona centro, daí a nossa análise de dados e consequente- mente as simulações dos nossos modelos se restrinjam à zona centro.
Os serviços da empresa incluem reparações, afinações e verificações de equipamento, bem como o arranque de equipamentos. Todos estes equipamentos, podemos dizer, que se incluem na área de energias renováveis e o cliente tanto pode ser doméstico como industrial, sendo a maioria dos clientes domésticos. O serviço de assistência prestado, necessita legalmente de qualificações próprias, sendo uma mais valia da empresa ter técnicos certificados para as diferentes tarefas a realizar.
O processo de negócio da empresa pode ser visto de uma forma muito simplificada como na seguinte figura:
Pedido de assistência Tempo de espera Execução do pedido
Figura 5.1: Modelo simples de assistência técnica
A empresa codificou os tipos de intervenção que realiza, o que nos permitiu uma análise de da- dos mais rigorosa. A empresa elaborou um código bastante simples: numérico e sequencial devido ao reduzido número de tarefas diferentes (aproximadamente 30). Na nossa perspectiva pensamos ser melhor ter um código diferente: do tipo alfanumérico e que identificasse logo se a actividade é de manutenção correctiva ou preventiva ou se é de arranque de um equipamento novo. Com a nova codificação poderia no futuro ter um número maior de tarefas diferentes e um controlo mais efectivo e fácil de visualizar das actividades realizadas pela empresa. A codificação dos tipos de intervenções actualmente definidos podem ser vistos na tabela5.1.
Tabela 5.1: Codificação dos tipos de intervenção
Descrição Código
Reparação caldeira gasóleo sem AQS 1 Reparação caldeira gás sem AQS 2 Reparação caldeiras biomassa sem AQS 3 Reparação BC sem AQS 4 Reparação acumuladores sem AQS 5 Reparação caldeira a gasóleo sem aquecimento 6 Reparação caldeira a gás sem aquecimento 7 Reparação caldeiras biomassa sem aquecimento 8 Reparação BC sem climatização 9 Reparação ar condicionado 10 Verificação caldeira a gasóleo 11 Verificação caldeira a gás 12 Verificação equipamentos biomassa 13
Verificação BC 14
Descrição Código Verificação ar condicionado 15 Verificação equipamentos lenha 16 Verificação sistema solar 17 Verificação acumuladores 18 Manutenção caldeiras a gasóleo 19 Manutenção caldeiras a gás 20 Manutenção ar condicionado 21 Manutenção BC 22 Manutenção sistema solar 23 Arranque caldeira gasóleo 24 Arranque caldeira a gás 25 Arranque queimador gasóleo 26 Arranque queimador a gás 27
Arranque BC 28
Arranque equipamentos biomassa 29