• Nenhum resultado encontrado

Quantil Empírico com Base na Técnica de Bootstrap

4. Análise Estatística de Dados Experimentais

4.2. Inferência Estatística

4.2.3. Limites de Controlo Robustos

4.2.3.2. Quantil Empírico com Base na Técnica de Bootstrap

Para a aplicação da técnica de bootstrap é necessário recolher uma amostra de

dimensão n, que é denominada amostra “mestre”.

Hesterberg et al (2003) considera que a amostra “mestre” representa a

população da qual foi retirada. As reamostras desta amostra “mestre”

(Pseudopopulação) representam o que se deve obter quando se retiram muitas amostras da população original. A distribuição bootstrap da estatística de interesse, baseada em muitas reamostras, representa uma distribuição amostral dessa estatística.

Para que da aplicação da técnica resultem resultados confiáveis devem ser feitas, a partir da amostra “mestre”, centenas ou até mesmo milhares de reamostras da mesma dimensão n. É importante que a reamostragem seja realizada com reposição, sempre seleccionando as observações de forma aleatória. Deve-se utilizar alguma ferramenta computacional (no caso deste trabalho foi utilizado o Excel) para a geração de números aleatórios a partir de uma distribuição discreta pré-estabelecida (distribuição da amostra mestre).

122

Uma vez geradas as reamostras, deve calcular-se para cada reamostra as medidas estatísticas (como as medidas de tendência central). Essa técnica não altera nenhuma

observação da amostra “mestre”, apenas trabalha na análise da combinação das

observações iniciais (Rizzo e Cymrot, 2006).

Segundo González et al (1994) uma aplicação da metodologia Bootstrap é obter intervalos de confiança confiáveis. No caso deste trabalho, o pretendido é determinar limites de controlo confiáveis. Trata-se de um método alternativo para a determinação dos limites de controlo das cartas sem ser necessário recorrer a transformações de variáveis. Para a aplicação desta técnica é necessário recorrer ao Excel e utilizar algumas das suas ferramentas.

Para a explicação de como se procede à aplicação da técnica de bootstrap em Excel, toma-se como exemplo o conjunto de dados da pureza do grupo 1. Inicialmente têm-se 36 observações. Portanto começou-se por aplicar a fórmula “=ÍNDICE($A$2:$A$37; ALEATÓRIOENTRE(1; CONTAR($A$2:$A$37)))”, em que aqui o que acontece é que das observações iniciais (amostra “mestre”) é retirada aleatoriamente uma que vai fazer parte de uma nova amostra bootstrap. No final existe a reposição dessa observação. Assim, esta fórmula é aplicada até existir uma outra amostra de dimensão 36 (obtidos a partir da escolha aleatória da amostra inicial). Continua-se com a aplicação deste procedimento até se obterem mil amostras, cada uma com dimensão 36.

Procede-se ao cálculo das médias das mil amostras, obtendo-se portanto mil

médias.

Método do Quantil Empírico

Os limites de controlo obtidos pelo método do quantil empírico são definidos de acordo com (Vermaat et al, 2003), onde o estimador natural do quantil-q de uma distribuição unimodal desconhecida, com função distribuição cumulativa F, é o quantil

empírico F-1(q), que é definido pela equação 65.

123

onde ̂ (equação 66) é a função de distribuição cumulativa empírica com massa de

probabilidade 1/k em cada Xi, 1  i  k, i.e.

̂ { }

(66)

onde I representa a função indicatriz, i.e. I{x  y} é igual a 1 se x  y e 0 caso contrário.

Assim, os estimadores óbvios para o cálculo dos LSC e LIC baseados no quantil empírico são dados, respectivamente, pelas equações 67 e 68.

̂ (67)

̂ (68)

Aqui X(1) ≤ X(2) ≤ … ≤ X(n) denota a amostra inicial X1 ≤ X2 ≤ … ≤ Xn ordenada

estatisticamente e . denota o menor inteiro não menor que o argumento, e .

representa a característica, i.e., é o maior inteiro que não excede o argumento.

De notar que, as cartas de controlo não-paramétricas são atraentes para grandes amostras, ou seja, são precisas pelo menos 1000 observações, para que possa ser alcançada uma boa performance com este método. Motivo pela qual recorremos à técnica de reamostragem bootstrap.

Deste modo, continua-se com a aplicação deste método em Excel, onde para o

cálculo do limite superior de controlo, é utilizada a fórmula

“=PERCENTIL(D2:D1001;0,99865)”. Aqui é determinado o valor que compreende 99,9% dos valores de médias determinadas. Para o LIC, utiliza-se a fórmula “=PERCENTIL(D2:D1001;0,00135)”, aqui o principio é o mesmo, mas o valor pedido é aquele em que acima se encontram 99,9% das médias determinadas.

As células de Excel, contidas nas fórmulas apresentadas, são aquelas que compreendem os valores utilizados neste caso concreto.

De seguida apresentam-se os limites de controlo obtidos pela utilização dos métodos estatísticos atrás apresentados.

124

4.2.3.3. Água Desmineralizada

Condutividade

Para a variável condutividade da água desmineralizada (µS/cm) aplicou-se o método da mediana das amplitudes móveis e foi obtida uma amplitude para os limites de controlo consideravelmente menor que a obtida para os limites de controlo obtidos pelo método da média das amplitudes móveis (Tabela 25).

Tabela 25 – Limites de controlo da variável condutividade da água desmineralizada (µS/cm). Limites de Controlo L.S.C. L.I.C. Amplitude

Média Amp. Móveis 0,751 0,645 0,106 Mediana Amp. Móveis 0,738 0,658 0,094

Sílica Solúvel

Na variável sílica solúvel (µg SiO2/L) o comportamento das amplitudes dos

limites de controlo (Tabela 26) é semelhante ao caso da condutividade da água desmineralizada. Ou seja, após a aplicação do método da mediana das amplitudes móveis obteve-se, mais uma vez, uma amplitude consideravelmente menor em relação ao obtido no método da média das amplitudes móveis.

Tabela 26 – Limites de controlo da variável sílica solúvel da água desmineralizada. Limites de Controlo L.S.C. L.I.C. Amplitude

Média Amp. Móveis 8,961 1,399 7,562 Mediana Amp. Móveis 7,574 2,786 5,661

Em relação ao capítulo da análise estatística, resta verificar a aplicação dos métodos da mediana das amplitudes móveis e do método do quantil empírico, com utilização do bootstrap, às variáveis da pureza do gesso, que não têm distribuição aproximadamente normal.

125

4.2.3.4. Pureza do Gesso

Na variável pureza do gesso (% sulfato de cálcio) é possível verificar dois comportamentos um pouco distintos (Tabela 27). Os limites de controlo da variável da pureza do grupo 2 apresentam um comportamento em tudo semelhante ao caso das variáveis de condutividade e sílica solúvel da água desmineralizada, ou seja por ordem decrescente de amplitude tem-se os limites de controlo obtidos pelo método da média das amplitudes móveis, seguido pela amplitude do método da mediana das amplitudes móveis. Por fim, tem-se, os limites de intervalo de controlo obtidos pelo método do quantil empírico, que é considerado o mais robusto a desvios da normalidade.

Relativamente à variável da pureza do gesso do grupo 1, quando é aplicado o método da mediana das amplitudes móveis obtém-se uma menor amplitude que a obtida pelo método da média de amplitudes móveis. Contudo, ao ser aplicado o método do quantil empírico obtém-se uma amplitude para os limites de controlo superior ao anterior, mas ainda assim bem menor do que o inicial (média das amplitudes móveis).

Tabela 27 – Limites de controlo da variável pureza do gesso (% sulfato de cálcio) do grupo 1 e 2.

Limites de Controlo Grupo 1 Grupo 2

L.S.C. L.I.C. Amplitude L.S.C. L.I.C. Amplitude Média Amp. Móveis 98,205 94,326 3,879 98,664 94,281 4,383 Mediana Amp. Móveis 96,709 95,821 1,050 97,2274 95,7169 1,786 Bootstrap 97,013 95,477 1,536 97,108 95,821 1,287

127

Documentos relacionados