A seguir são apresentados alguns conceitos fundamentais para aplicação das técnicas de planejamento de experimentos.
Variáveis de resposta: são as variáveis dependentes que sofrem alguns efeitos nos experimentos quando são alterados os fatores que regulam o processo. Podem existir uma ou várias variáveis de resposta. Na análise de risco, as variáveis de resposta são denominadas de funções-objetivo, as quais podem ser parâmetros de produção, tais como Np, Gp ou Wp ou parâmetros econômicos, como, por exemplo, VPL.
Variáveis: são os fatores alterados deliberadamente num experimento. No caso de análise de risco, atributos, os quais estão associados a parâmetros geológicos do reservatório como, por exemplo, contato água-óleo, permeabilidade vertical, porosidade, compressibilidade da rocha, etc.
Níveis dos atributos: as condições de operação dos fatores são identificados geralmente por (-1) nível pessimista, (0) nível base ou provável e (+1) nível otimista.
Efeito principal: é a diferença média observada numa determinada função-objetivo quando se muda o nível do atributo investigado, ou seja, quando seus níveis passam de um valor para outro.
Efeito de interação: é a metade da diferença entre os efeitos principais de um atributo nos níveis de outro atributo. Portanto, os efeitos de interação são causados na função-objetivo pela interação entre atributos, sendo que o efeito de um atributo depende do nível de outro atributo. O efeito de interação pode ser de segunda, terceira ou de ordem superior, de acordo com o número de atributos que são considerados no processo.
Procedimento para Uso
No processo de análise de risco há geralmente um elevado número de atributos incertos, de modo que o planejamento de experimentos deve se basear numa metodologia estatística para que respostas precisas sejam extraídas. Os procedimentos a serem seguidos no planejamento de experimentos são:
1. Reconhecimento e definição do problema;
2. Escolha dos atributos incertos (variáveis de influência), definindo seus respectivos níveis;
3. Seleção das funções-objetivo;
4. Determinação de um modelo de planejamento de experimento; 5. Condução das simulações;
6. Análise dos dados, através de técnicas estatísticas, de modo que as conclusões estabelecidas sejam objetivas;
7. Elaboração das conclusões e recomendações a partir da análise dos resultados.
Análise de Variância (ANOVA)
A análise de variância é um procedimento estatístico utilizado para avaliar a qualidade do ajuste de um modelo, verificando se os efeitos principais e os efeitos de interação são de fato significativos. Visa basicamente examinar se existe diferença expressiva entre as médias dentro de um determinado grupo e também as médias entre grupos, permitindo analisar o(s) efeito(s) da(s) variável(is) independente(s) sobre as variáveis dependentes (respostas ou funções-objetivo).
A análise da variância de um modelo é realizada através da decomposição algébrica dos desvios das respostas (y) observadas em relação à resposta média global. O desvio de uma resposta individual em relação à média de todas as respostas observadas,
(
yi −y)
, pode ser decomposto em duas parcelas:O termo
(
yˆi −y)
representa o desvio da previsão feita pelo modelo para o ponto em questão, ŷ, em relação à média global. O termo(
yi− representa a diferença entre o valor y)
observado e o valor predito. Se o modelo for bem ajustado, sem resíduo, os valores de(
yi )−yi)
deverão ser aproximadamente iguais ao desvio(
y)i −y)
.Elevando todos os termos a equação acima ao quadrado, tem-se a equação abaixo que é denominada de soma quadrática dos desvios:
(
)
∑(
)
∑(
)
∑
− 2 = − 2 + − 2 i i i y y y yi y y ) ) Equação A -4[S.Q. em torno da média] = [S.Q. devido à regressão] + [S.Q. residual]
SQT = SQR + SQr Equação A -5
Portanto, uma parte da variação total das observações yi em torno da média y é devida à
equação de regressão e o restante fica por conta dos resíduos. Quanto maior a porção devida à regressão, melhor é o ajuste.
O coeficiente de determinação (R²) quantifica a redução de variabilidade de y obtida pelo emprego das variáveis de regressão X no modelo.
(
)
(
)
∑
∑
− − = = 2 2 ˆ ² y y y y SQ SQ R i i T R Equação A -6O máximo valor de R² é igual à unidade e quanto mais próximo estiver de um, melhor será o ajuste do modelo.
O número de graus de liberdade total (vT) é dado por:
O número de graus de liberdade para a soma quadrática total é vT = (n – 1), uma vez que
um grau de liberdade é destinado para o cálculo da média. Deste modo, o número de graus de liberdade da soma quadrática residual é dado pela diferença entre o número de observações (n) e o número de parâmetros estimados (p): vr = (n – p). Para a regressão, o número de graus de liberdade é dado por vR = (p – 1). As médias quadradas (MQ) são dadas pela divisão das somas
quadráticas pelos respectivos números de graus de liberdade, sendo úteis em testes para interpretação estatística e para o cálculo de intervalos de confiança. Um resumo é apresentado na Tabela A-1, a qual é denominada de tabela de análise de variância ou simplesmente ANOVA.
Tabela A-1 - Tabela para análise de variância para fatores simples. (Montgomery, 1996)
Fonte de variação Soma quadrática Graus de liberdade Médias Quadráticas F0
Regressão
∑(
yˆi − y)
2 vR = p - 1 1 − = p SQ MQ R R r R MQ MQ Resíduo∑(
yi −yˆi)
2 vr = n - p p n SQ MQ r r = − - Total∑(
yi − y)
2 vT = n - 1 - -Teste de Significância para Regressão
O teste de significância estatística da regressão é um teste para determinar se a relação entre as variáveis de resposta y e as variáveis de regressão x1, x2,..., xn é linear. Para isto, são
consideradas duas hipóteses: H0: β1 =β2 = β3 = ...= 0
H1: βj ≠0 para ao menos um j
Se H0 for rejeitada, isto implica que ao menos uma variável de regressão contribui
Porém, se a hipótese H0: β1 = β2 = β3 = ...= 0 for verdadeira, todas as variáveis
independentes são identificadas, entretanto não há uma relação entre X e y e é possível demonstrar que a razão entre as médias quadráticas MQR e MQr segue uma distribuição F:
r R r R MQ MQ p n SQ p SQ F = − − = 1 0 Equação A-8
Como a equação só é valida para β1 =β2 = β3 = ...= 0, pode-se testar a hipótese nula
empregando o valor calculado através da fórmula e comparando-o com o valor tabelado de Fp-1, n- p, no nível de confiança desejado. Se o valor calculado pela equação for maior que o valor
tabelado, p n p r R F MQ MQ − −
> 1, , deve-se descartar a possibilidade de β’s=0. Portanto, há evidência estatística suficiente para acreditar na existência de uma relação linear entre X e y, e quanto maior for o valor de F0, maior confiança. Barros et al. (2001) sugerem uma regra prática para o
emprego da regressão para realização de previsões: considerando o valor de F0 maior que dez
vezes o valor de F tabelado, com o número apropriado de graus de liberdade no nível de confiança escolhido.
Tipos de Planejamento de Experimentos e Superfície de Resposta
Vários tipos de Planejamento de Experimentos (Montgomery (1996), Barros et al. (2001)) são disponíveis na literatura. Neste trabalho, são considerados os seguintes tipos de planejamento:
• planejamento fatorial completo e planejamento fatorial fracionário; • planejamento composto central;
De modo geral, a escolha do tipo de planejamento experimental apropriado pode ter um profundo efeito sobre o sucesso da exploração da superfície de resposta.
A metodologia de superfícies de resposta é uma técnica estatística e matemática útil na modelagem e na análise de problemas em que as funções-objetivo são influenciadas por várias variáveis e cujo objetivo é otimizar a resposta. A principal vantagem em se utilizar a superfície de resposta é o seu baixo custo e rapidez na previsão de novos valores de resposta, quando comparada com o tempo consumido na simulação de fluxo.
Os conceitos envolvidos na escolha de um planejamento experimental para análise de sensibilidade dos dados, para análise de uma superfície de resposta e para otimização de ensaios são complicados. O problema consiste em decidir qual é o planejamento mais indicado para cada etapa da análise de risco.
Os planejamentos fatoriais são um eficiente modo de identificar os efeitos principais significativos em casos com muitas variáveis, executando uma triagem prévia das variáveis. Também podem ser utilizados quando o objetivo do estudo é uma superfície de resposta. Ainda podem ser utilizados os planejamentos de otimização e de modelagem de superfície de resposta, sendo que alguns métodos são indicados por autores que utilizaram o planejamento de experimentos na indústria petrolífera, como por exemplo, o planejamento composto central CCD (Dejean e Blanc (1999)) e Box–Behnken (Friedmann (2000)). Estes planejamentos também podem ser utilizados, se for o caso, para ajuste de superfícies de resposta de segunda ordem.