• Nenhum resultado encontrado

3. METODOLOGIA

3.4 Métodos estatísticos

Atendendo à tipologia modular do trabalho experimental desenvolvido, foram seleccionados diferentes critérios de análise da precisão consoante os diversos contextos estudados (tamanho amostral, importância dos resultados, etc.). Em seguida encontram-se sucintamente descritos os vários critérios adoptados no decorrer da análise e discussão de resultados para enquadrar as principais conclusões de forma mais precisa.

Durante a apresentação e discussão de resultados são normalmente feitas referências a ensaios ou amostragens experimentais em condições replicadas. Geralmente foram realizadas 3 réplicas por experiência, e nestes casos foram apresentados o valor médio e o respectivo desvio-padrão. Nas observações gráficas, o desvio-padrão foi também representado por barras de erros. Uma alternativa à apresentação do desvio-padrão é o coeficiente de variação que é calculado como o rácio percentual entre o desvio-padrão e a média de um determinado conjunto de amostras. Por se tratar de um valor normalizado, este parâmetro é bastante útil para melhor ilustrar a variabilidade dos dados experimentais, nomeadamente quando se pretendem comparar as variabilidades de dois grupos com valores médios com diferentes ordens de grandeza.

Por outro lado, nas situações em que a dimensão amostral assim o permitiu, foram construídos intervalos de confiança com base numa população normalmente distribuída, tomando a distribuição t de Student, de acordo com a Eq. 3-17, onde ̅ é a média aritmética amostral, t o valor da distribuição t de Student correspondente ao nível de significância α e n-1 graus de liberdade, a estimativa para o desvio-padrão amostral e n o número de casos:

[ ̅

√ ̅ √ ] Eq. 3-17

Para a comparação de médias entre grupos diferentes ou, por outras palavras, para determinar a igualdade (ou desigualdade) das condições experimentais

diferentes, foi utilizado o teste t de Student para comparação de médias entre amostras independentes, sob as seguintes hipóteses:

H0: ̅ ̅ Eq. 3-18

H1: ̅ ̅ Eq. 3-19

O procedimento do teste compreende o cálculo da seguinte estatística, onde ̅ e ̅ são respectivamente as médias do grupo 1 e do grupo 2, e as estimativas para as variâncias dos grupos 1 e 2, e n1 e n2 o número de casos de cada grupo.

̅ ̅

√ Eq. 3-20

A hipótese nula de igualdade das médias de ambos os grupos é rejeitada se a estatística t0 exceder t, n1+n2-1 (ou se o p-value for inferior ao nível de significância

adoptado).

3.4.1 Modelação de superfícies (Response Surface Methodology,

RSM)

A Response Surface Methodology (RSM) é um vasto conjunto de técnicas estatísticas e matemáticas capazes de solucionar vários tipos de problemas, sendo frequentemente utilizada em sectores industriais tão diversos como a electrónica, a química, a biotecnológica, ou o aeroespacial. Em termos gerais, as técnicas de RSM visam um dos seguintes objectivos: (1) mapeamento de um comportamento numa determinada região experimental de interesse; (2) optimização de uma resposta de um processo; e (3) selecção de condições operacionais para atingir determinadas especificações da resposta (Myers et al., 2009).

Nos problemas de RSM desconhece-se a relação entre a resposta e as variáveis independentes. A solução passa por aproximar uma função polinomial de baixa ordem numa determinada região das variáveis independentes. Se a resposta não for linear, deve-se então aproximar o comportamento experimental com uma função de ordem superior. De entre vários tipos de equações possíveis, os modelos de 2ª ordem têm sido muito utilizados em estudos de RSM, principalmente porque são bastante flexíveis na

representatividade do conjunto estrutural, porque os seus parâmetros são facilmente estimáveis, e porque existe um elevado historial de experiência na utilização destas equações para modelar diferentes realidades.

No âmbito desta tese, a RSM foi utilizada para produzir modelos quadráticos que descreveram cenários experimentais no âmbito do Capítulo 5, visando a definição de condições óptimas de acidificação do soro de queijo por combinação de duas variáveis operacionais. Em particular, a metodologia envolveu o dimensionamento factorial de baterias de ensaios descontínuos de fermentação acidogénica, com a variação da razão F/M e da concentração de alcalinidade adicionada. Cada caso (ensaio experimental) compreendeu uma combinação exclusiva das duas variáveis operacionais (x1 e x2). Os resultados foram modelados de acordo com a Eq. 3-21:

+ Eq. 3-21

onde z é a variável de resposta, x1 e x2 são as variáveis operacionais (ou regressores)

manipuladas durante a experiência factorial, β0 é a constante do modelo, β1 e β2 são

coeficientes lineares (efeitos principais), β1,2 é um coeficiente cruzado (interacção) e β1,1

e β2,2 são coeficientes quadráticos (Myers et al., 2009). O ajuste da regressão é feito

através do cálculo dos parâmetros β, recorrendo algoritmo dos mínimos quadrados incorporado no software Statsoft Statistica®. Um exemplo gráfico desta metodologia é

apresentado na Figura 3-15.

Figura 3-15: Exemplo gráfico de RSM: (a) superfície tridimensional de resposta; (b) contorno bidimensional da superfície de resposta

A equação ajustada pode depois ser utilizada para localizar o ponto óptimo, isto é, o conjunto de derivadas parciais nulas da resposta z em relação a cada uma das

variáveis independentes (Eq. 3-22). Esta resposta óptima, que pode ser um máximo ou um mínimo local, é designada por ponto estacionário.

Eq. 3-22

3.4.1.1 Critérios de validação dos modelos quadráticos

No contexto dos problemas de regressão linear múltipla, torna-se importante realizar determinados testes de forma a verificar a representatividade dos modelos calculados a partir de dados experimentais, e assim validar o esforço de modelação. É sempre necessário examinar o ajuste de forma a garantir que este se trata de uma aproximação fidedigna da realidade, uma vez que a falta de ajuste poderá conduzir a induções totalmente incorrectas. No entanto, uma inspecção visual preliminar do aspecto gráfico de uma regressão (Figura 3-15) deve ser sempre o primeiro passo para uma validação de bom senso.

Apesar da diversidade de testes possíveis para avaliar a qualidade dos ajustes, foram adoptados nesta dissertação quatro critérios: coeficiente de correlação (r2);

significância da regressão para  = 0,05; verificação da distribuição normal dos resíduos; e teste de falta de ajuste. Em geral, um coeficiente de correlação igual ou superior a 0,7 é tido como uma “regra de ouro” frequentemente adoptada para a verificação de um modelo quadrático (Davila-Vazquez, 2012). Devido ao facto de esta estatística aumentar com o aumento do número de termos e de casos no modelo, foi adoptado um coeficiente de correlação ajustado e independente desta variação, definido pela Eq. 3-23:

( ) Eq. 3-23

onde n é o número de casos (testes) e p o número de coeficientes β.

O teste à significância da regressão (ou teste à linearidade) determina se existe de facto uma relação entre a resposta e os regressores. Mais precisamente, o teste é aplicado para averiguar se a variável de resposta (z) e o subconjunto do espaço de variáveis regressoras (x1, x2) são linearmente dependentes, testando as seguintes

H0: β1 = β2 =…= βk = 0 Eq. 3-24

H1:  j : βj ≠ 0 Eq. 3-25

O procedimento do teste compreende o cálculo da estatística:

Eq. 3-26

onde SQR é o somatório dos desvios quadrados devido ao modelo, SQE o somatório dos

desvios quadrados devido aos desvios, n o número de casos e k o número de variáveis regressoras. A hipótese nula de insignificância da regressão é rejeitada se a estatística F0 exceder F, n-k-1 (ou se o p-value for inferior a ), atestando a adequabilidade do

ajuste aos dados experimentais.

O terceiro critério de avaliação do ajuste consiste em verificar a assunção da normalidade dos resíduos. Esta verificação é feita por construção de um gráfico de papel de probabilidade (PP plot), inspeccionando visualmente se os resíduos se distribuem aproximadamente ao longo de uma linha recta, satisfazendo assim a assunção de normalidade (Figura 3-16). Este critério é qualitativo dado tratar-se de um método de inspecção visual.

Figura 3-16: Probabilidade normal (PP plot) dos resíduos

O teste à falta de ajuste requer a existência de replicados verdadeiros (observações repetidas) na resposta da variável dependente para pelo menos um conjunto de níveis dos regressores. Este teste assume como válidas as suposições de independência, normalidade dos resíduos e variância constante entre os erros. As hipóteses do teste são:

H0: + +

(modelo linear adequado) Eq. 3-27

H1: + +

(modelo linear desadequado) Eq. 3-28

A estatística de teste é: ( ) ⁄ ( ) ⁄ Eq. 3-29

onde SQLOF é a soma do quadrado dos erros devidos à falta de ajuste (reflectindo os

desvios da média das observações), SQPE a soma do quadrado dos erros devidos ao erro

puro (reflectindo a variabilidade das observações da variável de resposta), m o número de níveis da variável regressora, n o número de observações e p o número de parâmetros a estimar. A hipótese nula de adequabilidade do modelo é rejeitada se F0

> F, m-p, n-m (ou se o p-value for inferior a ).