MATERIAIS E MÉTODOS
NÚCLEO 3 PROJETO CURAÇÁ 3 NÚCLEO 1 PROJETO CURAÇÁ
3.4 COMPONENTE QUANTITATIVA
3.4.6 Análise de regressão linear múltipla
A análise de regressão linear múltipla (RLM) foi utilizada para avaliar a relação entre o consumo de energia elétrica, o consumo de água para abastecimento humano e para a agricultura irrigada com a vulnerabilidade socioeconômica e ambiental nos 92 municípios do SMSF, no período de 2008 a 2014. Toda as variáveis independentes (ncons_energia; ncons_hum; ncons_irrig) e a variável dependente (iVSEA) são contínuas. A variável dependente consiste em um índice auxiliar que agrega informações sobre vulnerabilidade ambiental, social e econômica nos municípios, composto por 25 indicadores.
Mais detalhes do processo de programação estão no Apêndice 3. A Tabela 3.8 mostra as hipóteses de relacionamento testadas e analisadas, as hipóteses nulas e a natureza de cada uma das variáveis. Destacam-se as hipóteses A e B, que avaliam as relações entre as variáveis respectivamente
sem e com a influência da precipitação. As demais hipóteses auxiliares são de especial relevância para o método e a lógica nexus: as hipóteses A.1, A.2 e A.3 avaliam a diferença entre a análise da influência das variáveis sobre a vulnerabilidade quando observadas individualmente, em relação à análise conjunta da hipótese A. De maneira similar, as hipóteses B.1 e B.2 se relacionam com a hipótese B.
A análise de regressão linear múltipla foi selecionada conforme os modelos de decisão para testes estatísticos de relacionamento entre múltiplas variáveis contínuas independentes e uma variável dependente apresentados por Alemu (2016) e o programa Laerd Statistics (2015).
Em um segundo momento, dados de precipitação média mensal e variância da precipitação mensal foram incluídos como variáveis preditoras no modelo de regressão linear, uma vez que a disponibilidade hídrica nos municípios e os valores de consumo e retirada a partir do Rio São Francisco são diretamente afetados pelo regime de chuvas. As análises foram então repetidas de modo a reavaliar como a exposição às mudanças do clima afetam a dinâmica das seguranças hídrica, alimentar e energética com a vulnerabilidade.
Tabela 3.8 - Hipóteses de pesquisa e natureza das variáveis
Hipótese alternativa Hipótese nula dependente Variável Variáveis independentes / categorias
A. Existe uma relação entre o consumo de energia
elétrica, consumo de água para abastecimento humano e para a irrigação e a vulnerabilidade socioeconômica e ambiental no SMSF para os anos
de estudo
Não existe uma relação entre o consumo de
energia elétrica, consumo de água para abastecimento humano e para a irrigação e a vulnerabilidade socioeconômica e ambiental
no SMSF para os anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Consumo de energia elétrica; Consumo de água para consumo humano; Consumo de água para a agricultura irrigada
1. Existe uma relação entre o consumo de
energia elétrica e a vulnerabilidade
socioeconômica e ambiental no SMSF para os
anos de estudo
Não existe uma relação entre o consumo de
energia elétrica e a vulnerabilidade
socioeconômica e ambiental no SMSF para os
anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Consumo de energia elétrica para uso residencial
2. Existe uma relação entre o consumo de água
para abastecimento humano e a
vulnerabilidade socioeconômica e ambiental
no SMSF para os anos de estudo
Não existe uma relação entre o consumo de
água para abastecimento humano e a vulnerabilidade socioeconômica e ambiental
no SMSF para os anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Consumo de água para consumo humano rural e urbano
3. Existe uma relação entre o consumo de água
para a irrigação e a vulnerabilidade
socioeconômica e ambiental no SMSF para os
anos de estudo
Não existe uma relação entre o consumo de
água para a irrigação e a vulnerabilidade socioeconômica e ambiental no SMSF para os
anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Consumo de água para a agricultura irrigada B. Existe uma relação entre o consumo de energia
elétrica, consumo de água para abastecimento humano e para a irrigação, a precipitação mensal média, variância da precipitação mensal média e a vulnerabilidade socioeconômica e ambiental no
SMSF para os diferentes anos de estudo
Não existe uma relação entre o consumo de
energia elétrica, consumo de água para abastecimento humano e para a irrigação, a precipitação mensal média, variância da precipitação mensal média e a vulnerabilidade socioeconômica e ambiental no SMSF para os
diferentes anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Consumo de energia elétrica; Consumo de água para consumo humano; Consumo de água para a agricultura irrigada; Precipitação mensal média; Variância da precipitação mensal média 1. Existe uma relação entre a precipitação
mensal média e a vulnerabilidade
socioeconômica e ambiental no SMSF para os
anos de estudo
Não existe uma relação entre a precipitação
mensal média e a vulnerabilidade
socioeconômica e ambiental no SMSF para os
anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Precipitação mensal média por ano
2. Existe uma relação entre a variância da
precipitação mensal média e a
vulnerabilidade socioeconômica e ambiental
no SMSF para os anos de estudo
Não existe uma relação entre a variância da
precipitação mensal média e a vulnerabilidade socioeconômica e ambiental no SMSF para os
anos de estudo
Vulnerabilidade Socioeconômico-
ambiental
Variância da precipitação mensal média
Além do tratamento dos dados e das análises de RLM, oito premissas foram verificadas para garantir que a análise de regressão linear múltipla pudesse ser aplicada para as variáveis de estudo. As premissas verificam e informam sobre a precisão das previsões, do modelo e dos coeficientes calculados e visam testar quão bem o modelo de regressão linear representa os dados observados. Quando não atendidas, fazem-se necessários ajustes para que o modelo possa ser utilizado (LAERD STATISTICS, 2015). Em último caso, um outro modelo estatístico de análise dos dados deve ser aplicado. De modo a conferir validade ao estudo, o modelo foi verificado conforme as premissas na Tabela 3.9.
Tabela 3.9 - Premissas para o uso de análise de regressão linear múltipla Análises anteriores à
regressão
a. A variável dependente (iVSEA) deve ser contínua;
b. As variáveis independentes devem ser de natureza contínua ou categórica;
Análises posteriores à regressão
c. Independência de observações (i.e., independência dos resíduos / erros) – variáveis independentes devem ser comprovadamente independentes;
d. Uma relação linear (ou a clara ausência de relações não-lineares) deve existir entre as variáveis independentes e a variável dependente, individual e coletivamente, de forma que preditores não sejam redundantes e tenham a mesma contribuição para o modelo e. Homoscedasticidade – variações ao longo da linha de regressão linear de melhor ajuste
devem permanecer semelhantes por toda a linha;
f. Dados não devem apresentar multicolinearidade (ou colinearidade múltipla)
g. Modelo não deve conter dados discrepantes significativos (outliers, leverage e
influentials)
h. Normalidade: Resíduos (erros) da linha de regressão de melhor ajuste devem seguir distribuição normal.
Fonte: elaborado pela autora com base em Laerd Statistics (2015).
Dependendo da etapa da análise, foram utilizados o Jupyter, Excel e Stata de acordo com a facilidade de obtenção e formato de apresentação dos dados. Os principais resultados foram também verificados em mais de uma ferramenta para garantir consistência e confiabilidade.