• Nenhum resultado encontrado

A compreensão de incerteza de dados neste estudo foi realizada de duas maneiras complementares. Inicialmente, foi realizada a avaliação qualitativa dos dados de entrada no modelo e, em seguida, foi realizada a avaliação quantitativa. Foi ainda realizada a avaliação das incertezas inerentes ao modelo utilizado. Os detalhes destas avaliações são descritos nas subseções a seguir.

3.1.1 Avaliação qualitativa de incerteza dos dados

Os parâmetros de entrada foram avaliados de maneira qualitativa com o objetivo de identificar e discutir as fontes de incertezas no presente estudo. Para esta análise, foram utilizados os indicadores da matriz Pedigree, elaborada por Weidema e Wesnaes (1996).

A matriz Pedigree representa uma maneira sistemática de avaliar a qualidade dos dados com base na sua origem, como o nome sugere. Seu objetivo é fornecer uma ferramenta para gestão de qualidade dos dados, considerando os indicadores: confiança na fonte, completeza e correlação geográfica, temporal e tecnológica. Esta é uma abordagem ―semi-quantitativa‖, na qual são atribuídas pontuações de 1 a 5 para os indicadores supracitados de acordo com sua respectiva qualidade. Esses valores podem ser comparados e até mesmo incorporados ao cálculo de incertezas, como, por exemplo, no software SimaPro7. A qualidade pretendida dos dados varia de acordo com o objetivo e escopo de cada trabalho e deve ser pré-estabelecida pelos autores (WEIDEMA; WESNAES, 1996).

Para este estudo, foi elaborada uma matriz Pedigree adaptada com indicadores relevantes para os dados a serem analisados. Foram adotados quatro indicadores presentes na matriz Pedigree utilizada para análise de inventário, sendo estes: confiança na fonte, completeza, correlação temporal e correlação geográfica. O indicador correlação tecnológica não foi considerado por fugir do escopo do trabalho, tendo em vista que não são utilizados dados de processos industriais e sim dados empíricos.

Além disso, foi adicionado o indicador ―materialidade na avaliação de incertezas‖, que visa garantir que os dados ou informações fornecidas sejam relevantes e significativos para usos não triviais ou supérfluos. Neste caso, materialidade na avaliação de incertezas significa que as informações de incertezas dos dados não sejam superficiais ou genéricas e, em vez

7 Simapro: ferramenta profissional utilizada na coleta, análise e monitoramento de dados de desempenho de

disso, sejam expressivas e tenham significado. Esse indicador prevê julgar se, a partir das informações disponibilizadas, é possível realizar a quantificação das incertezas.

A qualidade pretendida das informações foi determinada para os parâmetros disponibilidade, demanda humana e demanda do ecossistema. O parâmetro área não foi considerado na avaliação qualitativa, já que não envolve metodologia de cálculo e foi uma variável obtida por meio do recorte da região em estudo no software de geoprocessamento QGIS 2.18.8 e extração de uma planilha com o valor relativo à sua área.

Nesse contexto, a qualidade pretendida para os dados contempla: i) dados locais, provenientes de órgãos ou entidades locais, tendo em vista que a proposta da regionalização é substituir dados de modelagem por dados de bases de dados nacionais; ii) dados representativos de todos os locais relevantes, de modo a não comprometer a abrangência do estudo; iii) dados com menos de três anos de diferença para o ano de estudo, a fim de manter uma perspectiva da situação atual; iv) dados da menor região de estudo, novamente para continuar em acordo com a proposta da regionalização e evitar a homogeneização de áreas heterogêneas; e v) informações de incertezas com base em dados medidos, com o intuito de evitar estimativas que podem ser subjetivas e dados de modelagem que podem ser limitados.

Os indicadores e sua pontuação estão descritos na Tabela 12 abaixo. As adaptações da tabela original encontram-se em itálico.

Tabela 12 – Indicadores, incerteza e pontuação dos dados de disponibilidade e demanda humana e do ecossistema Indicadores Pontuação 1 2 3 4 5 Confiança na fonte Dados verificados provenientes de órgãos/autoridades locais Dados verificados parcialmente provenientes de órgãos/autoridades locais Dados derivados de modelagem Dados derivados de informações teóricas Estimativas não qualificadas

Completeza Dados representativos de todos os locais relevantes

Dados representativos de > 50% dos locais relevantes Dados representativos de alguns (<< 50%) locais relevantes Dados representativos de um local relevante Representatividade desconhecida Correlação Temporal Menos de 3 anos de diferença para o ano do

estudo

Menos de 6 anos de diferença para o ano do

estudo

Menos de 10 anos de diferença para o ano do

estudo

Menos de 15 anos de diferença para o ano do

estudo Idade desconhecida ou mais de 15 anos de diferença Correlação Geográfica

Dados da menor região em estudo

Dados médios de uma área maior onde a região

em estudo está inserida

Dados médios de uma área menor inserida na região

em estudo

Dados da área com condições de produção ligeiramente similar Dados de área desconhecida Materialidade na avaliação de incertezas Informações de incerteza calculadas com base em

dados medidos

Informações de incerteza calculadas com base em

estimativas

Informações de incertezas estimadas com base na

literatura Informações de incertezas estimadas sem embasamento Ausência de informações de incertezas

3.1.2. Avaliação quantitativa de incertezas dos dados

A avaliação quantitativa de incerteza dos dados foi subdividida em três etapas menores: avaliação quantitativa das incertezas dos parâmetros de entrada, propagação de incertezas e avaliação quantitativa das incertezas dos parâmetros de saída.

a) Avaliação quantitativa de incertezas dos parâmetros de entrada

A avaliação quantitativa de incertezas foi realizada por meio de estatística, que consiste em organizar, descrever, resumir e interpretar dados de maneira sistemática.

Como mencionado no capítulo 2 deste trabalho, existem parâmetros de incertezas estimados e calculados. Os dados de disponibilidade das EF são os únicos que possuem séries de dados com intervalo de tempo descrito e que permitiram o cálculo de sua distribuição de probabilidade com base em dados medidos. Para os dados de disponibilidade da ANA e ONS, não foi possível obter informação sobre o período de tempo das séries utilizadas ou seu tratamento, de modo que foi necessário realizar estimativa dos parâmetros, como descrito a seguir nesta mesma seção. Para os dados de demanda humana e do ecossistema, não foram consideradas séries de dados no cálculo dos valores. As fontes dos dados de cada UHE estão disponibilizadas no Apêndice A.

Dessa maneira, para os dados de disponibilidade das EF, foi feita, primeiramente, a contagem do número de anos e porcentagem de dados faltantes em cada série de dados de disponibilidade das EF. Esse procedimento foi considerado com o intuito de analisar a robustez das séries, independente dos valores absolutos atribuídos a cada ano. Dessa maneira, foi possível compreender se e como o tamanho das séries e as lacunas de dados influenciam a variação dos dados de entrada e, consequentemente, dos dados de saída. Como uma análise complementar à influência do tamanho das séries, estas foram reduzidas em intervalos de 5 anos a partir do ano mais recente de cada série.

Vale ressaltar que não houve manipulação de dados, de modo que as lacunas de dados não foram preenchidas e valores discrepantes não foram retirados. Práticas como essas seriam inconsistentes com o escopo do trabalho, que prevê a análise de dados que já foram utilizados na regionalização dos FC.

Em seguida, foi procedida a avaliação estatística dos valores de disponibilidade. Foram calculados os seguintes parâmetros estatísticos:

 Média aritmética

 Variância

 Coeficiente de variação

 Amplitude

 Distribuição de frequência

 Distribuição de probabilidade

Para cálculo destes parâmetros foram utilizados os softwares Excel e RStudios 3.4.0. A distribuição de frequência foi determinada por meio da construção de histograma e a distribuição de probabilidade por meio de análise visual dos histogramas. Este procedimento foi realizado para as 56 UHE que tiveram dados provenientes de EF, em resolução temporal mensal.

Com relação aos dados de disponibilidade das demais fontes (ANA e ONS) e de demanda humana e do ecossistema, foram estimados os coeficientes de variação utilizando a abordagem de Meier (1997) e Sonnemann et al. (2003, p. 284), cujos valores estão descritos na Tabela 13:

Tabela 13 – Estimativa de coeficiente de variação dos dados segundo Meier (1997) e Sonnemann et al. (2003, p. 284)

Características dos dados Coef. de variação

Determinado estequiometricamente 2%

Emissões medidas ou emissões de processos bem estabelecidos

10%

Substâncias bem definidas ou parâmetros de soma 20% Dados específicos de componentes por um método analítico

elaborado

30%

Fonte: Sonnemann et al. (2003, p. 284)

Como não foi encontrada recomendação de distribuição específica para disponibilidade, demanda humana e do ecossistema e área, foi adotada a distribuição normal, por conta de adequação na modelagem de fenômenos naturais (CLAUSET; SHALIZI; NEWMAN, 2009, p. 669). Corroborando com essa decisão, há o teorema do

limite central, que afirma que à medida que o tamanho de uma amostra aumenta, esta se aproxima de uma distribuição normal.

Para estimar o coeficiente de variação, levou-se em consideração que os dados de disponibilidade da ANA e ONS consistem na aplicação de modelos estatísticos a dados de medições, assemelhando-se a dados medidos. Os dados de demanda humana da ANA também são fruto da aplicação de modelos, porém considerando parâmetros como tamanho da população, região e outros, de modo que foram considerados semelhantes aos dados de processos bem estabelecidos. A demanda do ecossistema, obtida por meio de modelagem, foi considerada similar aos dados específicos de componentes por um método analítico elaborado.

Com base nessa estimativa de coeficientes de variação e distribuição, foram calculados os demais parâmetros estatísticos listados anteriormente.

Com relação à variável área, não foi encontrada nenhuma informação quantitativa sobre erro percentual do software, apenas discussões sobre possíveis fontes de incertezas em sua execução. Portanto, a avaliação de incertezas foi realizada por meio de comparação entre os valores extraídos do software de geoprocessamento QGIS 2.18.8 e os valores descritos em notas técnicas e manuais da ANA. O desvio padrão foi obtido a partir da subtração entre os valores encontrados no software e nos manuais, o que permitiu o cálculo dos demais parâmetros.

Vale relembrar que os valores médios de todas as variáveis foram devidamente disponibilizados por suas respectivas fontes e correspondem aos dados utilizados na regionalização dos FC.

A descrição resumida do procedimento de análise de incerteza para cada fonte de dados é dada na Tabela 14 abaixo:

Tabela 14 – Procedimento de avaliação de incertezas dos dados de entrada

Variável Fonte Avaliação de incertezas

Disponibilidade

EF Cálculo de parâmetros a partir de dados medidos

ANA

Cálculo de parâmetros a partir de dados estimados

NOS Demanda

Variável Fonte Avaliação de incertezas Demanda do

ecossistema

Pastor et al. (2014)

Área ANA Cálculo de parâmetros a partir da comparação entre dados do software e literatura Fonte: Autoria própria (2018).

b) Propagação de incertezas

Para obter as informações de incertezas dos resultados, foi preciso realizar a propagação de incertezas. Para esse procedimento foram necessárias duas informações: distribuição e parâmetros estatísticos dos dados de entrada e equações do modelo a ser empregado.

A distribuição e os parâmetros estatísticos foram obtidos por meio de análise estatística dos parâmetros de entrada, realizada no tópico anterior. As equações do modelo foram descritas no Capítulo 2 do presente estudo. Em posse dessas informações, foram realizadas simulações probabilísticas de Monte Carlo com o intuito de analisar como as incertezas dos parâmetros de entrada se refletem nos parâmetros de saída.

O método de Monte Carlo consiste na variação aleatória de todos os parâmetros de entrada de um modelo, porém considerando a distribuição de incerteza dada para cada parâmetro. Os cálculos repetidos produzem uma distribuição de frequência dos valores de saída previstos, que se aproxima da distribuição de probabilidade, refletindo as incertezas dos parâmetros combinados e permitindo análise com técnicas estatísticas (HUIJBREGTS, 1998, p. 274; BJÖRKLUND, 2002, p. 69).

Tal método não exige alto esforço computacional nem possui limitações de amostras. Além disso, este é amplamente adotado no campo da ACV, como em

softwares como SimaPro, GaBi e OpenLCA. Apesar da dificuldade de consenso com

relação ao número de simulações necessárias, a regra geral de 10000 iterações é normalmente aplicada para garantir uma variância estável (IGOS et al., 2018, p. 6). Ainda assim, foram realizados testes com 1000 e 5000 simulações.

Dessa maneira, foram realizadas simulações de Monte Carlo com 10000 iterações com ajuste dos valores máximos (100) e mínimos (0,1) do modelo AWARE. As simulações foram realizadas no software RStudios 3.4.0 com auxílio do software Excel

para organização e tabulação dos dados. Foram obtidos FC mensais genéricos por UHE e suas respectivas agregações, como ilustrado na Figura 10 abaixo:

Figura 10 – Agregações dos fatores de caracterização do modelo AWARE

Fonte: Autoria própria (2018)

As agregações realizadas foram de 3 tipos: genérica, agrícola e não agrícola. A agregação agrícola considerou apenas o consumo agrícola na ponderação do FC, enquanto a não agrícola considerou a soma dos demais consumos humanos. A agregação genérica considerou os consumos humanos agrícola e não agrícola.

Os níveis de agregação foram: espacial, temporal e ambos. Na agregação temporal, foram gerados fatores anuais, mas ainda na menor resolução espacial (UHE). Na agregação espacial, foram gerados fatores para uma resolução espacial maior (RH), mas na menor resolução temporal (mês). A agregação temporal e espacial gerou fatores na maior resolução temporal (ano) e espacial (RH).

c) Avaliação quantitativa de incertezas dos parâmetros de saída

Após a propagação de incertezas, foi realizada avaliação quantitativa de incertezas, agora no tocante aos parâmetros de saída. Para realização desta avaliação, foi preciso ter o conjunto de valores relativos aos FC mensais genéricos por UHE e suas agregações, obtidos por meio da propagação de incertezas realizada na subseção anterior.

Os parâmetros de saída, ou seja, os fatores de caracterização foram avaliados por meio do mesmo procedimento de análise estatística utilizada nos dados de disponibilidade das EF. Dessa maneira, foram calculados os mesmos parâmetros estatísticos listados no tópico 3.2.1.a).

O procedimento de realização da avaliação quantitativa de incertezas está resumido na Figura 11 abaixo:

Figura 11 – Fluxograma da avaliação quantitativa de incertezas

Fonte: Autoria própria (2018)

3.1.3. Avaliação de incertezas do modelo

Igos et al. (2018, p.6) afirmam que o verdadeiro valor de incerteza de um modelo só pode ser obtido com dados de validação. No caso da regionalização dos FC, como em muitos outros no contexto da ACV, não existem dados que descrevam o valor verdadeiro das variáveis e possam ser utilizados na validação. Além disso, tais modelos vêm sendo propostos para quantificar grandezas e variáveis anteriormente não quantificadas.

Devido à falta dessas medições, profissionais de ACV frequentemente comparam seus resultados com estudos semelhantes, avaliando a consistência do modelo e permitindo compreender as incertezas inerentes aos modelos (IGOS et al., 2018, p.6)

Neste estudo, as incertezas do modelo AWARE foram avaliadas por meio de comparação com estudos que adotaram outros modelos na obtenção e regionalização de

FC de escassez hídrica. Nesta comparação, foram considerados os estudos de Núñez et

al. (2015) e Pfister e Hellweg (2011), ambos adotando o modelo WSI.

Para tanto, foi calculado o parâmetro de dispersão k (k-value) descrito por Slob (1994, p. 573) e utilizado por Núñez et al. (2015, p. 9) e Pfister e Hellweg (2011, p. 5) em suas respectivas avaliações de incertezas em fatores de caracterização. O cálculo deste parâmetro foi adotado a fim de permitir a comparação entre os resultados obtidos neste trabalho com aqueles dos estudos citados.

( ( ) ) (08)

Documentos relacionados