• Nenhum resultado encontrado

3.3.1 Estatística Descritiva

Para entender o comportamento das variáveis ao redor do estado, uma análise descritiva foi feita e calcularam-se as mínimas, médias, máxima de cada variável. Foram desenvolvidos histogramas de modo a compreender a distribuição das variáveis empregadas, bem como foram espacializadas.

Em estudos da qualidade do ar, os dados empregados não costumam possuir uma distribuição normal. Para verificar se os tipos de distribuição não aderem a uma distribuição gaussiana, foi performado o Teste de Hipótese do Qui-Quadrado. O teste estatístico é apresentado conforme a Equação 1. Risco Probabilidade de internações Ameaça Índices de poluição atmosférica Vulnerabilidade

Capacidade Adaptativa: Índices Socioeconômicos Sensibilidade: Idade

Exposição Proximidade

Equação 1: Equação do Teste de Hipótese do Qui-Quadrado. 𝑋̂2 = ∑(𝑂𝑘− 𝐸𝑘) 2 𝐸𝑘 𝐾 𝑘=1

em que 𝐾 são as classes em que os dados são organizados, 𝑂𝑘 são as frequências observadas 𝐸𝑘 são as frequências esperadas da distribuição teórica. A hipótese nula é rejeitada quando o valor calculado é maior que o valor crítico. Deve-se, portanto, saber qual é o número de graus de liberdade (Φ = K– Z, em que K é número de classes e Z é o número de parâmetros que descrevem a distribuição mais o número de variáveis), para poder calcular o valor crítico. Para o trabalho foram empregadas 10 classes para cálculo do teste, dois parâmetros que descrevem a distribuição (média e desvio padrão) e apenas uma variável de análise (TRAUTH, 2015). Assim, os graus de liberdade para as séries de dados são iguais a 7. O valor crítico foi calculado com um intervalo de confiança de 95% (α = 0.05).

3.3.2 Análise Bivariada das variáveis empregadas nas internações por doenças respiratórias no estado de Santa Catarina

Foram performados métodos para avaliar a influência das variáveis sobre as internações por doenças respiratórias. Correlação é um tipo de método utilizado que visa estudar a associação entre duas ou mais variáveis (NAGHETTINI; PINTO, 2007). Dessa forma, empregaram-se Correlações pelo método de Spearman e Pearson, assim como um Modelo Linear Generalizado de Poisson foi utilizado. A correlação de Pearson calcula-se de acordo com a Equação 2:

Equação 2: Correlação de pelo método de Pearson

𝑟𝑥𝑦 = ∑ (𝑥𝑖− 𝑥̅)(𝑦𝑖 − 𝑦̅) 𝑛

𝑖=1

(𝑛 − 1)𝑠𝑥𝑠𝑦

em que n é o número de pares da amostra, 𝑥𝑖 𝑒 𝑦𝑖 são os valores dos dados para cada contagem, 𝑥̅ 𝑒 𝑦̅ é a média de cada amostra, e 𝑠𝑥 𝑒 𝑠𝑦 são os desvios padrões de cada variável. A correlação de Pearson é um método paramétrico empregado para amostras que possuam uma distribuição gaussiana. É um método extremamente sensível para dados que não possuam essa característica. Os dados por não possuírem uma distribuição normal foram normalizados antes da aplicação, ou seja, foi calculado o log de cada um deles.

Existem alternativas para série de dados que não possuam essa distribuição e não necessitam ser transformados. O Coeficiente de Correlação de Ranks de Spearman, é um método que pode ser utilizado caso a série amostral não se mostre normal (TRAUTH, 2015). A Equação 3 demonstra o cálculo do coeficiente de Spearman.

Equação 3: Coeficiente de Correlação pelo método de Spearman

𝑟𝑥𝑦= 1 − 6 ∑ 𝑑𝑖 2 𝑛 𝑖=1 𝑛(𝑛2− 1)

em que 𝑑𝑖 é a diferença de ranks entre duas variáveis e n é o tamanho da amostra. Como é calculada de acordo com ranks e não com valores numéricos, os resultados são menos sensitivos do que os outliers do Coeficiente de Correlação de Pearson (TRAUTH, 2015).

Para que seja desconsiderada a hipótese nula (H0= Coeficiente de correlação igual a zero), é necessário que seja calculado a significância estatística do valor obtido. Assim, o p-valor foi calculado para testar um intervalo de confiança da hipótese de 95%, ou seja, α = 0.05. As correlações foram performadas no software MATLAB. O programa computa a significância estatística do teste de Pearson com um teste de Student’s e para Spearman com um teste de permutação.

Na análise das correlações, foram empregados os dois métodos supracitados de modo a verificar a convergência dos resultados entre ambos. No entanto, para a realização das discussões do trabalho, o método de Spearman foi considerado visto que é um método não-paramétrico e mais adequado ao tipo de distribuição das variáveis utilizadas. Para a ponderação da força entre as correlações, Rodrigues (2008) e Ribeiro Junior (2020) definem as intensidades das correlações, conforme a Tabela 4.

Tabela 4: Definição das intensidades para os coeficientes de correlação.

Intervalo Interpretação

0.00 – 2.00 Correlações Nulas/ Bem fracas

0.21 – 4.00 Correlações Fracas

0.41 – 0.70 Correlações Substanciais / Moderadas

0.71 – 0.90 Correlações Fortes

0.91 – 1.00 Correlações Extremamente Fortes

Fonte: (RIBEIRO JUNIOR,2020; RODRIGUES, 2008)

No entanto para facilitar a interpretação dos resultados, as intensidades ao longo dos resultados serão feitas de acordo com a Tabela 5 adaptada.

Tabela 5:Definição das intensidades para os coeficientes de correlação adaptada.

Intervalo Interpretação

0.00 – 0.10 Correlações Bem fracas

0.11 – 0.40 Correlações Fracas

0.41 – 0.70 Correlações Moderadas

0.71 – 0.90 Correlações Fortes

0.91 – 1.00 Correlações Extremamente Fortes

Fonte: Adaptado de (RIBEIRO JUNIOR,2020; RODRIGUES, 2008)

Outro método utilizado foi o Modelo Generalizado Linear de Poisson, para avaliação da interferência das variáveis independentes nas variáveis resposta (internações). Os modelos lineares generalizados (MLG) representam a união de modelos lineares e não-lineares com uma distribuição da família exponencial, que é formada pela distribuição normal, poisson, binomial, gama, normal inversa (McCULLAGH; NELDER, 1989). Modelos que seguem uma distribuição exponencial geralmente apresentam a estrutura,conforme Equação 4.

Equação 4: Densidade da família exponencial

𝑓(𝑦|𝜃, 𝜙) = exp {𝑦𝜃 − 𝑏𝜃

𝑎(𝜙) + 𝑐(𝑦, 𝜙)}

em que y, é a variável de interesse, θ é o parâmetro natural (função de ligação canônica), 𝜙 é o parâmetro de escala, a,b e c são funções especificas que determinam unicamente a distribuição. A transformação da relação não linear em forma linear é realizada através de uma função de ligação, que para distribuição de Poisson, se dá através da função log (LIMA,2019). Para avaliação do ajuste do modelo, analisou-se o resíduo de Pearson. Conhecido como estatística de Pearson ou Qui- Quadrado (X²), é capaz de comparar a distribuição observada com a determinada pelo modelo. Pode- se dizer que a estatística de Pearson é a soma dos resíduos para cada observação. O teste possui como hipótese nula, um bom ajuste do modelo. Dessa forma, um modelo que se ajuste bem aos dados possui estatística de Pearson X², deve possuir um valor menor que o valor crítico para que a hipótese nula não seja descartada. Para o cálculo do valor crítico, é necessário saber os Graus de Liberdade (GL = observações –n variáveis explicativas -1). O valor crítico foi calculado com o auxílio do software MATLAB.

Na análise pelas faixas de IDH, foi empregada uma análise descritiva entre as faixas etária para cada nível de IDH-M. Além disso, um teste de hipótese foi empregado para verificar a não igualdade de medianas entre séries, ou seja, internações por faixas de IDH. O Teste de Mann – Whitney é um teste não paramétrico, o qual compara medianas sem requerer normalidade para os

dados empregados. O teste de Mann Whitney foi utilizado em virtude de as séries de dados não apresentarem uma distribuição gaussiana, sendo um teste alternativo para o teste-t, comumente utilizado. Considerando a premissa de que as séries comparadas possuem dispersões similares, a hipótese nula é considerada para as séries de dados que apresentam medianas iguais, e a hipótese alternativa o contrário.

Para o cálculo, do teste citado as amostras devem ser arranjadas em ordem crescente. Em seguida, soma-se as posições(“ranks”) das amostras 1 e 2, onde a soma de todos os ranks é R=n(n+1) /2, n é o número total de medidas. De tal forma que se calcula o U-valor demostrado na Equação 5.

Equação 5: Cálculo do U-valor para o teste de Mann-Whitney

𝑈1 = 𝑛1𝑛2 + 𝑛1(𝑛1+ 1) 2 − 𝑅1 𝑈2 = 𝑛1𝑛2 + 𝑛2(𝑛2+ 1)

2 − 𝑅2

onde, 𝑛1 e 𝑛2 são o tamanho das amostras 1 e 2, respectivamente, e 𝑅1 e 𝑅2 são as somas das posições(“ranks”) das amostras 1 e 2. Para o cálculo do z calculado, escolhe-se o menor valor obtido entre o 𝑈1 e 𝑈2. Assim para calcular o valor obtido no teste de hipótese, utiliza-se a Equação 6.

Equação 6: Teste de Mann-Whitney

𝑧̂ = |𝑈 − 𝑛1𝑛2 2 | √(𝑆(𝑆 − 1)𝑛1𝑛2 ) . (𝑆312− 𝑆− ∑ 𝑡𝑖 3− 𝑡 𝑖 12 𝑖=𝑟 𝑖=1 )

onde S=𝑛1+ 𝑛2, r é o número de valores repetidos e 𝑡𝑖 é o valor da ocorrência que se repetiu. Para testar a hipótese nula, um z crítico (com α=0.05) foi calculado para que seja comparado com o z calculado para cada combinação de série de dados. A rejeição da hipótese nula acontece quando o z calculado é maior que o z crítico. O z crítico foi calculado com o auxílio do software e resultou em 1,96.

Em seguida, os municípios foram segmentados por faixa de IDH-M a fim de avaliar como as variáveis independentes se comportavam com as internações em cada nível do índice supracitado. Dessa forma, as correlações de Pearson e Spearman foram empregadas, em cada grupo de municípios por IDH do estado.

4 RESULTADOS

4.1 VARIABILIDADE ESPACIAL DAS EMISSÕES ATMOSFÉRICAS, NÚMERO DE

Documentos relacionados