• Nenhum resultado encontrado

FUNÇÕES DE AGRUPAMENTOS DE SIMILARIDADE ENTRE BAIRROS QUANTO CARACTERÍSTICAS FÍSICO-QUÍMICAS DA ÁGUA PARA O CONSUMO HUMANO

N/A
N/A
Protected

Academic year: 2021

Share "FUNÇÕES DE AGRUPAMENTOS DE SIMILARIDADE ENTRE BAIRROS QUANTO CARACTERÍSTICAS FÍSICO-QUÍMICAS DA ÁGUA PARA O CONSUMO HUMANO"

Copied!
6
0
0

Texto

(1)

FUNÇÕES DE AGRUPAMENTOS DE SIMILARIDADE ENTRE BAIRROS QUANTO CARACTERÍSTICAS FÍSICO-QUÍMICAS DA ÁGUA

PARA O CONSUMO HUMANO

Farid Sallum Neto1, Lívia Paschoalino de Campos2, Francini Piccolo Ferreira,3Carlos Roberto Padovani4 1Mestre em Biometria, Unesp-Campus de Botucatu, faridsallum@ibb.unesp.br.

2Mestre em Biometria, Unesp-Campus de Botucatu, livia@ibb.unesp.br.

3 Mestranda em Biometria, Unesp-Campus de Botucatu, francini.estatistica@gmail.com 4Professor Titular, Unesp-Campus de Botucatu, bioestatistica@ibb.unesp.br

1 INTRODUÇÃO

A água é uma substância de fundamental importância para o planeta, dado que é essencial para a sobrevivência de animais e vegetais. De modo específico, para o consumo humano, a água potável deve respeitar referências de qualidade sobre parâmetros físicos, químicos, radioativos e microbiológicos. Para isto, o Ministério da Saúde estabelece, por meio da Portaria 518/04- Controle e Vigilância da Qualidade da Água para Consumo Humano, padrões mínimos e máximos para tais parâmetros sobre a qualidade da potabilidade da água que é distribuída para o consumo.

Na maioria dos estudos que envolvem várias variáveis avaliadas simultaneamente na mesma unidade experimental, há um fracionamento na discussão dos resultados, normalmente considerando o conjunto geral das informações contidas em todas as variáveis como um somatório de várias informações isoladas. No contexto da análise exploratória de dados, o que se deve considerar para estas situações é o estudo concomitante de todas as variáveis por meio de técnicas multivariadas, as quais preservam toda a estrutura de variabilidade dos dados nas medidas que envolvem a variação inter e intra variáveis (MINGOTI, 2005).

Sendo assim, o presente estudo tem por objetivo utilizar técnicas multivariadas para construir funções de classificação de bairros do município de Botucatu-SP, quanto as similaridades das características de água para o consumo humano e estabelecer as concordâncias das classificações entre as diversas funções construídas.

2 MATERIAL E MÉTODOS

As variáveis estudadas na presente pesquisa foram: cor aparente, turbidez, concentração de flúor, quantidade de cloro residual e pH, referentes as características

(2)

físico-químicas da água procedentes de mensurações realizadas em 4611 coletas distribuídas em 148 pontos em 76 bairros do município de Botucatu-Sp, no período de 2007 a 2011. Os dados foram fornecidos pela Companhia de Saneamento Básico do Estado de Sao Paulo - Sabesp.

Os parâmetros indicados na Portaria 518/04 serão denominados na pesquisa como variáveis, cujas especificações em relação as unidades e os padrões de referências para a qualidade da água para o consumo humano são especificados na Tabela 1.

Tabela1. Padrões referentes à Portaria 518/04

Parâmetro Unidade Padrão

Cor aparente (Cor) Unidade de cor Máximo 15 UC Turbidez (Turb) Unidade nefelométrica Máximo 5 UNT Flúor (F) Miligrama por litro Máximo 1,5 mg/L

Cloro residual (Cl) Miligrama por litro

Mínimo 0,5 mg/L; Máximo 2,0 mg/L

pH Mínimo 6,0; Máximo 9,5

A variável cor aparente, avaliada em unidades de cor (UC) mede o comprimento de ondas, objetivando indicar possíveis presenças de substâncias na água. Turbidez, refere-se a uma medida da passagem de luz pela água que indica a resistência da água à penetração da luz ocasionada pela presença de partículas em suspensão existentes, alterando sua transparência. Flúor, consiste em um componente adicionado à água na estação de tratamento e em um importante agente na proteção dos dentes humanos contra a cárie (o excesso pode deteriorar a qualidade da água ocasionando mancha nos dentes dos consumidores). Cloro residual livre, indica a quantidade de cloro ainda presente na água ao analisá-la na rede de distribuição e no final do tratamento (um agente que contribui para a redução de bactérias que podem estar presentes na água). O pH, ou potencial hidrogeniônico da água, constitui-se em um elemento monitorador no sentido de indicar se a água distribuída é acida, alcalina ou neutra.

No presente estudo, considerou-se como unidade experimental o bairro, tendo como o vetor de respostas 𝒚𝒊, de ordem 5, com 𝑖 = 1, … ,76, as médias das coletas

(3)

realizadas no bairro durante todo o período considerado (2007 a 2011), conforme estabelecido por Campos (2014). Desta forma, tem-se uma matriz de dados composta por 76 linhas, cada uma representando o vetor de resposta médio do bairro e cinco colunas, cada uma indicando uma variável da Portaria 518/04, sequencialmente, especificadas na cor aparente, turbidez, flúor, cloro residual e pH.

Para este conjunto de dados foram estabelecidas três funções classificatórias para os bairros, as quais envolvem as respostas das características físico-químicas da água. A partir da construção dessas funções, foram estabelecidos três grupos de bairros similares quanto as respostas das características avaliadas na Portaria 518/04. As funções classificatórias para estabelecer os grupos de similaridade, foram as seguintes:

1) Função Padrão Ouro (DIST) – consiste em uma medida de distância entre cada bairro e um vetor resposta tomado como o referencial de qualidade da água, estabelecido a partir dos padrões apontados pela Portaria 518/04. A interpretação do valor numérico obtido para cada bairro indica que quanto menor o valor, maior a proximidade do bairro ao referencial, caso contrário, interpreta-se para valores maiores (ou seja, constitui-se uma medida de similaridade ou dissimilaridade). 2) Função Coeficiente de Variação (CV) – constitui-se em uma função linear das variáveis físico-químicas da água, cujos coeficientes expressam os pesos de cada variável. Para a obtenção desses pesos, foram considerados os coeficientes de variação das variáveis e, a partir destes, determinou-se a proporção que cada coeficiente representava no somatório dos cinco coeficientes. Esta proporção foi tomada como sendo o ponderador utilizado como coeficiente da função linear. Definida a função, estabeleceu-se o valor numérico desta para os 76 bairros e, posteriormente, estes valores foram utilizados na constituição dos três grupos de similaridade.

3) Função dos Componentes Principais (CP) – constitui-se em uma função linear cujos coeficientes (pesos) foram estabelecidos utilizando a técnica multivariada dos componentes principais obtidos por meio da matriz de correlação dos dados. No presente estudo, considerou-se apenas o primeiro componente

(4)

principal, ou seja, aquele que possui a maior quantidade de informação da variação total dos dados. Os coeficientes da função linear coincidem com valores dos componentes do autovetor normalizado correspondente à maior raiz característica obtida da matriz da correlação. À semelhança da função coeficiente de variação, foram também estabelecidos os valores numéricos dos 76 bairros. A partir dos valores numéricos ordenados das funções foram constituídos três grupos de similaridade, correspondendo aos tercis da distribuição dos valores encontrados. De forma prática, os 25 bairros de menores valores numéricos foram tomados como pertencentes ao tercil inferior e os 25 bairros de maiores valores numéricos compondo o tercil superior. Os 26 restantes foram alocados no tercil intermediário.

Estabelecidos os tercis, foram verificadas as concordâncias entre os três procedimentos pesquisados. Em primeiro lugar, estabeleceu-se concordâncias entre duas funções, CV x CP, CV x DIST e CP x DIST, verificando se o bairro considerado estava no mesmo tercil quando da comparação. Essas comparações foram denominadas como comparações entre pares de funções. Em seguida, foi realizado uma comparação mais geral para a concordância, ou seja, a comparação envolvendo simultaneamente as funções, onde só existia concordância se o bairro localizava-se no mesmo tercil nas três funções. Denominou-se essa concordância por concordância plena.

Complementou-se o estudo com a determinação do coeficiente de correlação linear de Pearson entre os valores numéricos de pares de função e confrontou-se essas medidas de homogeneidade com as concordâncias obtidas nos pares de funções.

3 RESULTADOS E DISCUSSÕES

As expressões matemáticas das funções estabelecidas para a similaridade dos bairros são dadas por:

a) Função padrão ouro

𝐷𝑖𝑠𝑡 =

√(𝐶𝑜𝑟 − 15)2+ (𝑇𝑢𝑟𝑏 − 5)2+ (𝐹 − 1,5)2+ 𝑚á𝑥[(𝐶𝑙 − 0,5)2; (𝐶𝑙 − 2)2] + 𝑚á𝑥[(𝑝𝐻 − 6)2; (𝑝𝐻 − 9,5)2] (1)

b) Função coeficiente de variação

(5)

c) Função componente principal

𝐶𝑃 = −0,257𝐶𝑜𝑟 − 0,602𝑇𝑢𝑟𝑏 + 0,004𝐹 + 0,635𝐶𝑙 − 0,409𝑝𝐻 (3) O coeficiente de correlação de Pearson das variáveis 𝑋 e 𝑌 é dado por: 𝜌 = 𝐶𝑜𝑣(𝑋,𝑌)

√𝑉𝑎𝑟(𝑋)𝑉𝑎𝑟(𝑌) (4)

Nota-se, pelos coeficientes da função 𝐶𝑉 , que há sinergia entre as todas as variáveis enquanto que, nos coeficientes da função 𝐶𝑃, existe um contraste do somatório das variáveis 𝐹 e 𝐶𝑙 em relação ao somatório das variáveis 𝐶𝑜𝑟, 𝑇𝑢𝑟𝑏 e 𝑝𝐻.

Os valores numéricos correspondentes a cada um dos bairros são obtidos apresentando os respectivos valores do vetor (𝐶𝑜𝑟, 𝑇𝑢𝑟𝑏, 𝐹, 𝐶𝑙, 𝑝𝐻 ). Utilizando os valores numéricos obtidos para os 76 bairros estudados foram determinados os três tercis cujas concordâncias aos pares e plena estão descritas na tabela 2.

Tabela 2. Número de entre as funções nos tercis

Número de bairros comuns nos tercis

Tercil CV x CP CV x Dist CP x Dist

CV x CP x Dist Inferior 6 3 17 3 Intermediário 17 16 17 12 Superior 6 0 16 0 Correlação −0,572 (𝑝 < 0,01) −0,698 (𝑝 < 0,01) 0,472 (𝑝 < 0,001)

Nota-se pela Tabela 2 acima que o maior número de concordâncias entre pares de funções estabelecidas ocorreu no tercil intermediário, enquanto que o maior número de concordâncias foi verificado quando comparou-se a função Componentes Principais e a função Padrão-Ouro, isto não só no total como em cada um dos tercis.

Nas associações entre duas funções de classificação, todas as correlações lineares de Pearson foram significativas. Duas delas mostraram associações negativas indicando heterogeneidade em relação à classificação dos bairros nos agrupamentos formados, CV x CP e CV x Dist, fato que reflete a baixa concordância. Enquanto a associação positiva

(6)

existente entre CP x Dist mostrou homogeneidade entre os valores numéricos obtidos, corroborando com as maiores concordâncias encontradas.

Em relação à concordância plena, esta basicamente ocorreu apenas no tercil intermediário e muito pouco nos tercis inferior e superior.

4 CONCLUSÕES

As maiores concordâncias entre pares aconteceram no CP x Dist, fato ocorrido em todos os tercis. Esta situação é corroborada pelo valor do coeficiente de correlação linear, positivo e significativo, o qual indica que as menores distâncias se associaram com os menores valores numéricos do primeiro componente principal ou que as maiores distâncias associaram-se com os maiores valores do componente, evidenciando a homogeneidade quanto aos agrupamentos formados pelos bairros. Em relação as outras duas comparações entre funções de classificação, os valores das correlações, negativos e significativos, expressam heterogeneidade entre os dois discriminadores, indicando baixa concordância, pois valores altos de distâncias correspondentes ao tercil superior ocorreram com discriminadores de valores baixos alocados no tercil inferior ou vice-versa.

5 REFERÊNCIAS

CAMPOS, L.P.; Perfil geográfico multivariado da água consumida no município de Botucatu. Dissertação (Mestrado), Instituto de Biociências – UNESP, Botucatu, SP, 2014.

MINGOTI, S. A. Análise de dados através de métodos de estatística multivariada: uma abordagem

Referências

Documentos relacionados

(essencialmente toalhas adamascadas, damasquilho de linho e algodão, panos de linho e lenços de linho e algodão, desenvolvidos essencialmente em 17 freguesias do concelho

Este trabalho buscou, através de pesquisa de campo, estudar o efeito de diferentes alternativas de adubações de cobertura, quanto ao tipo de adubo e época de

No entanto, maiores lucros com publicidade e um crescimento no uso da plataforma em smartphones e tablets não serão suficientes para o mercado se a maior rede social do mundo

esta espécie foi encontrada em borda de mata ciliar, savana graminosa, savana parque e área de transição mata ciliar e savana.. Observações: Esta espécie ocorre

Dessa forma, os níveis de pressão sonora equivalente dos gabinetes dos professores, para o período diurno, para a condição de medição – portas e janelas abertas e equipamentos

O valor da reputação dos pseudônimos é igual a 0,8 devido aos fal- sos positivos do mecanismo auxiliar, que acabam por fazer com que a reputação mesmo dos usuários que enviam

fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene fluspirilene 13

Our contributions are: a set of guidelines that provide meaning to the different modelling elements of SysML used during the design of systems; the individual formal semantics for