• Nenhum resultado encontrado

Aplicação de um modelo de regressão linear aos dados de balneabilidade das praias de Natal entre 2011 e 2015

N/A
N/A
Protected

Academic year: 2021

Share "Aplicação de um modelo de regressão linear aos dados de balneabilidade das praias de Natal entre 2011 e 2015"

Copied!
67
0
0

Texto

(1)

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

DEPARTAMENTO DE ESTATÍSTICA

CURSO DE ESTATÍSTICA - BACHARELADO

Waldemar Alves da Silva Neto

APLICAÇÃO DE UM MODELO DE

REGRESSÃO LINEAR AOS DADOS DE

BALNEABILIDADE DAS PRAIAS DE NATAL

ENTRE 2011 E 2015.

Natal - RN

(2)

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE

DEPARTAMENTO DE ESTATÍSTICA

CURSO DE ESTATÍSTICA - BACHARELADO

Waldemar Alves da Silva Neto

APLICAÇÃO DE UM MODELO DE REGRESSÃO

LINEAR AOS DADOS DE BALNEABILIDADE DAS

PRAIAS DE NATAL ENTRE 2011 E 2015.

Monografia de Graduação apresentada ao De-partamento de Estatística do Centro de Ci-ências Exatas e da Terra da Universidade Federal do Rio Grande do Norte como re-quisito parcial para a obtenção do grau de Bacharel em Estatística.

Orientador: Prof. Dr. Marcus Alexandre Nunes

Natal - RN

(3)

Silva Neto, Waldemar Alves da.

Aplicação de um modelo de regressão linear aos dados de balneabilidade das praias de Natal entre 2011 e 2015 / Waldemar Alves da Silva Neto. - 2017.

66 f.: il.

Monografia (Bacharelado em Estatística) - Universidade Federal do Rio Grande do Norte. Centro de Ciências Exatas e da Terra. Departamento de Estatística. Natal, RN, 2017.

Orientador: Marcus Alexandre Nunes.

1. Estatística Monografia. 2. Modelos de Regressão Monografia. 3. Balneabilidade Monografia. 4. Natal -Monografia. I. Nunes, Marcus Alexandre. II. Título.

RN/UF/CCET CDU 519.2

Universidade Federal do Rio Grande do Norte - UFRN Sistema de Bibliotecas - SISBI

(4)
(5)
(6)

Agradecimentos

Aos meus pais e irmãos, pelo apoio incondicional às minhas escolhas e decisões. À minha namorada, pelo apoio, paciência, compreensão, amor e carinho durante todo esse tempo.

Aos meus amigos Bruno, Jessica, Marcelo, Bernardo e Marcello, pelos momentos compartilhados ao longo de tantos anos. Pela compreensão e paciência dos inúmeros momentos de distância e/ou silêncio.

Ao professor Marcus, por todo apoio e paciência na realização desse trabalho. Também pelos ensinamentos tanto profissionais como pessoais.

Aos professores do Departamento de Estatística pelo empenho e trabalho no intuito de fortalecer os alunos e o curso.

A todos que de forma direta ou indireta passaram pela minha vida ao longo desses último anos e contribuiram de alguma forma para realização desse curso.

À Biologia. Ela me trouxe até aqui. Muito obrigado!

(7)

“Quando a educação não é libertadora, o sonho do oprimido é ser opressor.” (Paulo Freire)

(8)

Resumo

Neste trabalho, utilizamos dados semanais de contaminação (número de bactérias do tipo Escherichia coli) referentes ao período de 2011 a 2015 para descrever as condições de balneabilidade de 15 pontos do litoral de Natal. Para tal, foram utilizados gráficos, tabelas e sumarização de dados, tanto a nível local (cada ponto) quanto a nível geral (todas as praias em conjunto). Os pontos NA-13 (Redinha/Rio Potengi) e NA-15 (Redinha Praia) obtiveram os piores índices de contaminação. O resultado do ponto NA-13 deverá estar atrelado ao fato do Rio Potengi ser o principal captador de águas pluviais da cidade. Já o ponto NA-15 sofre impacto direto das correntes marítimas que empurram as águas oriundas da foz do Rio Potengi para essa área, e do adensamento urbano sem regulamentação na zona norte, além da alta concentração de banhistas e comércios na praia. No sentido contrário, o ponto NA-06 (Via Costeira) obteve os melhores resultados quanto aos níveis de contaminação no período monitorado. Isto provavelmente deve-se às condições peculiares do local. É uma área de mar aberto, com baixo adensamento urbano (somente hotéis), poucos acessos à praia e nenhuma estrutura comercial de bar e restaurante, sendo, portanto, uma área de reduzida presença antrópica. Posteriormente a análise descritiva, ajustamos modelos de regressão linear múltipla e regressão linear simples utilizando como variáveis preditoras, respectivamente, os níveis de precipitação diário nos seis dias anteriores a cada coleta e o volume de chuva acumulada nesses seis dias. A variável resposta foi o número de bactérias contabilizadas nas amostras de água semanais pelo método do número mais provável (NMP). Os modelos não foram satisfatórios, nem se adequaram aos pressupostos necessários para aceitação e utilização dos mesmos para realização de previsões de quantidade de bactérias na água. Concluímos então que para o desenvolvimento de ferramentas estatísticas de previsão de balneabilidade será necessário a utilização de mais variáveis explicativas, além de métodos mais robustsos e que tratem dados com número elevado de zeros, uma vez que a pluviometria na capital assume valores nulos com alta frequência devido ao seu Clima Tropical.

Palavras-chave: Natal, Balneabilidade, Escherichia coli, Análise descritiva, Modelos de

(9)

Abstract

In this work, we used weekly contamination data (number of Escherichia coli bacteria) for the period from 2011 to 2015 to describe the water quality conditions of 15 points of the Natal coastline. Graphs, tables, and data summarization were used both at local level (each point) and at general level (all beaches together). Points NA-13 (Redinha/Potengi River) and NA-15 (Redinha Beach) obtained the worst contamination rates. The result of NA-13 should be related to the fact that the Potengi River is the main rainwater collector in the city. The point NA-15 is directly impacted by the sea currents that push the waters from the mouth of the Potengi River to this area, and the uncontrolled urban sprawl in the north zone of Natal, as well as the high concentration of bathers and trades on the beach. On the other hand, point NA-06 (Via Costeira) obtained the best results regarding the levels of contamination in the monitored period. This is probably due to the peculiar conditions of the region. It is an area of open sea, with low urban density (only hotels), few accesses to the beach and no commercial structure of bar and restaurant, being therefore an area of reduced anthropic impact. After the descriptive analysis, we adjusted multiple linear regression and simple linear regression models using as predictive variables, respectively, daily rainfall levels in the 6 days prior to each collection and the accumulated rainfall in those 6 days. The response variable was the number of bacteria counted in the weekly water samples by the most probable number method (MPN). The models were not satisfactory, nor did they fit the assumptions necessary for their acceptance and use for predicting the amount of bacteria in the water. We conclude that for the development of statistical tools for balneability prediction, it is necessary to use more explanatory variables, as well as more robust methods, which treat data inflated with zeros, since rainfall in the capital assumes zero values with high frequency due to the Tropical Climate of the city.

(10)

Lista de tabelas

Tabela 2.1 – Padrões de classificação de água recreacionais no Brasil e na Comunidade

Europeia. . . 19

Tabela 3.1 – Localização dos pontos de coleta de amostras de água. . . 21

Tabela 3.2 – NMP com limite de confiança de 95% para várias combinações de resultados positivos quando 5 tubos são usados para cada diluição (10ml, 1,0ml e 0,1ml). . . 21

Tabela 4.1 – Resumo dos cinco números . . . 29

Tabela 4.2 – Dez maiores ocorrências de contaminação. . . 37

Tabela 4.3 – Estatísticas descritivas dos 15 pontos analisados. . . 40

Tabela 4.4 – Classificação hipotética utilizando as normas da Comunidade Européia. 41 Tabela 4.5 – Análise de Componentes Principais com os 6 dias de chuvas anteriores à cada coleta. . . 44

Tabela 4.6 – Modelo de regressão linear múltipla ajustado para o ponto Na-15 . . . 45

(11)

Sumário

Lista de tabelas . . . . 9

1 INTRODUÇÃO . . . 11

1.1 Objetivos . . . 13

1.2 Organização dos Capítulos . . . 13

2 REVISÃO BIBLIOGRÁFICA . . . 15

3 METODOLOGIA . . . 20

3.1 Análise de Componentes Principais . . . 23

3.2 Regressão Linear Múltipla . . . 24

4 RESULTADOS . . . 28 4.1 Estatística Descritiva . . . 28 4.2 Modelos de Previsão . . . 43 5 CONCLUSÕES . . . 52 APÊNDICE A – CÓDIGO R . . . 54 REFERÊNCIAS . . . 64

(12)

11

1 Introdução

O Rio Grande do Norte é o destino turístico de aproximadamente 2 milhões turistas anualmente (SETUR-RN, 2017). Segundo o Ministério do Turismo, em 2015, o estado recebeu 28.580 estrangeiros por vias aéreas, oriundos de todos os continentes. Além disso, Natal foi o sétimo destino mais visitado por brasileiros. A capital possui a maior rede hoteleira do Rio Grande do Norte e hospeda a grande maioria dos turistas que visitam o estado (MTUR-GOV, 2017).

Esses números devem-se, predominantemente, ao fato do extenso litoral que o estado possui. São 410 km de zona costeira, com praias repletas de belezas naturais (dunas, falésias, lagoas e áreas preservadas), águas mornas e infraestrutura básica (rodovias, hotéis, pousadas e restaurantes) para recepção dos turistas. Além disso, não somente turistas, mas um grande número de residentes do estado, que tem uma população estimada em 3.474.998 de habitantes (IBGE, 2017) e também usufrui do litoral norte rio grandense. Com destaque especial, temos o município de Natal, capital do estado e com uma população atualmente de 877.662 de habitantes e densidade demográfica igual à 4.805,24 habitantes por quilômetro quadrado (IBGE, 2017). Portanto, podemos perceber que as praias do RN são o destino de grande visitação por um elevado número de pessoas ao longo do ano, com especial destaque às praias urbanas da capital Natal, devido à sua extensa rede hoteleira, atrações turísticas e infraestrutura básica para recebimento do público.

No Brasil, corpos de água (praias, lagos, lagoas, rios e açudes) para uso recreacional devem atender as normas de balneabilidade estabelecidas pelo Conselho Nacional do Meio Ambiente, através das resoluções técnicas (nº 274/00 e 20/86) que definem características físico-químicas que devem ser atendidas para que aquela área seja considerada própria para banho (CONAMA, 2000). Esses critérios de balneabilidade são definidos após realização de estudos epidemiológicos, que determinam quantidades limítrofes de cada indicador bacteriológico para que o risco de se contrair doenças esteja em níveis aceitáveis (KAY et al., 2004).

No Rio Grande do Norte, o órgão responsável pelo monitoramento das águas cos-teiras e divulgação dos resultados ao público é o Instituto de Desenvolvimento Sustentável e Meio Ambiente (IDEMA), que realiza o trabalho em conjunto com o Instituto Federal do Rio Grande do Norte (IFRN), a Fundação de Apoio à Educação e ao Desenvolvimento Tecnológico do Rio Grande do Norte (FUNCERN) e ao Programa Água Azul, gerando boletins semanais que reportam a qualidade das águas e classifica as áreas como próprias ou impróprias para banho.

(13)

Capítulo 1. Introdução 12

sofre com um processo intenso de urbanização. Ligações clandestinas de esgoto que escoam nas praias assim como o lixo que quando não devidamente coletado é transportado pelos ventos e/ou chuvas até o mar, poluindo as águas e faixas de areia da região. Dado isso, é de fundamental importância que esses locais estejam em condições seguras e adequadas de limpeza para que não venham causar problemas de saúde na população.

Uma das ferramentas de gestão ambiental utilizada para monitoramento e fis-calização da qualidade ambiental das praias é a análise microbiológica sistemática da água. Esse processo consiste em coletar amostras de águas regularmente e investigar a presença de microorganismos danosos a saúde humana, como os Coliformes termotolerantes (fecais). Dentro desse grupo de bactérias, destacamos a Escherichia coli, que é natural do trato gastrointestinal humano, mas que quando em quantidades elevadas ou quando ocorrem suas variantes, tornam-se nocivas à saúde, causando doenças como gastroenterites, cólera, diarréia e outras (FUNASA, 2009). A análise microbiológica verifica a presença e a quantidade dessas bactérias de origem fecal na amostra de água da praia. Além disso, a identificação de coliformes fecais na água indica que esta poderá ter sido contaminada com água de esgoto e consequentemente terá maior potencial de prejuízo a saúde caso os banhistas venham a ingerir a água. Sendo a população infantil o grupo de maior risco (IDEMA-RN, 2017).

No entanto, o monitoramento ambiental dos indicadores de poluição, quando é feito, utiliza-se de informações pretéritas sob determinado ponto em análise. Dados microbiológicos são coletados periodicamente e quando os índices de contaminação atingem o limite estabelecido pela lei que regulamenta aquela região, a área em questão torna-se imprópria para banho. Percebemos então que a classificação do local em um determinado período é baseada, na verdade, em dados que refletem uma situação anterior ao atual. Isso deve-se ao fato de que os métodos de análises microbiológicas atualmente utilizados geram resultados em tempo mínimo de 24 horas após coleta do material. Como consequência, muitos problemas de saúde pública relacionados à contaminação não podem ser evitados ou sequer minimizados, uma vez que só é possível conhecer a balneabilidade de um determinado local após os frequentadores já terem visitado, possivelmente tido contato com a água e terem sido expostos a quaisquer tipos de organismos prejudiciais à saúde humana que por ventura estejam presentes ali.

Diante do problema explicitado acima, é de grande interesse científico e importância para a sociedade e para gestores, o desenvolvimento de ferramentas estatísticas que possam realizar previsões dos níveis de contaminação de corpos d’água que são utilizados para o uso recreacional. Para tal, são utilizadas características físicas, químicas e biológicas do local, que possam apresentar relações diretas com as quantidades de organismos agressores à saúde humana. Tais ferramentaas podem auxiliar a gestão ambiental das áreas costeiras, dando suporte técnico aos órgãos responsáveis pela fiscalização e controle dessas praias

(14)

Capítulo 1. Introdução 13

para que possam tomar medidas políticas, econômicas e sociais para mitigar os impactos resultantes da presença humana nessas áreas, seja como agente poluidor, seja como usuário recreacional do local contaminado.

1.1

Objetivos

Os objetivos principais desta monografia são:

• Revisar as técnicas estatísticas aplicadas em ajustes de modelos para previsão de contaminação, assim como identificar as principais dificuldades nesse processo.

• Avaliar descritivamente a qualidade das águas nas praias de Natal nos últimos 5 anos.

• Ajustar modelos de regressão linear simples e múltipla aos dados de contaminação das praias de Natal.

Com isso, os objetivos específicos são:

• Realizar uma revisão bibliográfica, apresentando resultados de pesquisas anteriores sobre ajustes de modelos com dados de contaminação.

• Descrever os índices de contaminação de cada ponto investigado através de gráficos e tabelas de sumarização dos dados.

• Validar os modelos ajustados para realização de previsões de balneabilidade.

1.2

Organização dos Capítulos

Os capítulos deste trabalho são organizados da seguinte forma: no Capítulo 1 fizemos uma introdução ao tema balneabilidade de praias e apresentamos possíveis proble-mas relacionados a má qualidade da água, assim como a necessidade e importância do desenvolvimento de ferramentas que auxiliem no monitoramento da qualidade da água nas praias do Rio Grande do Norte. Também apresentamos os objetivos do trabalho ao final da introdução. O Capítulo 2 é uma revisão bibliográfica do tema modelos de predição de qualidade da água. São apresentados trabalhos executados no Brasil e no exterior, seu resultados e as principais dificuldades percebidas para realização dos trabalhos e acurácia dos resultados. No Capítulo 3 é descrita a metodologia de coleta e análise de dados. Além disso, introduzimos os conceitos e objetivos das ferramentas estatísticas utilizadas no trabalho para análise dos dados. Foram elas: análise de componentes principais, regressão linear simples e múltipla. No Capítulo 4 apresentamos os resultados descritivos das análises

(15)

Capítulo 1. Introdução 14

das praias de Natal e discutimos aspectos estatísticos e micriobiológicos dos resultados e características de particulares de alguns pontos investigados no trabalho. Posteriormente são apresentados os resultados dos modelos de previsão, assim como é realizada a discussão dos resultados obtidos e levantados problemas enfrentados na elaboração dos modelos de previsão. No Capítulo 5 são feitas as conclusões e considerações finais do trabalho, além de propostas para futuros trabalhos. Por fim, no apêndice é apresentado todo o script utilizado no software estatístico para manipulação, tratamento e análise dos dados.

(16)

15

2 Revisão Bibliográfica

Hirai e Porto (2016) aplicaram técnicas de regressão linear para predizer a bal-neabilidade (qualidade da água para uso recreacional) da praia de Cachoeira das Emas – SP, utilizando como variável preditora os níveis de precipitação acumulada das áreas nas últimas 24, 36 e 72 horas antes da coleta do material para análise. Os resultados desse estudo se mostraram eficazes, desde que usada de forma específica para cada área monitorada, e após uma seleção prévia desses três parâmetros que melhor se relacionam com os indicadores microbiológicos. Além disso, as capacidades preditivas dos modelos ajustados foram melhores para determinados períodos do ano.

Analisando os níveis de coliformes fecais no Rio Charles, em Massachusetts - EUA, Eleria e Vogel (2005) utilizaram modelos de regressão linear para predizer a quantidade de coliformes fecais de pontos frequentados pelo público e regressão logística para predizer a probabilidade desses níveis ultrapassarem o máximo permitido pela legislação da região. Os modelos ajustados utilizaram como variável preditora fatores meteorológicos (precipitação, vento, estação do ano, incidência solar e cobertura do céu por nuvens) e fatores hidrológicos (corrente marítima e presença de efluentes urbanos próximos ao local de análise).

Francy et al. (2013) desenvolveram modelos de predição também por regressão linear para uma região de Ohio que contém oito lagos regularmente utilizados como área de recreação. Os modelos tiveram ajustes diferentes para os pontos analisados, e 9 dos 22 pontos estudados tiveram os modelos validados para anos independentes. Precipitação, direção e velocidade do vento, turbidez e temperatura da água foram as variáveis que apresentaram maiores correlações com os níveis da bactéria Echerichia coli, um dos indicadores de qualidade da água.

Além disso, outros estudos foram realizados na década passada com mesmo objetivo. Cristensen, Jian e Ziegler (2000) ajustaram dados de coliformes fecais utilizando regressão linear tendo como variáveis preditoras a turbidez da água e o mês de coleta. Clark e Norris (2000) ajustaram modelo semelhante para níveis de coliformes fecais utilizando as variáveis descarga de efluentes, condutividade da água, pH, temperatura da água e oxigênio disponível. E Francy, Gifford e Darner (2002) realizaram predições das quantidades de

E. coli utilizando dados de altura de onda, direção da corrente, turbidez, precipitação,

número de aves no momento da coleta e horário da coleta.

Todos os trabalhos supracitados variam quanto a estatística de ajuste (R2). Desde ajustes comR = 0,012 até R = 0,8. Ge e Frick (2007) listam problemas durante o processo de modelagem de dados de contaminação (coliformes e E. coli) para realização de previ-sões de balneabilidade dos corpos dágua. Questões como multicolinearidade de variáveis

(17)

Capítulo 2. Revisão Bibliográfica 16

implicando em correlação serial, critérios para seleção de modelo, seleção de variáveis explicativas que apresentem correlação com a variável resposta, são dificuldades recorren-tes nos estudos de modelagem estatística nessa área. Entretanto, podemos ainda assim perceber a aplicabilidade desse tipo de ferramenta na gestão ambiental, e a importância de estudos que busquem aprimorar o uso de métodos estatísticos no suporte às questões de avaliação e monitoramento ambiental, a fim de minimizar os impactos negativos gerados na população pelo contato direto com águas contaminadas.

Baseado no exposto, esse trabalho busca descrever as condições de balneabilidade das praias da região metropolitana de Natal nos últimos 5 anos, através da análise descritivas dos dados referente ao período de 2010 até 2015. Posteriormente, combinamos e aplicamos técnicas estatísticas para realização de previsão de balneabilidade utilizando como variável preditora os índices de precipitação diária da região. Foram utilizados métodos de Regressão Linear e Análise de Principais Componentes para ajustar modelos de previsão da quantidade de coliformes fecais presentes em cada ponto estudado.

Águas recreacionais de contato primário são aquelas em que há possibilidade de ingestão de quantidades significativas de água, como por exemplo, natação, surfe, esqui-aquático e mergulho. Para fiscalizção e classificação desse tipo de ambiente, o Brasil dispõe da regulamentação do CONAMA 020/86 e 274/00, que utiliza o percentual de atendimento do indicador microbiológico adotado, coliformes tolerantes, enterococci ou Escherichia

coli num mínimo de 5 amostras com intervalo de pelo menos 24 horas entre as coletas

(CONAMA, 2000). De acordo com as normas, temos que:

Art. 2º As águas doces, salobras e salinas destinadas à balneabilidade (recreação de contato primário) terão sua condição avaliada nas categorias própria e imprópria.

§ 1º As águas consideradas próprias poderão ser subdivididas nas seguintes catego-rias:

• Excelente: quando em 80% ou mais de um conjunto de amostras obtidas em cada uma das cinco semanas anteriores, colhidas no mesmo local, houver, no máximo, 250 coliformes fecais (termotolerantes) ou 200 Escherichia coli ou 25 enterococos por l00 mililitros;

• Muito Boa: quando em 80% ou mais de um conjunto de amostras obtidas em cada uma das cinco semanas anteriores, colhidas no mesmo local, houver, no máximo, 500 coliformes fecais (termotolerantes) ou 400 Escherichia coli ou 50 enterococos por 100 mililitros;

• Satisfatória: quando em 80% ou mais de um conjunto de amostras obtidas em cada uma das cinco semanas anteriores, colhidas no mesmo local, houver, no máximo

(18)

Capítulo 2. Revisão Bibliográfica 17

1.000 coliformes fecais (termotolerantes) ou 800 Escherichia coli ou 100 enterococos por 100 mililitros.

§ 2º Quando for utilizado mais de um indicador microbiológico, as águas terão as suas condições avaliadas, de acordo com o critério mais restritivo.

§ 3º Os padrões referentes aos enterococos aplicam-se, somente, às águas marinhas. § 4º As águas serão consideradas impróprias quando no trecho avaliado, for verificada uma das seguintes ocorrências:

• não atendimento aos critérios estabelecidos para as águas próprias;

• valor obtido na última amostragem for superior a 2500 coliformes fecais (termotole-rantes) ou 2000 Escherichia coli ou 400 enterococos por 100 mililitros;

• incidência elevada ou anormal, na Região, de enfermidades transmissíveis por via hídrica, indicada pelas autoridades sanitárias;

• presença de resíduos ou despejos, sólidos ou líquidos, inclusive esgotos sanitários, óleos, graxas e outras substâncias, capazes de oferecer riscos à saúde ou tornar desagradável a recreação;

• pH < 6,0 ou pH > 9,0 (águas doces), à exceção das condições naturais;

• floração de algas ou outros organismos, até que se comprove que não oferecem riscos à saúde humana;

• outros fatores que contra-indiquem, temporária ou permanentemente, o exercício da recreação de contato primário.

§ 5° Nas praias ou balneários sistematicamente impróprios, recomenda-se a pesquisa de organismos patogênicos.

Já a comunidade europeia adota um limite máximo em função da distribuição dos resultados de contagem de microorganismos, baseado nos percentis de 90% e 95% em no mínimo três anos de monitoramento. É importante citar que os percentis são estimados assumindo que os dados possuem distribuição normal, fato esse que raramente é observado. Portanto, deverá ser feita sempre a transformação dos dados originais utilizando logaritmo de base 10, antes de qualquer procedimento ou classificação (Council of European Union, 2006). Diante disso, a comunidade europeia regulamenta as águas costeiras dos países pertencentes ao bloco da seguinte forma:

(19)

Capítulo 2. Revisão Bibliográfica 18

– Águas são classificadas como de baixa qualidade caso o valor do quantil de 90%

da quantidade deE. coli tenha sido superior a 500 unidades por 100ml de água nas últimas 4 coletas realizadas no ponto.

• Qualidade suficiente

– Águas são classificadas como de qualidade suficiente caso o valor do quantil de

90% da quantidade de E. coli tenha sido igual ou inferior a 500 unidades por 100ml de água nas últimas 4 coletas realizadas no ponto.

– Ou caso o local tenha sofrido alguma contaminação de curto prazo e:

∗ Medidas de gerenciamento estão sendo realizadas como: acompanhamento da água, avisos de alerta aos banhistas e monitoramento da área.

∗ Medidas para prevenir, reduzir ou eliminar a fonte de contaminação. ∗ O número de amostras em desacordo ao mínimo permitido seja no máximo

15% do total de amostras realizadas naquele ponto durante o último período de coleta ou não mais que uma amostra durante a alta estação.

• Boa qualidade

– Águas são classificadas como de qualidade suficiente caso o valor do quantil de

95% da quantidade de E. coli tenha sido igual ou inferior a 500 unidades por 100ml de água nas últimas 4 coletas realizadas no ponto.

– Ou caso o local tenha sofrido alguma contaminação de curto prazo e:

∗ Medidas de gerenciamento estão sendo realizadas como: acompanhamento da água, avisos de alerta aos banhistas e monitoramento da área.

∗ Medidas para prevenir, reduzir ou eliminar a fonte de contaminação. ∗ O número de amostras em desacordo ao mínimo permitido seja no máximo

15% do total de amostras realizadas naquele ponto durante o último período de coleta ou não mais que uma amostra durante a alta estação.

• Excelente qualidade

– Águas são classificadas como de qualidade suficiente caso o valor do quantil de

95% da quantidade de E. coli tenha sido igual ou inferior a 250 unidades por 100ml de água nas últimas 4 coletas realizadas no ponto.

– Ou caso o local tenha sofrido alguma contaminação de curto prazo e:

∗ Medidas de gerenciamento estão sendo realizadas como: acompanhamento da água, avisos de alerta aos banhistas e monitoramento da área.

(20)

Capítulo 2. Revisão Bibliográfica 19

∗ O número de amostras em desacordo ao mínimo permitido seja no máximo 15% do total de amostras realizadas naquele ponto durante o último período de coleta ou não mais que uma amostra durante a alta estação.

Além disso, temos que:

• Período de análise refere-se a no mínimo os últimos 3 anos.

• O cálculo do percentil é baseado na distribuição normal dos dados microbiológicos após aplicação da transformação log10 nos dados originais.

A Tabela 2.1 resume os critérios de classificação descritos acima para uma melhor compreensão.

Tabela 2.1 – Padrões de classificação de água recreacionais no Brasil e na Comunidade Europeia.

Indicador bacteriológico (NMP/100 ml)

Referência Enterococci intestinal Escherichia coli Coliformes fecais Classificação Classificação Classificação

CONAMA 274/00 E ≤25 (≥80% *) E ≤ 200 (≥80% *) E ≤250 (≥80% *) B ≤50 (≥80% *) B ≤400 (≥80% *) B ≤500 (≥80% *) S ≤100 (≥80% *) S ≤800 (≥80% *) S ≤ 1000 (≥80% *) I >100 (>20% *) I >800 (>20% *) I >1000 (>20% *) COMUNIDADE EUROPEIA 2006/7/EC E percentil 95% ≤100 E percentil 95% ≤250 B percentil 95% ≤200 B percentil 95% ≤500 S percentil 90% ≤185 S percentil 90% ≤500 I percentil 90% ≥185 I percentil 90% ≥500 E - excelente; B - bom; S - satisfatório; I - impróprio; E, B e S - Próprio * total de amostras analisadas

(21)

20

3 Metodologia

Neste capítulo são descritos aspectos metodológicos para obtenção dos dados e realização do trabalho. Apresentaremos a área estudada, os procedimentos técnicos para coleta das amostras de água nos pontos investigados, assim como a análise laboratorial e os métodos estatísticos utilizados para desenvolvimento dos modelos de previsão de balneabilidade.

A área estudada (Figura 3.1) compreende a faixa litorânea do município de Natal. Os dados foram coletados semanalmente entre os anos de 2011 e 2015, totalizando 15 pontos de coletas (tabela 3.1). Os dados foram coletados de pontos fixos nas praias durante a maré baixa. A uma profundidade de 1 metro (faixa mais utilizada pelos banhistas), uma amostra de água era retirada 30cm abaixo da superfície da água e armazenada em recipiente esterilizado, que era prontamente colocado em bolsas térmicas resfriadas e transportadas para o laboratório o mais rápido possível para imediata análise. No laboratório eram executados todos os procedimentos metodológicos de análise de E. coli. Cada ponto foi observado 52 vezes por ano, totalizando 260 observações em 5 anos e 3900 amostras somando todos os pontos.

Figura 3.1 – Localização dos pontos de coleta de amostras de água em Natal.

Fonte: GoogleEarthPro, 10/09/2017 (imagem 01/2013).

O método utilizado para análise das amostras e contagem das bactérias foi o dos tubos múltiplos ou NMP (número mais provável)(APHA, 1999). Este método consiste de duas fases. Na primeira fase, chamada fase presuntiva, é feita a homogeneização e transferência de alíquotas das amostras de água coletada para tubos de ensaio, contendo no fundo um tubo invertido (tubo de Durhan) para coleta de gás, e o meio de cultura

(22)

Capítulo 3. Metodologia 21

Tabela 3.1 – Localização dos pontos de coleta de amostras de água.

Coordenadas UTM Coordenadas UTM

Ponto Praia Leste Norte Ponto Praia Leste Oeste

NA-01 Ponta Negra 260046 9349179 NA-09 Areia Preta 257590 9359784 NA-02 Ponta Negra 259680 9349347 NA-10 Artistas 257182 9360452 NA-03 Ponta Negra 259152 9349887 NA-11 Meio 256876 9361497 NA-04 Ponta Negra 258698 9350841 NA-12 Do Forte 256678 9362510 NA-05 Via Costeira 258612 9351454 NA-13 Redinha 255996 9363613 NA-06 Via Costeira 258376 9354778 NA-14 Redinha 256049 9363609 NA-07 Via Costeira 257590 9359784 NA-15 Redinha 255889 9365009 NA-08 Miami 257182 9360452

Fonte: elaborado pelo autor.

apropriado. Os tubos são armazenados a uma temperatura de 35ºC durante 24-48 horas. Após esse período são identificados os tubos que tiveram crescimento positivo dos coliformes através da observação de uma coloração amarelada resultado de uma reação ácida, ou da produção de gás que ficará retido no tubo de Durhan. Na segunda fase, chamada de fase confirmatória, são transferidas amostras dos tubos iniciais que tiveram crescimento bacterial confirmado para novos tubos igualmente preparados, porém agora com um caldo verde brilhante que serve de meio de cultura para coliformes fecais. Esses novos tubos são armazenado novamente sob mesmas condições e após 48 horas são observados para avaliação e confirmação ou não da presença de coliformes totais. A partir dessa segunda inoculação são obtidos resultados negativos em pelo menos um tubo da série em que os mesmos foram inoculados, e a combinação de resultados positivos e negativos nos permite estimar a quantidade de bactérias, através de cálculos de probabilidade (Tabela 3.2). O método possui pressupostos (OBLINGER; KOBURGER, 1975). Descritos a seguir:

• os organismos são distribuídos aleatoriamente na amostra de água e qualquer sub-amostra que contenha microorganismos irá apresentar crescimento bacteriano e consequentemente resultado positivo.

Tabela 3.2 – NMP com limite de confiança de 95% para várias combinações de resultados positivos quando 5 tubos são usados para cada diluição (10ml, 1,0ml e 0,1ml).

Combinação de

Positivos NMP/100mL

Limites do Intervalo de confiança 95%

Inferior Superior 0-0-0 <2 - -0-0-1 2 1 10 0-1-0 2 1 10 0-2-0 4 1 13 1-0-1 4 1 15

(23)

Capítulo 3. Metodologia 22 Combinação de

Positivos NMP/100mL

Limites do Intervalo de confiança 95%

Inferior Superior 1-1-0 4 1 15 1-1-1 6 2 18 1-2-0 6 2 18 2-0-0 4 1 17 2-0-1 7 2 20 2-1-0 7 2 21 2-1-1 9 3 24 2-2-0 9 3 25 2-3-0 12 5 29 3-0-0 8 3 24 3-0-1 11 4 29 3-1-0 11 4 29 3-1-1 14 6 35 3-2-0 14 6 35 3-2-1 17 7 40 4-0-0 13 7 38 4-0-1 17 5 45 4-1-0 17 7 46 4-1-1 21 9 55 4-1-2 22 12 63 4-2-0 26 9 56 4-2-1 26 12 65 4-3-0 27 12 67 4-3-1 33 15 77 4-4-0 34 16 80 5-0-0 23 9 86 5-0-1 30 10 110 5-0-2 40 20 140 5-1-0 30 10 120 5-1-1 50 20 150 5-1-2 60 30 180 5-2-0 50 20 170 5-2-1 70 30 210 5-2-2 90 40 250 5-3-0 80 30 250 5-3-1 110 40 300 5-3-2 140 60 360 5-3-3 170 80 410 5-4-0 130 50 390 5-41 170 70 480 5-4-2 220 100 560 5-4-3 280 120 690 5-4-4 350 160 820

(24)

Capítulo 3. Metodologia 23

• todo o procedimento de contagem é livre de contaminação como resultado da expertise do pesquisador.

Para o desenvolvimento de modelos de previsão de balneabilidade dos pontos estudados, utilizamos as seguintes variáveis preditoras:

1. índice de precipitação 1 dia antes da coleta (milímetros de chuva).

2. índice de precipitação 2 dias antes da coleta (milímetros de chuva).

3. índice de precipitação 3 dias antes da coleta (milímetros de chuva).

4. índice de precipitação 4 dias antes da coleta (milímetros de chuva).

5. índice de precipitação 5 dias antes da coleta (milímetros de chuva).

6. índice de precipitação 6 dias antes da coleta (milímetros de chuva).

7. índice de precipitação acumulado nos 6 dias anteriores a coleta (milímetros de chuva).

Os dados de precipitação foram obtidos através do Instituto Nacional de Pesquisas Espaciais (INPE), órgão que possui bases meteorológicas em Natal para coleta de diversos dados, incluindo índice de precipitação diário. Todos os dados desse trabalho foram manipulados e tratados utilizando o software R (R Core Team, 2017), bem como a confecção dos gráficos e análises estatísticas.

3.1

Análise de Componentes Principais

Análise de Principais Componentes (ACP) é uma técnica que extrai informações da matriz de covariância ou de correlação de p variáveis, de maneira que esse grupo de p variáveis aleatórias poderão ser representadas por um número inferior a p de componentes principais, que são combinações lineares das variáveis analisadas (DENIS, 2016). Em outras palavras, a ACP busca explicar a estrutura de variância-covariância de um conjunto de dados através de poucas combinações lineares dessas variáveis, de forma a reduzir a dimensionalidade dos dados e facilitar a interpretação dos mesmos (JOHNSON; WICHERN, 2007).

Geometricamente, essas combinações lineares são ortogonais entre sim e repre-sentam o novo sistema de coordenadas obtido após a rotação do sistema original, com

X1, X2, · · · , Xp, sendo X1 a coordenada com maior variabilidade, seguida pela direção

X2 com segunda maior variabilidade e assim por diante. Portanto, esses novos eixos

representam as direções com maior variabilidade e permite uma descrição mais simples e parcimoniosa da estrutura de covariância dos dados. Além disso, como resultado da

(25)

Capítulo 3. Metodologia 24

perpendicularidade dos novos eixos nesse novo sistema de coordenadas, conclui-se que essas componentes principais são não-correlacionados e possuem a maior variância possível (JOHNSON; WICHERN, 2007). Computacionalmente, a ACP encontra os autovalores e autovetores da matriz de covariância dos dados através do processo de decomposição espectral, em que a matriz de covariância precisa ser positiva definida, ou seja, cada autovalor da matriz é positivo.

No presente estudo, a análise de componentes principais foi utilizada para ortogo-nalizar os índices pluviométricos, evitando assim problemas de multicolinearidade, uma vez que poderá haver correlação entre os índices de dias consecutivos. Aplicando a técnica podemos utilizar as componentes que explicam a maior proporção de chuvas na região nos modelos de Regressão Linear Múltipla.

3.2

Regressão Linear Múltipla

Análise de Regressão Múltipla é uma técnica estatística que pode ser usada para previsão de valores de uma ou mais variável resposta (dependente) a partir de um grupo de variáveis preditoras (independentes). Além disso, o método permite mensurar o efeito de cada variável preditora, individualmente, no resultado da variável resposta (JOHNSON; WICHERN, 2007) (DENIS, 2016).

Sejam X1, X2, · · · , Xp as p variáveis preditoras da variável resposta Y . Na aplicação,

temos p = 4, e as variáveis correspondentes são:

Y = quantidade de coliformes fecais na amostra. X1 = milímetros de chuva 1 dia antes da coleta.

X2 = milímetros de chuva 2 dias antes da coleta.

X3 = milímetros de chuva 3 dias antes da coleta.

X4 = acumulado nos últimos 4 dias antes da coleta.

Especificamente, o modelo de regressão linear com uma única resposta fica na forma:

Y = β0+ β1x1+ . . . + βpxp + ε,

Em que o modelo clássico de regressão linear assume que Y representa a variável resposta que depende das variáveis explicativas X1, X2, · · · , Xp e de um erro aleatório

ε oriundo de falhas durante a medição e efeitos de variáveis não avaliadas no modelo.

O valores das variáveis preditoras obtidos durante a observação do experimento são consideradas como fixas. Portanto, o erro e a variável resposta Y são classificadas como

(26)

Capítulo 3. Metodologia 25

variáveis aleatórias cujo comportamento é caracterizado por um conjunto de pressupostos sobre suas distribuições.

Com n observações independentes de Y e os valores associados de Xi, o modelo

completo será: Y1 = β0+ β1x1,1+ β2x1,2+ · · · + βpx1,p + ε1 Y2 = β0+ β1x2,1+ β2x2,2+ · · · + βpx2,p + ε2 .. . Yn = β0+ β1xn,1+ β2xn,2+ · · · + βpxn,p + εn

Além disso, temos que:

• xn,1, xn,2, · · · ,xn,p são valores observados das variáveis explicativas. Constantes

co-nhecidas.

• β0, β1, β2, · · · , βp são parâmetros do modelo. Coeficientes de regressão.

• ε1, · · · , εn são erros aleatórios.

O termo linear se refere ao fato da média da variável resposta Y ser uma função linear dos parâmetros β0, β1, · · · , βp, denominadas coeficientes de regressão. As variáveis

preditoras podem entrar ou não no modelo como interação.

Os erros aleatórios possuem as seguintes propriedades, denominadas condições de Gauss-Markov:

1. E(εi) = 0

2. V ar(εi) = σ2(constante)

3. Cov(εi,εj) = 0, i 6= j

Portanto, os erros tem média zero e variância σ2, desconhecida. São não

correlacio-nados e possuem distribuição normal, ou seja, ε ∼ N (0,σ2).

Dado que as condições acima se verificam, então a variável Y tem distribuição normal com variância σ2 e média igual à:

(27)

Capítulo 3. Metodologia 26

Em notação matricial, podemos escrever o modelo da seguinte forma:         Y1 Y2 .. . Yn         =         1 X1,1 X1,2 · · · X1p 1 X2,1 X2,2 · · · X2p .. . ... ... . .. ... 1 Xn,1 Xn,2 · · · Xn,p                 β1 β2 .. . βp         +         ε1 ε2 .. . εp         ou Y |{z} (n×1) = X |{z} n×(p+1) β |{z} (p+1)×1 + ε |{z} (n×1) em que:

• Y = (Y1, · · · , Yn)T: o vetor transposto das observações da variável dependente.

• X: matriz dos valores constantes de x observados para cada observação da reposta y

• β: vetor dos parâmetros do modelo.

• ε: vetor dos erros aleatórios de cada observação.

As propriedades dos erros aleatórios serão:

1. E(ε e ) = 0 e 2. Cov(ε) = E(ε e εT f

) = σ2I, em que I é a matriz identidade.

Deve-se notar que o 1 na primeira coluna da matriz X é o multiplicador da constante

β0. Dessa forma:

β0+ β1Xi,1+ · · · + βpXi,p = β0Xi,0+ β1Xi,1+ · · · + βpXi,p, ∀i = 1, · · · , n.

Cada coluna de X consiste de n valores correspondentes a variável preditora, enquanto que a j-ésima linha de X contém os valores de todas as variáveis preditoras do

j-ésima sujeito/objeto observado.

A cada observação (yi, x1i, x2i, . . . , xpi) haverá um resíduo ˆεi = yi− ˆyi = yi− ( ˆβ0+

ˆ

β1x1i+ ˆβ2x2i+ · · · + βpxpn). O vetor de resíduos ˆε

e = Y

e

− X ˆβ contém informação sobre o

parâmetro desconhecido σ2. Precisamos estimar os parâmetros β

0, β1, · · · , βp de modo a

minimizar a soma dos quadrados dos erros:

SQR = n X i=1 ε2i = n X i=1 (yi− b0− b1x1i− b2x2i− · · · − bpxpi)2 = (y − xb)t(y − xb).

(28)

Capítulo 3. Metodologia 27

Para tal, devemos resolver as seguintes equações:

∂SQR ∂b0 = 0 , ∂SQR ∂b1 = 0 , · · · , ∂SQR ∂bp = 0

Assumindo que a matrix XT × X é não singular, a solução do sistema é:

b =         b0 b1 .. . bp         = (XTX)−1XTY

Que é estimativa para

β =         β0 β1 .. . βp        

Cada coeficiente de regressão estimado bi, i = 1, . . . , p (estimativa de βi), estima o

efeito sobre o valor médio da variável dependente Y de uma alteração unitária da variável independente Xi, mantendo-se constantes todas as restantes variáveis independentes.

No presente trabalho utilizamos a técnica de regressão linear múltipla para ajustar modelos de previsão de balneabilidade das praias em um determinado dia a partir do volume de chuva ocorrido em cada dia até o limite de 6 dias antes do dia da coleta. Contudo, foi também executada uma análise de regressão linear simples, isto é, uma regressão com somente uma variável preditora. No caso, a variável utilizada foi a chuva acumulada nos últimos seis dias antes da coleta, ou seja, o somatório desses índices. A técnica não será descrita pois é semelhante aos procedimentos detalhados acima para o método de regressão linear múltipla, com a diferença que agora só serão estimados dois parâmetros do modelos, os coeficientes β0 e β1, e por métodos semelhantes aos já descritos.

(29)

28

4 Resultados

Este capítulo apresenta os resultados das análises descritivas dos índices de con-taminação do litoral Natalense, e também um detalhamento a nível local dos 15 pontos monitorados. São discutidos os principais fatores para os resultados gerais e locais, sejam eles positivos (boa qualidade da água) ou negativos (má qualidade da água).

Além disso, é também retratado neste capítulo o modelo ajustado através do método de regressão múltipla e simples para previsão de índice de contaminação de um dos pontos, juntamente com a análise de diagnóstico da qualidade do ajuste obtido.

4.1

Estatística Descritiva

Nesta sessão são detalhadas as análises descritivas realizadas para a variável número de bactérias da espécie Escherichia coli entre 2011 e 2015 em 15 pontos do litoral de Natal. A análise é desenvolvida tanto a nível geral, ou seja, considerando os todos os pontos agrupados, quanto a nível local, isto é, avaliando aspectos específicos de cada ponto investigado. Para tal, foram utilizados histogramas, boxplot, tabelas, gráficos de tendência e distribuição de médias ao longo do tempo.

O histograma dos níveis de contaminação por Escherichia coli nos quinze pontos agrupados indica um distribuição unimodal, com acentuada assimetria a direita (Figura 4.1). Podemos perceber que a ocorrência de valores abaixo dos 500 ufc/ml de água são bem mais frequentes que ocorrências de valores superiores. Por outro lado, valores extremos (por exemplo: 9200 ufc/ml e 16000 ufc/ml) ocorreram em baixa frequência ao longo dos 5 anos analisados. Apesar disso, valores muito elevados precisam ser considerados nas análises e destacados, uma vez que eles são extremamente danosos à saúde. Além isso, é importante notarmos que uma alta quantidade de microorganismos não ocorre pontualmente na escala temporal, isto é, aumenta em um dia e baixa no dia seguinte. Essa variação é gradativa, o que significa que após um pico de bactérias em determinado ponto, será necessário tempo (horas ou dias, dependendo da maré, ventos e correntes) para que os níveis voltem a patamares mais baixos e menos prejudiciais. No entanto, essa variação não foi possível de ser detectada devido aos intervalos semanais entre cada coleta.

A Tabela 4.1 reforça a questão da assimetria da distribuição dos dados, uma vez que a média (239 ufc/ml) e mediana (23 ufc/ml) estão distantes entre si, assim como também o 3º quantil do valor máximo. Resultado similar é observado quando realizamos as análises para cada ponto amostrado. O resultado está demonstrado na Figura 4.2.

(30)

Capítulo 4. Resultados 29

90º percentil (Figura 4.3) evidenciam a distribuição assimétrica dos dados. Esse padrão de distribuição é bastante descrito na literatura para esse tipo de variável (contaminantes de água), e por essa razão, recomenda-se a transformação dos dados, pois dessa maneira consegue-se uma melhora significativa na linearidade dos dados e consequentemente um melhor ajuste dos modelos de previsão (USEPA, 2016). Dado isso, realizamos a transformação para escala logarítmica de base 10.

Tabela 4.1 – Resumo dos cinco números

Mínimo 1° quantil Mediana Média 3° quantil Máximo NA´s

2 6 23 239 98 16000 15

Fonte: elaborado pelo autor.

Figura 4.1 – Histograma do número de coliformes fecais agrupando todos os pontos estu-dados no período.

(31)

Capítulo

4.

R

esultados

30

Figura 4.2 – Histograma do número de coliformes fecais identificados em cada ponto investigado no período.

(32)

Capítulo

4.

R

esultados

31

Figura 4.3 – Boxplot considerando até o 90° percentil dos índices de contaminação dos 15 pontos investigados.

(33)

Capítulo 4. Resultados 32

É importante notar na Figura 4.3 a presença deoutliers em todos os quinze pontos. De fato, altos índices de contaminação têm ocorrido ao longo da orla de Natal devido à descarga clandestina de esgoto doméstico nas galerias de águas pluviais que deságuam nas praias (VALADÃO; ARAÚJO, 2012). Outro ponto importante são as ocorrências de valores iguais entre os pontos. Isto deve-se ao procedimento de contagem das amostras. O método NMP (número mais provável) estima o número de microorganismos baseando-se na combinação de resultados positivos e negativos como descrito na metodologia. Após a obtenção dessa combinação, faz-se uma estimação do número total bem como o intervalo de confiança com 95% (OBLINGER; KOBURGER, 1975).

Fazendo uma análise geral dos pontos, podemos observar na Figura 4.1 que há sempre ocorrência de picos de coliformes fecais ao longo dos anos em ao menos 1 dos 15 pontos, fazendo com que a média geral alcançe níveis elevados. Médias acima de 500 ufc/ml são comuns na Figura 4.1, indicando assim uma baixa qualidade das águas. No entanto, essas médias podem estar sendo acentuadas ou atenuadas devido a locais específicos mais ou menos poluídos, respectivamente. Portanto, uma análise ponto a ponto foi realizada posteriormente para detalhar as variações de cada local e para sabermos quais locais estão contribuindo negativamente e positivamente para essa dinâmica.

No intuito de avaliarmos a tendência geral do índice, produzimos as Figuras 4.1 e 4.6 que apresentam a tendência do índice de contaminação dos 15 pontos agrupados e separados, respectivamente. Essa tendência é calculada utilizando o método de regressão não-paramétrica local (LOWESS - locally weighted scatterplot smoothing), que consiste em ajustar subgrupos de dados com regressões polinomiais por mínimos quadrados ponderados. Mais peso é dado a pontos próximos de onde a resposta está sendo estimada, e menos peso à pontos distantes das estimativas. Os valores da função de regressão para cada ponto é então obtido avaliando o polinômio local com a variável explicativa para aqueles pontos (CLEVELAND, 1979). Os sub-grupos de dados são gerados através do algoritmo do vizinho mais próximo (MACQUEEN, 1967).

Observando a Figura 4.1 podemos ter noção da evolução temporal dos índices de contaminação das praias entre 2011 e 2015. Comparando o início 2011 com o término das observações (fim de 2015), percebemos uma queda dos valores. Entretanto houve crescimento do número de contaminantes durante o período, mais especificamente entre meados de 2012 até final de 2014, seguido de queda novamente até início de 2015, quando se inicia novamente um aumento nos índices. Portanto, é importante o acompanhamento desses valores nos próximos anos para confirmarmos ou não essa tendência de aumento que vem ocorrendo desde início de 2015. Essas oscilações podem estar correlacionadas com índices pluviométricos de cada período, assim como nas ações administrativas de fiscalização e punição dos proprietários de áreas geradoras de esgostos clandestinos em toda a cidade. A análise ponto a ponto (Figura 4.6) detalha os índices localmente, indicando

(34)

Capítulo 4. Resultados 33

quais pontos contribuem mais e menos para essa variabilidade geral.

Figura 4.4 – Médias dos 15 pontos agrupados a cada coleta.

Fonte: elaborado pelo autor.

Figura 4.5 – Gráfico de tendência do índice de contaminação dos pontos em conjunto pelo método de regressão local.

(35)

Capítulo

4.

R

esultados

34

Figura 4.6 – Gráfico de tendência do índice de contaminação de cada ponto pelo método de regressão local.

(36)

Capítulo

4.

R

esultados

35

Figura 4.7 – Gráfico de tendência agrupado dos níveis de contaminação em cada ponto pelo método de regressão local.

(37)

Capítulo 4. Resultados 36

Analisando a Figura 4.6, podemos perceber comportamentos bastante diversos nos locais investigados. Porém um padrão importante que devemos notar é o crescimento no número de bactérias em todos os pontos entre 2013 e 2014, com exceção dos pontos NA-02 (Ponta Negra) e NA-14 (Redinha). Com especial destaque para os pontos NA-01 (Morro do Careca), NA-03 (Ponta Negra), NA-06 (Via Costeira), NA-11 (Praia do Meio) e NA-12 (Praia do Forte) que tiveram um acentuado aumento nos níveis de poluição nesse período.

Os pontos NA-04 (Ponta Negra), NA-05 (Via Costeira), NA-07 (Via Costeira), NA-08 (Miami), NA-09 (Areia Preta), NA-10 (Artistas), NA-13 (Redinha/Rio Potengi) e NA-15 (Redinha) também apresentaram aumento, porém menos vertiginosos. Vale ressaltar que a análise acima restringe-se à comparação do ponto com ele mesmo, uma vez que por exemplo, o ponto NA-01 (Morro do Careca) teve uma subida vertiginosa nos índices entre 2013 e 2014, mas continua com valores muito inferiores ao ponto NA-13 (Redinha/Rio Pontegi) que teve uma menor variação nesse mesmo período.

A Figura 4.7 retrata as mesmas informações que a Figura 4.6, no entanto a escala do eixo y está fixa. Dessa forma, podemos fazer comparações entre os pontos com maior precisão e segurança. Como podemos notar, os piores pontos no início de 2011 foram NA-09, NA-13 e NA-15, com valores superiores a 500 ufc/ml de água. Apesar desse resultado negativo, os pontos NA-13 e NA-15 obtiveram uma notável melhora com os passar dos anos, atingindo níveis mais próximos aos demais pontos a partir de 2015. O ponto NA-13 encontra-se na saída do Rio Potengi, local de aporte de águas fluviais e águas tratadas oriundas do esgotamento sanitário de grande área de Natal. Desde 2011 obras de saneamento têm sido realizadas no município, assim como a fiscalização e monitoramento de esgoto clandestinos, o que deverá ter resultado em melhores índices de poluição nessa área.

Já o ponto NA-15 apresenta maior adensamento urbano comparado a NA-14, por conta da maior área permitida para construção civil, gerando assim grande produção de resíduos de esgoto e lixo na área. Além disso, esse ponto está sobre direta influência das águas que saem na foz Rio Potengi e são transportadas pelo contínuo vento sudeste que sopra na região nordeste (MOTA, 2004). Esses dois fatores devem ter direta relação aos altos níveis até 2011. Nesse mesmo sentido, assim como houve melhora no ponto NA-13 devido às obras de infraestrutura, houve também mudanças positivas devido a obras realizadas em áreas próximas do ponto NA-15, e isso pode ter contribuído para redução da poluição das águas daquela região. Curiosamente, o ponto NA-14, que fica entre NA-13 e NA-15, apresentou um índice não tão elevado quanto NA-15, e bastante inferior ao NA-13 em 2011. Isso deve-se provavelmente a dois fatores: 1) é uma área menos adensada por conta da área de proteção ambiental (zona de mangue) que evita a expansão mobiliária e consequentemente reduz o impacto ambiental; 2) esse ponto está protegido das águas oriundas do Rio Potengi por um dick de pedras construído para auxíliar a entrada de navios no porto de Natal. Isto impede, ao menos parcialmente, que as águas contaminadas

(38)

Capítulo 4. Resultados 37

do rio que desembocam no mar sejam transportada pelas correntes para esse local. Outra questão que devemos ressaltar é a área de melhor balneabilidade. O ponto NA-06 (Via Costeira) obteve excelentes resultados tanto apresentando uma pequena amplitude dos índices obtidos por regressão local (Figura 4.6) quanto na estabilidade desses valores ao longo dos 5 anos (gráfico 4.7). Alguns fatores favorecem esse resultado. A via costeira é um local de baixo adensamento, pois é uma região limitada pelo Parque da Dunas, área de Proteção Ambiental Permanente (APA) e possui em toda sua extensão uma rede hoteleira majoritariamente saneada. Um segundo fator é a geografia da área. O mar não possui proteção de terra, dicks, barreira de corais ou qualquer outra coisa, portanto, é um mar considerado aberto que está sob constante influência das águas oceânicas que diluem qualquer poluente que por ventura venha a chegar naquele ponto. Por último, existe o fator presença humana. Sendo uma região de difícil acesso e o mar considerado perigoso. As praias da Via Costeira historicamente não sofrem com fluxo de turistas e/ou residentes, o que consequentemente reduz significativamente os impactos antrópicos nas águas daquela região. Ademais, não há comércio nem residências próximas, sendo assim bastante reduzida a geração de dejetos que se dá somente por parte dos hotéis ali instalados.

Tabela 4.2 – Dez maiores ocorrências de contaminação.

Ponto Local Data Valor

1 NA-02 Ponta Negra 23/04/2015 16000 2 NA-09 Areia Preta 18/06/2014 16000 3 NA-11 Praia do Meio 18/04/2013 16000 4 NA-13 Redinha 27/01/2011 16000 5 NA-01 Ponta Negra 13/06/2013 9200 6 NA-13 Redinha 13/06/2013 9200 7 NA-13 Redinha 05/07/2012 9200 8 NA-13 Redinha 12/05/2011 9200 9 NA-04 Ponta Negra 10/09/2015 5400 10 NA-09 Areia Preta 24/12/2015 5400

Fonte: elaborado pelo autor.

Aprofundando nas condições de balneabilidade das praias estudadas, construímos a Tabela 4.2 que mostra as dez piores ocorrências de contaminação durante os anos de 2011 até 2015 e a Figura 4.8 com as médias mensais para cada ano dos 15 pontos investigados. Chama a nossa atenção, na Tabela 4.2, o fato de todos os anos terem havido áreas com contagem de 16000 ufc/ml de água, valor extremamente acima do permitido pela lei regulatória brasileira. Além disso, essas ocorrências foram distribuídas em boa parte do litoral Natalense, indicando que há fontes de contaminação espalhadas. De fato, a Figura 4.8 mostra que os pontos NA-01, NA-02, NA-09, NA-11 e NA-13 tiveram médias mensais superiores a 3000 ufc/ml de água, seguidos dos pontos NA-03, NA-04, NA-07, NA-10, NA-12, NA-14 e NA-15 que tiveram contagens acima dos 2000 ufc/ml de água. Somente a

(39)

Capítulo 4. Resultados 38

região da Via Costeira (NA-05 e NA-06) apresentaram médias mensais inferiores a 1000 ufc/ml de água. Vale ressaltar que apesar de melhores, esses valores ainda oferecem grande risco aos banhistas.

(40)

Capítulo

4.

R

esultados

39

Figura 4.8 – Médias mensais de cada ponto entre 2011 e 2015.

(41)

Capítulo 4. Resultados 40

Ainda observando a Tabela 4.2, chama a nossa atenção o fato do ponto NA-13 aparecer 4 vezes entre os 10 piores resultados nesse período, ou seja, 40% das ocorrências. Seguido de Areia Preta que aparece 2 vezes. O Rio Potengi, como a maioria dos rios das capitais brasileiras, tem um histórico de aporte de efluentes de toda região metropolitana de Natal, além das inúmeras ligações clandestinas de esgoto não tratado à rede de saneamento que deságua no Rio, justificando esse péssimo resultado. Problema semelhante ocorre no ponto NA-09 (Areia Preta), que fica próximo da comunidade Mãe Luiza, um adensamento urbano que invade parte da zona de proteção ambiental do Parque das Dunas com construções irregulares e que não possuem rede de coleta de águas pluviais nem saneamento básico. Como consequência boa parte dos rejeitos gerados na área descem em direção ao mar através das chuvas e de ligações clandestinas de esgoto.

Abaixo temos uma tabela (Tabela 4.3) com as médias e medianas dos 15 pontos. Novamente, confirmamos o pior desempenho para o ponto NA-13 (Redinha - Rio Potengi) que teve maior média (858,87 ufc/ml) e maior mediana (350 ufc/ml) e o melhor desempenho para o ponto NA-06 (Via Costeira) que obteve menor média (52,91 ufc/ml) e menor mediana (5 ufc/ml).

Tabela 4.3 – Estatísticas descritivas dos 15 pontos analisados. Local n Média Mediana Perc90 Perc95 Desvio Padrão

NA-01 260 229,57 33 540 954 779,88 NA-02 260 293,85 49 540 1600 1131,11 NA-03 260 175,71 37 350 540 450,44 NA-04 260 224,35 23 436 1600 633,77 NA-05 260 130,61 23 251 920 363,56 NA-06 260 52,91 5 49 132 277,56 NA-07 260 203,61 5 350 1600 635,86 NA-08 260 102,61 7 130 540 389,01 NA-09 260 371,86 23 920 2400 1264,57 NA-10 260 161,26 17 350 920 483,81 NA-11 260 288,97 20,5 369 2400 1191,35 NA-12 260 164,94 14 240 973 489,67 NA-13 260 858,87 350 2400 3500 1662,86 NA-14 260 178,24 25 350 920 469,04 NA-15 260 146,86 14 287 540 460,04

Fonte: elaborado pelo autor.

Supondo os padrões de classificação de águas recreacionais da Comunidade Europeia (Council of European Union, 2006) e considerando o período de 5 anos, teríamos para os locais estudados o cenário apresentado na Tabela 4.4. Quatro pontos considerados impróprios para banho, dez pontos classificados como satisfatório (pior nível antes de se tornar imprópria) e somente um ponto avaliado como excelente, que foi o ponto NA-06 (Via Costeira) já citado anteriormente no texto.

(42)

Capítulo 4. Resultados 41

Tabela 4.4 – Classificação hipotética utilizando as normas da Comunidade Européia. Ponto Nome Percentil 90% Percentil 95% Classificação

NA-01 Morro do Careca 540 954 IMPRÓPRIA

NA-02 Antes do Morro 540 1600 IMPRÓPRIA

NA-03 Área Comercial 350 540 SATISFATÓRIA

NA-04 Próximo Via Costeira 436 1600 SATISFATÓRIA

NA-05 Início Via Costeira 251 920 SATISFATÓRIA

NA-06 Via Costeira 49 132 EXCELENTE

NA-07 Final Via Costeira 350 1600 SATISFATÓRIA

NA-08 Miami 130 540 SATISFATÓRIA

NA-09 Areia Preta 920 2400 IMPRÓPRIA

NA-10 Praia dos Artistas 350 920 SATISFATÓRIA

NA-11 Praia do Meio 369 2400 SATISFATÓRIA

NA-12 Praia do Forte 240 973 SATISFATÓRIA

NA-13 Rio Potengi 2400 3500 IMPRÓPRIA

NA-14 Início Redinha 350 920 SATISFATÓRIA

NA-15 Final Redinha 287 540 SATISFATÓRIA

Fonte: elaborado pelo autor.

Uma última observação é em relação aos meses do ano que ocorreram as piores médias mensais de contaminação. A literatura aponta fortes relações entre o índice pluviométrico de uma região e o aumento dos níveis de contaminação em corpos de água doce e/ou salgada, devido ao carreamento dos poluentes por tubulações e mesmo pela superfície, até rios, lagoas ou diretamente ao mar. Portanto, é de se esperar um crescimento dos níveis de poluição durante o período de chuva. Em Natal, historicamente, o período de maior chuva estende-se de março à julho (outono-inverno) (EMPARN, 2017). Isto pode ser visto na Figura 4.1. A Figura 4.9 nos permite avaliar essa questão, confirmando que nesse período ocorrem a maior parte das elevadas médias mensais de contaminação. Esse resultado acompanha o que tem sido citado e debatido na literatura. Pensando nisso, esse trabalho também buscou ajustar modelos de previsão de balneabilidade, utilizando como variáveis preditoras a quantidade de chuva em períodos anteriores ao dia da coleta da água.

Os resultados são descritos a seguir. Optamos por detalhar os resultados de somente um ponto dentre os quinze, para facilitar a compreensão e reduzir tanto a quantidade de redação quanto de gráficos durante a leitura. Isso foi possível pelo fato de que todos os pontos tiveram resultados semelhantes entre si quanto aos modelos e aos diagnóstico dos ajustes.

(43)

Capítulo

4.

R

esultados

42

Figura 4.9 – Médias mensais de cada ponto entre 2011 e 2015.

(44)

Capítulo 4. Resultados 43

Figura 4.10 – Histórico de pluviometria em Natal entre 2011 e 2015.

Fonte: elaborado pelo autor.

4.2

Modelos de Previsão

Nesta seção é descrito o modelo ajustado para os dados do ponto NA-15. Posterior-mente são apresentados os gráficos diagnósticos do ajuste e por fim são feitas considerações a respeito dos resultados obtidos. Análise equivalente foi aplicada para o restante dos pon-tos. No entanto, não serão apresentados visto que são numerosos e tiveram características bastante similares ao ponto descrito a seguir.

O ponto NA-15 localiza-se na região mais frequentada e adensada da Redinha, onde localizam-se residências e comércios. É o último ponto monitorado na área de Natal, no sentido da Zona Sul (Ponta Negra) para Zona Norte (Redinha). Inicialmente extraímos do banco de dados concedido pela EMPARN (2017) o índice pluviométrico dos 6 dias anteriores de cada coleta, ou seja, todos os dias de chuva entre uma coleta e outra, uma vez que as amostras eram obtidas a cada 7 dias. Estudos sobre o tempo de sobrevivência de Escherichia coli em água doce e salgada indicam resultados diversos, dependendo das condições locais como nível de radiação ultraviolota, temperatura da água, ph, biota local (zooplâncton), dentre vários outros fatores (FLINT, 1987)(ROZEN; BELKIN, 2001). Outro motivador para escolha dos 6 dias antes de cada coleta é o fato de historicamente Natal ter baixos índices pluviométricos. Com isso, o volume de chuva em um, dois e até três dias antes de cada coleta muitas vezes foi bastante baixo, prejudicando assim as análises. Após a seleção das variáveis explicativas, aplicamos a técnica de Análise de Componentes

(45)

Capítulo 4. Resultados 44

Principais por duas razões: primeiramente para evitar problemas de multicolinearidade entre as variáveis preditoras, uma vez que deve haver correlação entre a quantidade de chuvas em dias consecutivos; em segundo para que a variação das chuvas nesses 6 dias antes de cada coleta fosse melhor representada através das componentes princiapis, para que a partir daí então fossem utilizadas nos modelos de regressão múltipla. A Tabela 4.5 apresenta a importância das componentes principais para representação da variância dos dados pluviométricos.

Tabela 4.5 – Análise de Componentes Principais com os 6 dias de chuvas anteriores à cada coleta.

Importância das Componentes Principais

Comp. 1 Comp. 2 Comp. 3 Comp.4 Comp. 5 Comp. 6 Desvio Padrão 23,4338 16,1491 13,1683 12,5396 10,9548 8,0895 Proporção de Variância 0,4094 0,1944 0,1293 0,1172 0,0894 0,0601 Proporção Acumulada 0,4094 0,6039 0,7332 0,8504 0,9398 1,0000

Fonte: elaborado pelo autor.

A partir do resultado na Tabela 4.5, optamos por utilizar as quatro primeiras componentes principais nos ajustes, pois elas são suficientes para explicar aproximadamente 85% da variância dos dados. Um ponto importante a citar é que as coletas dos 15 pontos ocorriam no mesmo dia, portanto os dados de pluviometria eram os mesmo para todos os locais. Por este motivo, foi necessário a realização de somente uma Análise de Componentes Principais, e o resultado utilizado em todos os modelos criados para cada um dos pontos.

Após a ACP, aplicamos a transformação log10 nos dados de contagem de bactérias

(variável resposta), como recomendado pela literatura. Por fim, realizamos o ajuste do modelo e fizemos a análise dos resíduos para avaliar a qualidade do ajuste. A Tabela 4.6 apresenta o output do ajuste realizado para o ponto NA-15. Como podemos perceber, o modelo foi significativo a um nível de 1% (Estatística F = 7,785), e as componentes 1 e 2, foram significativas indicando que as componentes principais (representando a pluviomentria) contribuem para explicar parte da variância da variável resposta. Além disso o termo constante também foi significativo e portanto mantido no modelo. Já a baixíssima correlação (R < 0,1) entre as variáveis independentes e a variável dependente e, consequentemente, o reduzido R2 ajustado (R2 < 10%) comprometeram a realização de previsões. Entretanto, um baixo R2 não necessiariamente indica que não há relação entre as variáveis preditoras e resposta pois essa relação pode existir, mas de maneira não-linear, isto é, poderá haver uma relação curvilínea (KUTNER; NACHTSHEIM; NETER, 2005). A análise de relações não lineares entre as variáveis não fez parte do escopo desse estudo. O próximo passo foi analisar os resíduos graficamente (Figura 4.11) para verificar os pressupostos necessários para aceitação ou não do modelo de regressão.

(46)

Capítulo 4. Resultados 45

Tabela 4.6 – Modelo de regressão linear múltipla ajustado para o ponto Na-15

Variável dependente: log10(Valor) PC1 −0,012∗∗∗ (0,002) PC2 0,008∗∗∗ (0,003) PC3 −0,005 (0,004) PC4 0,002 (0,004) Constante 1,182∗∗∗ (0,056) Nº de observações 260 R2 0,109 R2 Ajustado 0,095

Erro Padrão dos Resíduos 0,768 (g.l = 255) Estatística F 7,785∗∗∗ (g.l = 4; 255)

Nota:p<0,1; ∗∗p<0,05;∗∗∗p<0,01

Fonte: elaborado pelo autor.

também avaliamos a influência dos valores extremos (outliers) no ajuste. De acordo com a Figura 4.11, podemos perceber que alguns dos pressupostos parecem não estar sendo respeitados. A Figura dos resíduos vs valores ajustados possui um leve afunilamento à direita, indicando heterocedasticidade.

A Figura Q-Q plot sugere uma distribuição não-normal. Não foi percebida viola-ção do pressuposto de independência dos erros. Para validarmos as interpretações dos gráficos quanto a heterocedasticidade e normalidade dos erros, executamos os testes de Breusch-Pagan (BREUSCH; PAGAN, 1979) e Shapiro-Wilk (SHAPIRO; WILK, 1965), respectivamente. Ambos os testes confirmaram as previsões de heterocedasticidade (valor-p = 0,0152) e resíduos com distribuição não-normal (valor-p = 2,875 × 10−5). Alguns proce-dimentos foram testados após o ajuste do modelo e análise dos resíduos, como por exemplo, outras transformações na variável resposta tais como logaritmo na base 2, logaritmos natural, raiz quadrado e cúbica, porém, nenhuma delas gerou resultados melhores em termos de R2 ou de comportamento dos resíduos.

(47)

Capítulo

4.

R

esultados

46

Figura 4.11 – Análise diagnóstico dos resíduos.

Referências

Documentos relacionados

Mineração de conhecimento interativa em níveis diferentes de abstração: Como é  difícil  prever  o  que  exatamente  pode  ser  descoberto  de  um  banco 

Antes porém me identifico com a abertura da noção conceitual de pansexualidade, a qual pode ser vista/lida como intensa manifestação sociocultural de uma sexualidade

[Informar a data, o nome e a assinatura do dirigente máximo que aprovou o documento Termo de Abertura do Projeto antes deste projeto ser solicitado ao Governador pelo

A participação foi observada durante todas as fases do roadmap (Alinhamento, Prova de Conceito, Piloto e Expansão), promovendo a utilização do sistema implementado e a

Gottardo e Cestari Junior (2008) efetuaram análise de viabilidade econômica na implantação de silo de armazenagem de grãos utilizando os seguintes modelos VPL,

Objetivo: Garantir estimativas mais realistas e precisas para o projeto, ao considerar nesta estimativa o esforço necessário (em horas ou percentual do projeto) para

Ainda segundo Gil (2002), como a revisão bibliográfica esclarece os pressupostos teóricos que dão fundamentação à pesquisa e às contribuições oferecidas por

O estudo múltiplo de casos foi aplicado para identificar as semelhanças e dissemelhanças na forma como as empresas relacionam seus modelos de negócios e suas