RESULTADOS - Aspectos da ecotoxicidade em ambientes

Nesta parte do manuscrito apresentaremos os resultados da aplicação do Script supramencionado, com comentários.

1) Faça a instalação do pacote e a leitura na biblioteca. Basta rodar essa etapa:

install.packages("fingerPro") library(fingerPro)

2) Conjunto de dados: Primeiro a respeito da tabela de dados que possui a coluna id, Land_Use e todas as variáveis analisadas, faça o mesmo. Veja que os Land_Uses são diferentes, os autores possuem por exemplo o AG, PI1, PI e SS e por fim, mix.sample. O mix.sample é o sedimento em suspensão ou sedimento de fundo, etc, é o objeto que você quer descobrir a origem da composição. Introduza no software o conjunto de dados rodando essa etapa:

data <- catchment

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 119

Figura 1: Conjunto de dados Catchment.

3) Os autores possibilitam uma visualização de um boxplot com as variáveis da coluna 1 até a 6 (columns=1:6), para ver as outras, basta mudar a numeração. Rode essa etapa:

boxPlot(data, columns = 1:6, ncol = 3)

Será possível visualizar a seguinte imagem:

Figura 2: BoxPlot variáveis de 1 até 6.

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 120

4) A proxima etapa os autores fazem uma análise de correlação com as 5 primeiras variáveis das colunas 1:5. Você verá a Figura 3 quando rodar o seguinte script:

correlationPlot(data, columns = 1:5, mixtures = T)

Figura 3: Matriz de correlação com 5 variáveis.

5) A próxima etapa é a analise DFA, rondando o Script:

LDAPlot(data, P3D=FALSE) Os resultados serão:

Figura 4: Resultado da análise estatística DFA.

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 121

6) Os autores citam que o conjunto de dados é colinear e então segue para encontrar os melhores traçadores, nesta etapa, ele aplica somente um teste, escolher o que melhor se aplica na minimização dos seus dados.

data <- rangeTest(data) data <- KWTest(data) data <- DFATest(data)

Com os dados “catchment”, o rangeTest excluí somente 3 variáveis (Cr, Pb e Zn) de um total de 21, o KWTest excluí 18 variáveis de um total de 21 e por fim, o DFATest excluí 14 variáveis de um total de 21.

Usando como exemplo o [data <- rangeTest(data)]

Resultado:

> data <- catchment

> #variables are collinear

> #select the optimum set of tracers by implementing the statistical tests

> data <- rangeTest(data)

Attention-> 3 variables from a total of 21 were removed: Cr Pb Zn. The variable/variables that remains in your dataset is/are: Pbex K40 Bi214 Ra226 Th232 U238 Nb Sr Rb Fe Mn V Ti Ca K Al Si Mg.

Rodar o script e formara a Figura 5:

LDAPlot(data, P3D=F) LDAPlot(data, P3D=T)

Figura 5: Análise estatística DFA.

7) Os autores carregam novamente o conjunto de dados originais pois observaram na análise LDA que os usos e ocupação do solo PI1 e PI se sobrepuseram e por isso, irão agrupar em um só grupo, rodando o script:

data <- catchment

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 122

data$Land_Use[data$Land_Use == 'PI1'] <- 'PI'

Após o agrupamento, aplicam novamente os testes RangeTest, KWTest ou DFATest para encontrar as variáveis que melhor discriminam as fontes. Por exemplo, com esses dados agrupados, aplicamos o [data <- KWTest(data)] e como resultado temos a exclusão de 15 variáveis:

data <- KWTest(data)

Attention-> 15 variables from a total of 21 were removed: K40 Th232 U238 Nb Sr Rb Zn Fe Cr V Ti Ca K Al Mg. The variable/variables that remains in your dataset is/are: Pbex Bi214 Ra226 Pb Mn Si.

Visualizando a nova imagem gerada na análise LDAPlot [LDAPlot(data, P3D=F)], temos a Fig. 6:

Figura 6: Plotagem gráfica da análise estatística DFA.

Como resultado temos essa separação dos usos e ocupação do solo bem distintos um do outro e esse é o objetivo dessa primeira etapa, a próxima é realizar a análise de função unmix.

A próxima etapa descrita, trata-se do resultado de pesquisa da autora deste trabalho (Frascareli, 2021). Como citado anteriormente, é possível calcular a incerteza associada a capacidade de cada grupo em discriminar as fontes, usando a distância Mahalaanobis. É possível usar o excel nessa etapa, mas também pode ser automatizado no software R da seguinte maneira, use:

##Incerteza associda a capacidade de diferenciação das fontes data1<-data

data1$Land_Use <-NULL data1

data1$id<-NULL x<-data1

mean = colMeans(x) mean

sx=cov(x) sx

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 123

D1= mahalanobis(x,mean, sx) D1

D2=D1^(2) D2

x data

Os resultados serão apresentados no display quando rodar o data e as distâncias entre os centroides de cada grupo devem ser apresentados. Para compreender melhor, segue um exemplo prático (Fig. 7):

Figura 7: Análise de Mahalanobis. Fonte: Frascareli (2021).

As amostras samples 1 até 4 correspondem ao uso do solo Urban, foram classificados como Urban uma vez que a distância dos centroides com o próprio grupo foi inferior em relação a distância com os outros grupos disponíveis (Forest e Agri). O mesmo é possivel ser observado no grupo Forest, cujos valores das distâncias no próprio grupo é pequena em relação aos outros grupos (Urban e Agri). Coclui-se que os pontos de coleta analisados foram bem classificados nos grupos em questão.

8) Aplicação do modelo unmix, equação 7 e 8 :

# Agora as propriedades ótimas de traçador seleccionadas discriminam bem, por isso proceda com a função unmix

#equação 7 data

result <- unmix(data, samples = 100L, iter =100L) data

Resultado:

> result <- unmix(data, samples = 100L, iter =100L) Summary of the model imputs:

6 variables from 3 sources ( AG PI SS ) Press [enter] to unmix your data

0% 10 20 30 40 50 60 70 80 90 100%

[----|----|----|----|----|----|----|----|----|----|

**************************************************|

Summary of the model outputs:

See below the result/s of the unmixing process using the source variability of the best 100 results, notice that the first row of the results is the central value or the average with no correction

id GOF.mean GOF.SD AG.mean AG.SD PI.mean PI.SD SS.mean SS.SD

1 42744 0.78217314 0.03598671 0.22534919 0.09415315 0.3305210 0.0960739 0.44412977 0.08828968

#Mixing model

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 124

#equação 8

samples<- inputSample(data) sources<-inputSource(data)

result2 <- unmix_c(sources, samples, trials = 100L, iter = 100L)

#Mostrar os resultados

plotResults(result, y_high = 5, n = 2) plotResults(result2, y_high = 5, n = 2) writeResults(result)

write.table(result, file='eq7.csv', sep=';', dec=',', row.names=FALSE) write.table(result2, file='eq8.csv', sep=';', dec=',', row.names=FALSE) Resultado:

Figura 8: Plotagem da análise do modelo unmixi.

Os resultados do modelo de mistura neste caso não foram bons, uma vez que não foi possível distiguir bem as fontes por apresentarem sobreposição (Figura 8). A próxima etapa será rodar todo o Script novamente, buscando ajustar melhor as variáveis que foram escolhidas previamente nas análises (KW-H, DFATest ou RangeTest), a fim de obter uma melhor discriminação das fontes nessa ultima etapa unmix.

CONSIDERAÇÕES FINAIS

O método Fingerprinting tem um grande potencial de distinguir as fontes de sedimentos e contaminação e todo o tratameto de dados acima descrito pode favorecer essa discriminação. Alguns conhecimentos em informática e matemática podem levar ao domínio da técnica, entretanto, o objetivo deste Manual foi ser o mais claro possível na aplicação desta ferramenta por qualquer pessoa interessada e sem um conhecimeto aprofundado em ambas áreas (informática/matemática). Devido à intensa atividade no entorno de ecossistemas aquáticos, cada vez torna-se mais dificultosa a tarefa de identificar a fonte dos contaminantes presentes na água e/ou sedimento, por isso, técnicas como essa podem favorecer o entendimento a respeito da dinâmica ecossistemicas em relação à entrada de poluentes.

Capítulo 8 - O método “fingerprinting”

Pompêo, M.; Moschini-Carlos, V.; López-Doval, J.C. (Orgs.) Aspectos da ecotoxicidade em ambientes aquáticos 125

No documento Aspectos da ecotoxicidade em ambientes (páginas 127-134)