• Nenhum resultado encontrado

2.3 Métodos Numéricos em Ecologia

2.3.1 Diversidade Biológica

As medidas de semelhança ecológica são, em essência, métricas ou semi-métricas de distância utilizadas para capturar e quantificar um conceito epistemologicamente com- plexo: o de diversidade biológica. A ideia de diversidade biológica, ou biodiversidade, agrega definições frequentemente herméticas (SECRETARIAT, 1992), e sutilmente di- ferentes a cada hierarquia biológica apreciada (genes, espécies, ecossistemas) (PARRIS, 1996), porém, pode ser genérica e satisfatoriamente compreendida, simplesmente, como a variedade de elementos intra- e inter- sistemas. Ainda que sintética, essa definição retém profundo significado, cujas implicações motivam e justificam incontáveis estu- dos nas ciências da vida, desde os fundamentos mais primordiais da evolução biológica (DARWIN, 2003) até os aspectos mais pragmáticos apreciados pela biologia da conser- vação (HOBBS; HUENNEKE, 1992).

A diversidade biológica é tradicionalmente expressa e explorada através de uma rela- ção ternária simples (WHITTAKER, 1960), porém bastante significativa, cuja expressão matemática pode ser formalizada através de uma relação aditiva (γ = α + β) ou multipli- cativa (γ = α . β)(JOST, 2007). Nestas relações,α representa as propriedades (i.e. diversi- dade) individuais de cada ecossistema;γ indica a diversidade global, calculada a partir da união dos sistemas; e β corresponde à diversidade residual gerada pelas diferenças entre sistemas distintos. Embora a literatura registre uma profusão de formulações matemáti- cas possíveis para cada um desses três conceitos (KOLEFF; GASTON; LENNON, 2003; MORRIS et al., 2014), a escolha sobre qual utilizar dependerá, essencialmente, das con- vicções do pesquisador sobre como sopesar pontos intrínsecos do experimento, como o impacto da dupla-ausência (i.e. ausência simultânea do elemento em todos os sistemas comparados) e a importância relativa dos elementos raros ou abundantes nos cálculos finais (LEGENDRE; GALLAGHER, 2001).

Capítulo 3

Trabalhos relacionados & Problemática

3.1

Trabalhos relacionados

3.1.1

Usos do método

Desde sua concepção, o paradigma da diversidade citométrica sensu Li (1997) tem sido explorado e expandido por diversos trabalhos, sob diversas perspectivas. Em suas primeiras aplicações, a abordagem foi capaz de descrever como a diversidade citométrica α do fitoplânction marinho, de regiões do Oceano Atlântico Norte, conecta-se à caracte- rísticas fisiológicas e tendências espaço-temporais daquele grupo (LI, 1997; LI, 2002).

Posteriormente, novos trabalhos demonstraram a influência de fatores ambientais, morfofisiológicos e moleculares na diversidade citométrica de distintos grupos de micro- organismos aquáticos. Notadamente, Quiroga et al. (2017) correlacionaram a diversidade citométrica β do bacterioplâncton de turfeiras argentinas com suas estruturas morfofi- siológicas, enquanto Segovia et al. (2018) foram capazes de demonstrar os efeitos da predação exercida por microcrustáceos na equitatividade citométrica (J’) de bactérias.

Sob outras perspectivas, García et al. (2015) e Props et al. (2016), analisaram como a diversidade citométrica de alguns grupos bacterianos correlaciona-se com suas sequências do gene 16S rRNA.

3.1.2

Implementações

Conforme o método da diversidade citométrica vinha sido aplicado, investigadores o expandiam e implementavam, apresentando novos desenhos da abordagem ao longo dos anos subsequentes ao seu primeiro uso.

A primeira implementação do método fez-se por Ribalet (2012), através do software cytoDiv, uma ferramenta em linguagem R com as diretrizes de análise básicas propostas por Li (1997). Ribalet (2012) manteve-se estritamente fiel à abordagem original, ofere- cendo uma estratégia que retornava os índices citométricos α (i.e. índices de Shannon- Wiener, Simpson, recíproco de Simpson e Pielou) com base em citogramas bivariados. Contudo, propôs inovações importantes, ao flexibilizar a resolução do gradeamento apli- cado - permitindo o uso de outros esquemas de gradeamento, além do seminal 16x16 bins - e utilizar estimativas de densidade Kernel (EDK) para a categorização dos dados.

Em sequência, Wanderley et al. (2015), com o software flowDiv1, e Props et al. (2016), com o PhenoFlow, foram os primeiros a incorporar o cálculo da diversidade β ao processa- mento de citogramas, além de permitirem a análise simultânea de mais de duas dimensões por citograma.

3.2

Problemática

A concepção de metodologias que harmonizem a racionalidade matemática com a epistemologia biológica - pontos-chaves a qualquer estratégia de análise válida e potenci- almente bem sucedida em CMF - são, atualmente, pontos de intensa pesquisa (AGHAE- EPOUR et al., 2013; KOCH et al., 2014).

A estratégia da DC em particular, conquanto venha sendo progressivamente aprimo- rada, ainda possui lacunas críticas à sua consolidação: lacunas essas tanto operacionais (em termos de implementação) quanto epistemológicas (no tocante à interpretação de suas saídas numéricas). Abaixo, oferecemos um breve entendimento desses cenários.

3.2.1

Lacunas operacionais

Tradicionalmente, as aplicações da DC vem se dedicando à recuperação de informa- ções em espaços de baixas dimensionalidades (invariavelmente, duas dimensões), utili- zando resoluções empíricas de gradeamento (e.g. 23x23 ou 28x28 bins). Tal estratégia, embora satisfatória em muitos cenários (LI, 2002; QUIROGA et al., 2017), possui a ca- racterística imanente de limitar o escrutínio otimizado de informações de citogramas, ora por não conseguir administrar ensaios citométricos mutidimensionais, ora por não permi- tir um controle mais formal das resoluções de gradeamento.

A esse contexto, soma-se a dificuldade de integrar e comparar, em uma mesma análise, citogramas adquiridos sob diferentes protocolos analíticos. Esse cenário, notadamente, tange aos aspectos das correções de perspectivas ou estabilização das variância dos dados (AZAD; RAJWA; POTHEN, 2016).

3.2.2

Lacunas epistemológicas

As primeiras aplicações da DC concentraram-se do detalhamento das características individuais do citogramas (i.e. suas diversidades α). Essa abordagem, construída sobre as propriedades inerentes das categorias (i.e.bins), naturalmente invoca perguntas sobre as semelhanças compartilhadas (ou, de forma equivalente, suas diferenças) entres os ci- togramas e como esses bins, isolada ou conjuntamente, contribuem para as propriedades dos citogramas.

Outro ponto central concerne aos efeitos de algumas variáveis latentes, em particular variáveis ecológicas, nas propriedades citométricas de comunidades microbianas. Esse ponto pode ser capturado no seguinte silogismo:

3.2. PROBLEMÁTICA 15

• A DC é capaz de capturar e representar diferenças morfofisiológicas de algumas comunidades microbianas;

• Algumas variáveis físico-químicas influenciam, de forma quantificável, a composi- ção de certos grupos microbianos;

• Algumas variáveis físico-químicas são capazes de influenciar, de forma quantificá- vel, a DC de certos grupos microbianos.

Esse raciocínio, embora de simples concepção, carece de ampla constatação, uma vez que exige não apenas uma padronização metodológica (para fins de comparação), mas também um conjunto de dados suficientemente amplo (para fins de generalização).

Capítulo 4

Implementação

O flowDiv, acrônimo em inglês para "flow cytometric diversity", é uma pipeline de- senvolvida em linguagem R (v. 3.3.2) especificamente projetada para análise de dados de citometria de fluxo ambiental. Essa implementação consubstancia-se em 19 etapas de processamento e 11 estágios de orientação decisão.

Neste capítulo, oferecemos uma visão geral e sequencial do algoritmo. As informa- ções pormenorizadas podem ser consultadas no Apêndice A, seção A.1, deste trabalho.

4.1

Importação e processamento

As primeiras etapas do flowDiv consistem na importação e processamento das regiões citométricas de interesse (i.e. gates ou janelas), a partir de espaços de trabalho (workspa- ces) do software FlowJo® ou de objetos nativos do R (i.e. GatingSets). Aqui o analista define quais regiões, grupos de citogramas e canais comporão a análise de diversidade citométrica.

Nessa fase, o algoritmo estabiliza as médias e as variâncias dos citogramas (Figura 4.1), visando a uma correção de perspectivas (cf. Capítulo 3) e também define o domínio da análise dos dados (i.e. o intervalo de valores que contemplarão as análises). A estabiliza- ção da média é realizada por meio de uma transformação de translação, na qual se usa o valor médio de regiões citométricas de referência como ponto de ancoragem.

O deslocamento 4d aplicado a cada citograma é da seguinte forma:

4di j =

1jbi j

n − bi j (4.1)

Onde bi j representa a média aritmética da região de referência (comumente beads) do

canal i, citograma j, e n corresponde ao número absoluto de amostras.

Em sequência, a variância é estabilizada com a aplicação da função arco seno hiperbó- lico (AZAD; RAJWA; POTHEN, 2016) a cada um dos canais de fluorescência, de acordo com a seguinte fórmula:

T( fi) = asinh( fi/ci) (4.2)

(a) (b)

(c) (d)

Figura 4.1: Estabilização das médias entre os citogramas. Para quaisquer citogramas (a) e (b), os valores médios das regiões citométricas de referência (interseções das cruzes pontilhadas) são usados como ponto de ancoragem para a transformação de translação dos dados e geração do arquivo final (d). As variâncias são estabilizadas a posteriori por meio da aplicação da função arco seno hiperbólico aos dados (não mostrado).

Documentos relacionados