SIMULAÇÕES COMPUTACIONAIS PARA REMOÇÃO DE RUÍDO DE SINAIS

Os sinais de fluorescência de indicadores potenciométricos apresentam variação de fluorescência pequena (FROMHERZ; MÜLLER, 1993; WINDISCH et al., 1995) e ao di- minuir a área da ROI, a SNR também acaba diminuindo. Isto pôde ser observado em nossos resultados experimentais (descritos na seção 3.5.2), portanto, optamos pela utilização de téc- nicas de BSS para filtrar o sinal de fluorescência. Com o objetivo de escolher uma melhor técnica de BSS para filtrar nossos dados reais, utilizamos um ambiente simulado em compu- tador.

3.4.1 Materiais e Métodos

Realizamos as simulações para testar a performance de algoritmos de BSS na ex- tração de dois tipos de sinais associados a fenômenos biológicos: um sinal de PA ventricular e um sinal degrau, representando eletroporação. A Figura 13 ilustra o diagrama de criação das observações a partir da mistura de um dos canais contendo o sinal biológico com uma série de ruídos distintos. O sinal de PA foi gerado como saída de um modelo online de PA ventricular (WILLIAMS; MIRAMS, 2015). Os parâmetros do modelo escolhidos para produzir este sinal foram: modelo de célula de ventrículo de coelho (MAHAJAN et al., 2008), 0,5Hz de frequên-

cia de estimulação, 1min máximo de estimulação e 0μM de concentração de composto. O sinal de PA foi subamostrado para coincidir com as taxas de aquisição dos experimentos com células. O sinal também foi invertido para assemelhar-se ao tipo de sinal de fluorescência obtido e deslocado no tempo para começar em 2,5s. Com isso, o sinal de PA se desenvolve na metade da duração total do canal, que é de 5s (Sinal PA azul escuro em Figura 13). O segundo sinal é um sinal do tipo degrau invertido com o objetivo de representar a situação onde a membrana celular tenha sofrido eletroporação em resposta a um pulso de campo elétrico de alta intensidade e também ocorre aos 2,5s (Sinal Degrau azul escuro em Figura 13). Com isso, em ambos os canais de sinal, temos um intervalo de inatividade (área sombreada vermelha nos sinais da Figura 13) e um intervalo de atuação dos sinais (área sombreada verde nos sinais da Figura 13). Estes intervalos diferem levemente para cada canal: para o sinal de PA, o intervalo de inatividade consiste de 0 a 2,5s e de 2,8 a 5s, consequentemente seu intervalo de atua- ção é entre 2,5 e 2,8s; para o sinal degrau, o intervalo de inatividade é de 0 a 2,5s e seu intervalo de atuação é de 2,5 a 5s.

Figura 13: Diagrama de criação das observações e recuperação dos sinais. Ruídos independentes provenientes de uma distribuição Poisson (λ=225) mostrados em vermelho são adicionados ao sinal de PA (sinal azul escuro no canto superior esquerdo) e ao sinal degrau (sinal azul escuro no canto inferior esquerdo) para a formação das observações ruidosas (sinais roxos ao centro da imagem). Essas observações são usadas como entrada para algoritmos de BSS e os sinais recuperados após eliminação das fontes com ruído são mostrados à direita da imagem. Os intervalos de inatividade e intervalos de atuação definidos para cada sinal estão indicados pelas áreas sombreadas sobre cada sinal.

Cada uma das observações (observações em roxo na Figura 13) foi gerada pela adição de um ruído distinto (ruídos em vermelho na Figura 13) proveniente de uma saída in- dependente de distribuição Poisson (número de eventos por intervalo λ=225) a um dos sinais (sinal de PA ou sinal degrau na Figura 13). O objetivo de cada ruído é simular um ruído de disparo proveniente de cada ROI. Subtraímos λ de cada ruído para chegar a um ruído com média aproximadamente nula. As observações geradas tem 340 pontos cada (npontos = 340) amostradas a 68Hz. Após a aplicação de um método de BSS, obtínhamos os sinais recuperados (Sinais Recuperados em rosa à direita na Figura 13). A potência do ruído foi aproximadamente a mesma para todas as simulações e a potência do sinal foi variada quando deseja- mos alterar a SNR. Podíamos também alterar o número n de observações e o número m de componentes permitidas no método utilizado (equivalente ao número de fontes de sinal espe- radas).

Para avaliar o sucesso de cada método, escolhemos variáveis de saída que repre- sentassem a exatidão na recuperação da amplitude do sinal (e também a exatidão na recupera- ção da forma de onda no caso do sinal de PA), isto é, quão próxima a saída está do valor real (ou da forma de onda original). A Figura 14 ilustra como foram obtidas as variáveis de saída das simulações. O erro relativo para máxima amplitude (Er_Amp) foi a escolha para medir exa- tidão na amplitude do sinal. Para o sinal PA, ele foi calculado como o erro relativo percentual das amplitudes no instante de máximo módulo do sinal PA (Figura 14A). Para o sinal degrau, ele foi calculado como o erro relativo percentual das medianas no intervalo de atuação do sinal degrau (Figura 14B). O coeficiente de correlação de Pearson (r), calculado no intervalo de atuação do sinal, foi a medida para avaliar exatidão na forma de onda (Figura 14C). Tam- bém escolhemos uma outra saída que representasse a precisão do sinal recuperado em toda a sua extensão, o que reproduz a eficiência na remoção de ruído. A raiz do erro quadrático mé- dio (root-mean-square error, RMSE) foi utilizada para medir esta precisão na remoção do ruído. Inclusive, r e RMSE são comumente utilizadas para avaliar a performance de algorit- mos de filtragem (KEEMINK et al., 2018; MIJOVIĆ et al., 2010; NG; RAVEENDRAN, 2009). A Figura 14D mostra como RMSE é calculado para o sinal PA e a Figura 14E mostra o mesmo exemplo, mas para o sinal degrau. Em ambas, os valores do sinal recuperado (Ŷ) são representados por pontos pretos e os valores sinal original (Y) são representados pela curva em azul escuro. As barras rosas representam a diferença (Ŷ – Y) utilizada para o cálculo de RMSE.

Figura 14: Gráficos ilustrando as variáveis de saída das simulações. A. Erro relativo para máxima amplitude (Er_Amp) para sinal PA. Curva azul é o sinal PA original e curva roxa é o sinal PA recuperado. B. Er_Amp para sinal degrau. Curva azul é o sinal degrau original, curva roxa é o sinal degrau recuperado e linha tracejada preta é a mediana do sinal recuperado. C. Coeficiente de correlação de Pearson (r). Gráfico de dispersão entre sinal PA original e sinal PA recuperado (pontos azuis) com relação linear mostrada pela linha tracejada preta. D. Raiz de erro quadrático médio (RMSE) de sinal PA. Curva azul é o sinal PA original (Y), pontos pretos correspondem ao sinal PA recuperado (Ŷ) e as linhas roxas correspondem às diferenças entre os sinais (Ŷ-Y). E. RMSE de sinal degrau. Mesma configuração de curvas que em D, mas com sinal degrau ao invés de PA.

Os algoritmos de BSS utilizados foram PCA e ICA, mas também uma variação de cada um deles onde aplicamos filtragem nas componentes extraídas por meio de DWT, ge- rando com isso os algoritmos wavelet-PCA (wPCA) e wICA, respectivamente. A Figura 15 ilustra os passos de cada um desses algoritmos. No momento da aplicação de um dos algoritmos de BSS, uma única componente (aquela correspondente ao sinal original) era automati- camente selecionada e as outras componentes eram consideradas ruído e anuladas (exceto em simulações onde variamos o número de componentes). Isto pôde ser feito graças ao conhecimento prévio do instante da ocorrência do sinal. Por exemplo, no caso do sinal PA, progra- mamos a seleção da componente com maior energia no intervalo de atuação do sinal PA original. Analogamente esta seleção foi feita entre as componentes do sinal degrau, mas esco-

lhendo a componente com maior módulo do somatório no intervalo de atuação do sinal degrau original.

Figura 15: Diagrama dos métodos de BSS utilizados: Análise de Componentes Principais (PCA), Análise de Componentes Principais com filtragem wavelet (wPCA), Análise de Componentes Independentes (ICA) e Análi- se de Componentes Independentes com filtragem wavelet (wICA). As observações ruidosas são utilizadas como entrada para um dos métodos (wPCA, PCA, ICA ou wICA), o qual aplica PCA ou ICA, seleciona a componente que contém o sinal de interesse (excluindo as outras fontes), aplica Transformada Discreta Wavelet (Discrete Wavelet Transform, DWT) com limiarização rígida (hard-thresholding) sobre a componente selecionada e aplica a transformada wavelet inversa (apenas wPCA e wICA), e reconstrói as observações a partir dessa componente, produzindo os sinais recuperados.

Nos algoritmos de BSS que utilizavam DWT (wPCA e wICA), foi utilizado limia- rização rígida (hard-thresholding) para filtragem e uma versão modificada de limiar (K, Donoho & Johnstone, 1994; Ng & Raveendran, 2009) foi calculada pela seguinte equação:

𝐾 = √2 ln 𝑛𝑝𝑜𝑛𝑡𝑜𝑠𝜎ℎ𝑓

onde σhf é o desvio absoluto de mediana no coeficiente de mais alta frequência (highest frequency). Foram utilizadas wavelet Meyer discreta (dmey) para o sinal PA e wave-

let Haar para o sinal degrau. Essas wavelets foram escolhidas porque, dentre as disponíveis

na toolbox utilizada, foram as que apresentaram maior correlação com o respectivo sinal ori- ginal de interesse (PA e degrau). Cada sinal recuperado teve sua linha de base deslocada para zero pela subtração da mediana obtida dos intervalos de inatividade, isto é, para cada sinal PA

recuperado a mediana obtida antes de 2.5s e após 2.8s era subtraída do sinal, e para o sinal degrau a mediana obtida antes de 2.5s era subtraída do sinal. Para termos uma referência comum na comparação da melhora na recuperação por cada método de BSS, medimos variáveis de saída diretamente das observações ruidosas, sem filtragem.

Exploramos a influência de três parâmetros nas saídas de cada método: m, n e SNR. Os valores padrão para estes parâmetros foram definidos como: m = 1, n = 30 e SNR = - 10dB. O valor mínimo permitido de m pelos métodos de BSS é 2, então definimos m = 1 quando configuramos os métodos para m = 2 e então anulamos a componente contendo ruído. A princípio, variamos m de 1 até 30 (de 1 a 10 em passos unitários e de 10 a 30 em passos de 5) enquanto mantivemos os outros parâmetros nos valores padrão. Como ressaltado anterior- mente, apenas nas simulações em que variamos m, não deletamos as outras componentes an- tes da reconstrução dos sinais, exceto para m = 1. Então, variamos n de 2 até 60 (de 2 até 10 em passos de 2, e de 10 a 60 em passos de 10). Por último, variamos SNR de -20dB até 20dB (de -20dB até -15dB e de 5dB até 20dB em passos de 5dB, e na faixa mais central de -15dB a 5dB em passos de 2.5dB) por meio da variação da potência do sinal enquanto mantivemos a potência dos ruídos constante. Manter a potência dos ruídos constantes em todas as simula- ções nos permite comparar diretamente RMSE sem necessidade de normalização.

Uma única simulação gera uma quantidade de saídas (Er_Amp e RMSE) igual ao número de observações, exceto para r, o qual resulta no mesmo valor para todas as observa- ções por simulação uma vez que os sinais extraídos possuem a mesma forma de onda, apenas com diferentes modulações. As simulações foram executadas a quantidade necessária de ve- zes para gerar N=120 saídas (exceto para r, onde N=12). É importante enfatizar que, apesar da potência do ruído ter sido mantida aproximadamente constante dentro de uma mesma simula- ção, a distribuição do ruído para cada observação foi sempre distinta, representando um ruído distinto proveniente de diferentes ROIs.

Além dessas simulações para extrair o sinal de ruído de disparo, analisamos tam- bém a influência da remoção de desbotamento (photobleaching, Pb) por meio de simulações semelhantes, mas, junto com a adição do ruído de disparo, adicionamos uma função exponencial padrão, cuja equação é mostrada abaixo:

𝑃𝑏(𝑡) = 𝐴𝑒−𝐵𝑡_{+ 𝐷}

onde os parâmetros A, B e D foram produzidos aleatoriamente a partir de uma distribuição Gaussiana para cada observação. Os parâmetros dessa distribuição foram μg=300 e σg=30 para A, μg=0.5 e σg=0.05 para B e μg=1000 e σg=100 para D. Esses valores foram escolhidos pois compreendem resultados experimentais (mostrados na seção 3.5.2).

Como um método comum para compensar o desbotamento, nós implementamos ajuste de curvas usando a mesma função exponencial da equação (5), mas fornecendo como entrada dados das observações nos instantes de inatividade do sinal PA. Definimos essa abor- dagem como Correção de Desbotamento com Emenda Dupla (Double Bind Photobleaching

Correction, DBPC), pois nesse caso fornecemos dados das duas extremidades do canal. Como

há trabalhos que estimam o desbotamento a partir de dados apenas antes do sinal de interesse (TOGO et al., 1999), também exploramos essa opção, fornecendo como entrada dados das observações apenas antes de 2,5s, e definimos esta abordagem aqui como Correção de Desbo- tamento com Emenda Simples (Single Bind Photobleaching Correction, SBPC). Uma terceira opção é fornecer como entrada a totalidade das observações e modelar o desbotamento junta- mente com o sinal, o que dispensaria o uso de BSS. Entretanto, isto requer conhecimento pré- vio da forma de onda do sinal e de uma função que possa representá-lo. Tal tarefa é complexa para o sinal PA porque sua forma de onda pode variar bastante em amostras reais e ela neces- sitaria de vários parâmetros para ser descrita por uma função, o que aumentaria muito a com- plexidade do ajuste de curvas, consequentemente diminuindo a chance de convergência do resultado. Por outro lado, para formas de onda mais simples como um deslocamento de amplitude, a sua inclusão no ajuste de curvas poderia, em teoria, melhorar a correção de desbotamento, além de poder dispensar o uso de outras técnicas de extração como BSS. Exploramos esta opção nas observações com o sinal degrau, incluindo o degrau no ajuste de curvas através da equação abaixo:

𝑃𝑏(𝑡) = 𝐴𝑒−𝐵𝑡_{+ 𝐷 − 𝐸𝑢(𝑡 − 2.5)}

onde A, B e D são os mesmos parâmetros de (5) e E é a amplitude do degrau des- locado no tempo u(t - 2.5) a ser estimada pelo ajuste de curvas. Definimos esta terceira corre- ção como Correção de Desbotamento Completa (Full Data Photobleaching Correction, FDPC).

Comparamos a performance de cada correção de desbotamento por meio da medi- da do erro relativo dos parâmetros A, B e D da equação (5) e realizamos teste t para média de uma amostra em relação à média hipotética nula (erro relativo nulo significa que o parâmetro estimado é igual ao parâmetro original). Complementarmente, avaliamos o impacto de cada correção sobre as saídas dos algoritmos de BSS (Er_Amp e RMSE), aplicando análise de vari- ância dois fatores (two-way), os quais neste caso foram método de correção de desbotamento (Sem exponencial (referência), SBPC, DBPC e FDPC) e método de BSS (PCA, ICA, wPCA e wICA), com pós-teste de Bonferroni. Estas simulações com desbotamento e BSS foram feitas utilizando os valores padrão dos parâmetros de BSS: m = 1, n = 30 e SNR = -10dB. Por últi-

mo, realizamos teste t de uma amostra para a saída Er_Amp de FDPC obtido diretamente pela estimativa do parâmetro E da equação (6). Para os testes estatísticos, consideramos P<0,05 como indicativo de diferença estatística significativa.

Os códigos para as simulações foram desenvolvidos em Python 3.6.4, usando as bibliotecas Numpy 1.14, SciPy 1.0 e Matplotlib 2.1.2, além da toolbox scikit-learn 0.19.1. Ajuste de curvas foi implementado com a função SciPy curve_fit. PCA e ICA foram imple- mentados usando as funções PCA e fastICA (PEDREGOSA et al., 2011), respectivamente. DWT foi calculada com a toolbox PyWavelets 0.5.2 (LEE et al., 2006).

3.4.2 Resultados

Apresentamos na Figura 16 as saídas RMSE, r e Er_Amp em função de m para ob- servações sem filtragem (estrelas cinzas) e para os métodos PCA (quadrados vermelhos), ICA (círculos azuis), wPCA (triângulos laranjas) e wICA (triângulos invertidos verdes). Na Figura 16A mostramos RMSE para o sinal PA e na Figura 16B mostramos RMSE para o sinal de- grau. Na Figura 16C mostramos r para o sinal PA, e nas Figura 16D e Figura 16E mostramos Er_Amp para o sinal PA e o sinal degrau, respectivamente. Áreas sombreadas representam erros padrão das médias.

Na Figura 17, apresentamos as mesmas saídas em função de n para o sinal sem fil- tragem e após passar pelos 4 métodos de BSS (os símbolos e cores são os mesmos da Figura 16). Nas Figura 17A e Figura 17B mostramos RMSE para o sinal PA e para o sinal degrau, respectivamente. Na Figura 17C mostramos r para o sinal PA, e nas Figura 17D e Figura 17E mostramos Er_Amp para o sinal PA e para o sinal degrau, respectivamente. Áreas sombreadas representam erros padrão das médias.

Figura 16: Saídas das simulações em relação ao número de componentes (de 1 a 30) para dados sem filtragem (linha contínua cinza com estrelas cinzas), PCA (linha tracejada vermelha com quadrados vermelhos), ICA (linha tracejada azul com círculos azuis), wPCA (linha ponto-tracejada laranja com triângulos laranjas) e wICA (linha ponto-tracejada verde com triângulos invertidos verdes). Regiões sombreadas representam erros padrão das médias. A. RMSE de sinal PA. B. RMSE de sinal degrau. C. r de sinal PA. D. Er_Amp de sinal PA. E. Er_Amp de sinal degrau.

Figura 17: Saídas das simulações em relação ao número de observações (de 2 a 60) para dados sem filtragem (linha contínua cinza com estrelas cinzas), PCA (linha tracejada vermelha com quadrados vermelhos), ICA (linha tracejada azul com círculos azuis), wPCA (linha ponto-tracejada laranja com triângulos laranjas) e wICA (linha ponto-tracejada verde com triângulos invertidos verdes). Regiões sombreadas representam erros padrão das médias. A. RMSE de sinal PA. B. RMSE de sinal degrau. C. r de sinal PA. D. Er_Amp de sinal PA. E. Er_Amp de sinal degrau.

Exibimos na Figura 18A um exemplo de sinal de PA com ruído (SNR = -10dB, linha contínua cinza), o mesmo sinal de PA sem ruído (linha contínua preta), e os sinais recuperados por cada método (linhas tracejadas coloridas). Cada sinal foi deslocado temporalmente para melhor visualização e cada instante de início do intervalo de atuação do sinal está indicado por uma seta de mesmo estilo e cor do sinal correspondente. Exibimos na Figura 18B um exemplo de sinal degrau com ruído (SNR = -10dB, linha contínua cinza), o mesmo sinal degrau sem ruído (linha contínua preta), e os sinais recuperados por cada método (linhas tracejadas coloridas). Neste caso, cada sinal foi deslocado em amplitude para melhor visualização e a linha de base do sinal deslocado é indicada por uma seta de mesmo estilo e cor do sinal correspondente.

Na Figura 19 apresentamos as saídas dos métodos em função de SNR. Nas Figura 19A e Figura 19B mostramos RMSE para o sinal PA e para o sinal degrau, respectivamente. Na Figura 19C mostramos r para o sinal PA, e nas Figura 19D e Figura 19E mostramos Er_Amp para o sinal PA e para o sinal degrau, respectivamente. Áreas sombreadas representam erros padrão das médias.

Figura 18: Exemplos de sinais recuperados. A. Exemplo de sinal de PA original (curva preta), com ruído (curva cinza, Relação Sinal-Ruído, Signal-to-Noise Ratio, SNR = -10dB), e dos sinais recuperados por cada método. Os sinais foram deslocados no tempo para melhor visualização. As setas indicam o instante de início do período de atuação dos sinais. B. Exemplo de sinal degrau original (curva preta), com ruído (curva cinza, SNR = -10dB), e dos sinais recuperados pelos métodos. Os sinais foram deslocados em amplitude para melhor visualização. As setas indicam a linha de base de cada sinal.

Figura 19: Saídas das simulações em relação à SNR (SNR, de -20 a 20dB) para dados sem filtragem (linha con- tínua cinza com estrelas cinzas), PCA (linha tracejada vermelha com quadrados vermelhos), ICA (linha tracejada azul com círculos azuis), wPCA (linha ponto-tracejada laranja com triângulos laranjas) e wICA (linha ponto- tracejada verde com triângulos invertidos verdes). Regiões sombreadas representam erros padrão das médias. A. RMSE de sinal PA. B. RMSE de sinal degrau. C. r de sinal PA. D. Er_Amp de sinal PA. E. Er_Amp de sinal degrau.

Na Figura 20A nós mostramos um exemplo de correção de desbotamento para observação do sinal de PA: alguns pontos (azul-escuros e vermelho-escuros) do sinal ruidoso (linha contínua cinza) são fornecidos como entrada para o ajuste de curvas. A linha contínua preta é a função exponencial original, a linha tracejada azul-claro representa o melhor ajuste, utilizando a equação (5), quando são fornecidos como entrada os pontos azul-escuros e vermelho-escuros (DBPC) e a linha tracejada vermelha é o melhor ajuste, também utilizando a equação (5), quando são fornecidos como entrada apenas os pontos vermelho-escuros (SBPC). Neste caso não há FDPC, pois não modelamos a função do PA. Na Figura 20B mostramos um exemplo da correção de desbotamento para observação do sinal degrau. A linha contínua cinza é uma observação ruidosa, a linha contínua preta é a função exponencial original, a linha tracejada vermelha representa o melhor ajuste, utilizando a equação (5), quando são fornecidos como entrada os pontos vermelho-escuros (SBPC) e a linha tracejada verde representa o melhor ajuste, utilizando a equação (6), quando são fornecidos como entrada todos os pontos da curva cinza (FDPC). Neste caso, não há DBPC porque fornecer pontos após a variação de amplitude do degrau, isto é, fornecer pontos dentro do intervalo de atuação do sinal, sem levar o deslocamento de amplitude em consideração na equação de modelamento resultaria em ajuste errôneo.

Na Figura 21 mostramos os desempenhos de cada correção de desbotamento por meio do erro relativo (barras) e erros padrão das médias (linhas acima das barras) dos parâmetros de ajuste de curvas A, B e D estimados a partir das equações (5) e (6). A equação (5) foi utilizada para SBPC e DBPC e a equação (6) só foi utilizada para FDPC. Tralhas sobre as barras indicam diferença estatística significativa de média hipotética nula.

Figura 20: Exemplos de correções de desbotamento. A. Exemplo de correções de desbotamento para sinal de PA. Função exponencial original representando desbotamento (curva preta), sinal de PA com desbotamento e ruído (curva cinza), dados de entrada para Correção de Desbotamento com Emenda Única (Single Bind Photoblea- ching Correction, SBPC, pontos vermelhos-escuros), resultado de SBPC (curva ponto-tracejada vermelha), da- dos de entrada para Correção de Desbotamento com Emenda Dupla (Double Bind Photobleaching Correction, DBPC, pontos vermelhos-escuros mais pontos azuis) e resultado de DBPC (curva tracejada azul-clara). B. Exemplo de correções de desbotamento para sinal degrau. Função exponencial original representando desbotamento (curva preta), sinal degrau com desbotamento e ruído (curva cinza), dados de entrada para SBPC (pontos vermelhos-escuros), resultado de SBPC (curva ponto-tracejada vermelha) e resultados de Correção de Desbota- mento com Completa (Full Data Photobleaching Correction, FDPC, curva tracejada verde).

Figura 21: Desempenho das correções de desbotamento. Erros relativos dos parâmetros da função exponencial (A em branco, B em cinza e D em preto) resultantes de cada correção. Barras representam médias e linhas verti- cais são erros padrão das médias. # indicam diferença estatística significativa de média nula (teste t para média de uma amostra). SBPC (Parâmetro A: P=0,034; t=2,14; DF=119; tamanho de efeito=0,20; poder estatísti-

No documento Estudo do dano e recuperação de cardiomiócitos isolados causado por campo elétrico (páginas 51-72)