• Nenhum resultado encontrado

Pr ´e-processamento e estimac¸ ˜ao do espetro

Dados e metodologias utilizados

3.3 Pr ´e-processamento e estimac¸ ˜ao do espetro

Com vista a implementar determinadas m ´etricas no dominio da frqu ˆencia, que ser ˜ao de-pois detalhadas na secc¸ ˜ao seguinte, registos de som foram preprocessados como sugerido por Adhi Pramono e colaboradores (Adhi Pramono et al., 2019). O primeiro passo foi uma normalizac¸ ˜ao em amplitude para o intervalo -1 a 1. Tendo em considerac¸ ˜ao as frequ ˆencias nas quais a informac¸ ˜ao da tosse ´e encontrada, os ´audios normalizados foram filtrados com recurso a um filtro Butterworth de 5ª ordem com 70 Hz e 3500 Hz como valores de corte para as baixas e altas frequ ˆencias, respetivamente. Os epis ´odios de interesse (identifica-dos de acordo com o m ´etodo descrito na secc¸ ˜ao3.2) foram alvo de um downsampling de um factor 1

6, passando a frequ ˆencia de amostragem de 48000 amostras por segundo para 8000 amostras por segundo. Os espetros para cada epis ´odio usando o m ´etodo de Welch, utilizando uma janela de Blackman com tamanho igual a 1

8 do comprimento do sinal e sem sobreposic¸ ˜ao.

3.4 M ´etricas

Tal como foi referido anteriormente diversos autores utilizaram abordagens e features distintas para caraterizar os eventos e classific ´a-los como tosse e n ˜ao tosse. No ˆambito deste trabalho foi elaborada uma lista de m ´etricas a implementar, baseda na revis ˜ao da literatura efetuada (Matos et al., 2006), (Swarnkar et al., 2013), (Amrulloh et al., 2015), (Pramono et al.,2016). Sendo imposs´ıvel considerar todas as m ´etricas, e suas variac¸ ˜oes, propostas na literatura, foi decidido considerar para este estudo explorat ´orio as m ´etricas propostas por Promono e co-autores. Assim foram incluidas as m ´etricas que no artigo de Pramono e colaboradores Pramono et al., 2016 foram consideradas preditores no modelo de regress ˜ao log´ıstica para classificac¸ ˜ao de tosse e as m ´etricas espectrais propostas por Pramono e colaboradores (Adhi Pramono et al.,2019).

Considere-se um sinalx(t),S(ω)o espectro dex,X[n]a estimativa da densidade espetral para o binne, por ´ultimo, ef[n]o eixo de frequ ˆencias. A seguir apresenta-se uma lista das m ´etricas selecionadas

Coeficientes Mel-Ceptrais (Mel Frequency Cepstral Coefficients, MFCC’s): Es-tes coeficienEs-tes cn surgem na transformac¸ ˜ao que permite obter o complex cepstrum, definido como o logaritmo da transformada de Fourier do espetro de um sinal, como indicado na equac¸ ˜ao3.4.1.

SejaL(m)o logaritmo da energia da frequ ˆencia Mel,c, obtida por aplicac¸ ˜ao do banco de filtros correspondente `a Escala Mel, os MFCC’s ({c0, c1, ..., c13},) podem ser obtidos numa janela de sinal utilizando a equac¸ ˜ao3.4.2

FCUP 19 An ´alise autom ´atica de tosse adquirida por smartphone

cn =

Os MFCC’s s ˜ao uma representac¸ ˜ao compacta das propriedades ac ´usticas das vias a ´ereas superiores, permitindo separar as contribuic¸ ˜oes resultantes da geometria das vias a ´ereas das da fonte de vibrac¸ ˜ao ac ´ustica. Os MFCC’s surgiram primeiramente como m ´etrica associada ao reconhecimento da fala (Patel & Rao, 2010), tendo sido tamb ´em associados ao processamento de outros sinais de sonoros, incluindo o som do ressonar e da tosse (Amrulloh et al.,2015). Duas das suas principais aplicac¸ ˜oes s ˜ao os sistemas de reconhecimento de voz como, por exemplo, n ´umeros falados atrav ´es de um telem ´ovel, e ainda, classificac¸ ˜ao do g ´enero musical.

Fator de Crista (Crest Factor, CF):Esta m ´etrica ´e definida como sendo a raz ˜ao entre o valor um m ´aximo de amplitude do sinal (pico), xpeak e a m ´edia quadr ´adica (RMS)1, xRM S. Este fator ´e uma medida da intensidade dos picos detetados no sinal dada pela express ˜ao3.4.3.

CF = xpeak xRM S

(3.4.3)

Coeficiente de achatamento (Spectral Flatness, SF): O Coeficiente de achata-mento, tamb ´em denominado por entropia de Wiener, tal como o pr ´oprio nome indica

´e uma medida que caracteriza o espetro do ´audio nomeadamente o qu ˜ao similar a ru´ıdo ´e o sinal de interesse. Esta comparac¸ ˜ao ´e feita atrav ´es da raz ˜ao entre as m ´edias geom ´etrica e aritm ´etica do sinal, tal como indicado na equac¸ ˜ao3.4.4

1do ingl ˆes,Root Mean Square

SF = e(

O coeficiente de achatamento ´e limitado superiormente por um valor muito pr ´oximo de 1, coeficiente de achatamento do ru´ıdo branco.

Energia de Banda (Band Power, BP): A energia de banda ´e a energia m ´edia do sinal numa determinada banda de frequ ˆencias. Esta energia ´e calculada integrando a estimava da densidade espetral atrav ´es do m ´etodo do ret ˆangulo.

Roll-Off Espetral (Spectral Roll-Off, SRO): O Roll-Off Espetral ´e o ponto do sinal no qual se concentra uma determinada percentagem de energia, normalmente fixada entre85%e95%. Esta m ´etrica ´e especialmente ´util para distinguir sons com diferentes distribuic¸ ˜oes de energia. No caso da tosse, a maior parte da energia encontra-se concentrada nas frequ ˆencias mais baixas do espetro (Amrulloh et al.,2015).

Frequ ˆencia M ´axima ou Frequ ˆencia Dominante (Dominant/Maximum Frequency, MaxF):A Frequ ˆencia M ´axima ou Frequ ˆencia Dominante ´e o valor da frequ ˆencia para o qual a energia do sinal ´e m ´axima.

Desvio Padr ˜ao Espetral (Spectral Standard Deviation, SSD):O desvio padr ˜ao es-petral ´e o desvio padr ˜ao da densidade eses-petral.

Curtose Espectral (Spectral Kurtosis Coefficient, SKC): A curtose espetral ´e uma medida do pico do densidade espetral. Curtoses elevadas indicam uma distribuic¸ ˜ao (de probabilidade) de energia com caudas muitas pesadas, ou seja, uma maior dis-pers ˜ao relativamente ao eixo de frequ ˆencias. Paraµo primeiro momento central eσ o desvio padr ˜ao, esta m ´etrica ´e definida pela equac¸ ˜ao3.4.5

FCUP 21 An ´alise autom ´atica de tosse adquirida por smartphone

SKC=

E(x−µ) δ

4

(3.4.5)

Declive Espetral (Spectral Slope, SSl):O declive espetral mede o decrescimento do declive do espetro. Esta m ´etrica indica a velocidade (de decrescimento) da energia nas altas frequ ˆencias e ´e dada pela express ˜ao3.4.6

SSl= 1

Para a extrac¸ ˜ao das m ´etricas adicionais baseadas no espetro sugeridas por Pramono e colaboradores (Adhi Pramono et al.,2019) definem-se duas bandas de frequ ˆencia :

B-01, correspondendo `a banda entre a frequ ˆencia fundamental (frequ ˆencia mais baixa de um sinal peri ´odico), F0, e o harm ´onico seguinte, F1.

B-HFde 2,5 a 3kHz.

F0 ´e definida como a frequ ˆencia correspondente ao m ´aximo no espectro e F1 ´e a frequ ˆencia do valor m ´aximo numa vizinhanc¸a de 5 amostras centrada em 2*F0.

Utilizando estas bandas foram implementadas 3 m ´etricas adicionais (Adhi Pramono et al., 2019)

Raz ˜ao de alta frequ ˆencia na banda B-HF, HFMax: Esta m ´etrica ´e definida como a raz ˜ao entre a mediana do conte ´udo de alta frequ `encia do espetro, S(f), e o valor m ´aximo do mesmo (equac¸ ˜ao3.4.7)

HF M axratio = mediana(S(f)f∈B−HF)

max(S(f)f∈B−01) (3.4.7)

Raz ˜ao M´ınimo-M ´aximo na banda B-01, MinMax:Tal como o nome indica esta m ´etrica

´e a raz ˜ao entre o valores m´ınimo e m ´aximo do espetro na banda de frequ ˆencias B-O1

M inM axratio= min(S(f)f∈B−01)

max(S(f)f∈B−01) (3.4.8)

Raz ˜ao do quantil 25 na banda de frequ ˆencias B-01, LQMax: A terceira e ´ultima m ´etrica a ser implementada foi calculadada atrav ´es da express ˜ao3.4.9. Esta m ´etrica

´e a raz ˜ao entre a mediana dos valores do espectro no primeiro quartil, LQ, e o valor m ´aximo do espetro

LQM axratio = mediana(Q25(S(f)f∈B−01))

max(S(f)f∈B−01) (3.4.9)

Uma vez que a implementac¸ ˜ao foi efetuada com recurso ao MATLAB R2021a, os c ´alculos e estimac¸ ˜oes das m ´etricas utilizaram sempre que poss´ıvel, func¸ ˜oes j ´a dispon´ıveis neste software. Assim:

MFCC’s -Para calcular os coeficientes recorremos `a func¸ ˜aomfccda toolbox de ´audio tendo como argumentos de entrada o vetor de amplitudes do segmento de som cor-respondente ao evento e a frequ ˆencia de amostragem fs; foram ainda definidos o par ˆametros"LogEnergy"com o valor"ignore"e"Window"com o valor,

hamming(length(evento),de forma a calcular os MFCC’s para o segmento (evento) completo.

FCUP 23 An ´alise autom ´atica de tosse adquirida por smartphone

Factor de Crista - No caso do fator de crista utilizou-se a func¸ ˜ao peak2rms tamb ´em da toolbox de ´audio com o vetor de amplitudes do segmento de som como ´unico argu-mento.

Coeficiente de achatamento -Para este c ´alculo usamos a func¸ ˜aospectralFlatness com os seguintes argumentos: vetor de amplitudes do segmento de som, a frequ ˆencia de amostragem, fs e o par ˆametro "Window" com o valor rectwin(length(evento), de forma a calcular o coeficiente de achatamento para o segmento completo sem filtragens adicionais.

Energia de Banda - Esta m ´etrica foi c ´alculada com recurso `a func¸ ˜aobandpower, no entanto, um dos argumentos da func¸ ˜ao ´e uma estimativa da func¸ ˜ao densidade espetral (PSD)2, estimativa esta que pode ser obtida atrav ´es da func¸ ˜aoperiodogramna qual os argumentos s ˜ao o eps´odio de tosse, rectwin(length(evento), ou seja o segmento completo sem amaciamento e, por ´ultimo a frequ ˆencia de amostragem,fs. Voltando `a func¸ ˜ao bandpower, os seus argumentos s ˜ao a estimativa referida anteriormente, Pxx, o eixo de frequ ˆencias,f (que ´e um dos poss´ıveis outputs da func¸ ˜aoperidiogram) e o par ˆametro’psd’.

Roll-Off Espetral - Para a implementac¸ ˜ao do Roll-Off Espectral recorreu-se `a func¸ ˜ao spectralRolloffPoint em que os argumentos s ˜ao o vetor de amplitudes do seg-mento de som, a frequ ˆencia de amostragem,fs e o par ˆametro "Window"com o valor rectwin(length(evento)), como nos casos anteriores.

Frequ ˆencia M ´axima -Esta m ´etrica foi implementada utilizando simplesmente a func¸ ˜ao max aplicada ao vetor de amplitudes do segmento de som, com dois par ˆametros de sa´ıda, que permite aceder ao ´ındice onde o valor m ´aximo ´e atingido

Desvio Padr ˜ao Espetral - O c ´alculo desta m ´etrica foi feito recorrendo `a func¸ ˜ao std aplicada `a func¸ ˜ao densidade espectral,Pxx, obtida pelo m ´etodo do periodograma.

Curtose Espectral - No caso da curtose espetral exite uma func¸ ˜ao em MATLAB cha-mada spectralKurtosis que tem como argumentos o vetor de amplitudes do

seg-2do ingl ˆes,Power Spectral Density

mento de som, a frequ ˆencia de amostragem,fs e o par ˆametro "Window"com o valor rectwin(length(evento), como nos casos anteriores.

Declive espectral - Utilizando a func¸ ˜ao spetralSlope tal como todas as outras da Toolbox de ´Audio com os argumentos vetor de amplitudes do segmento de som, a frequ ˆencia de amostragem,fse o par ˆametro"Window"com o valor

rectwin(length(evento), podemos calcular o declive espetral

Documentos relacionados