• Nenhum resultado encontrado

4.4 Avaliação:

4.4.3 Recall:

Recallou sensitivity [49] é a métrica que relaciona o número de elementos positivos corretamente previstos com o número total de elementos positivos. Traduz-se na equação seguinte, onde o número de positivos verdadeiros é divido pelo número de elementos que deviam ser parte daquela classe.

recall= T P

T P+ FN (4.4)

onde:

26 Conceitos de aprendizagem computacional

FN é a quantidade de falsos negativos False Negatives

4.4.4 F1-Score:

A métrica F1-score [49] é uma média harmónica entre precision e recall sendo que o melhor corresponde a 1.0 e o pior a 0.0. Traduz-se pela seguinte equação:

f-score= 2 ∗ precision∗ recall

Capítulo 5

Metodologia

Neste capítulo é apresentado o conjunto de dados utilizado sendo seguido por uma visão geral da meto- dologia. Posteriormente entra-se em detalhe na metodologia, começando pelo pré-processamento onde se explica como foram os filtros utilizados, seguindo-se para a extração e normalização de características e posteriormente como foram utilizados os algoritmos de aprendizagem computacional.

5.1

Dados utilizados

O conjunto de dados foi recolhido, na sua totalidade, em rastreios feitos pela Caravana do Coração – uma ação que consiste na execução de rastreios, consultas com cardiologistas e testes especializados e que pro- move a despistagem de patologias cardíacas [18]. Os rastreios foram feitos no Brasil, no estado do Pernam- buco, em 2014 e 2015, e durante esta campanha de rastreio todos os participantes que apareciam voluntari- amente eram incluídos, mas os pacientes com menos de 21 anos precisavam de um consentimento parental assinado. Como parte do protocolo todos os participantes completaram questionários sociodemográficos e foram analisados sendo feita uma examinação clínica (física e mental), uma triagem (medidas fisiológicas) e investigações cardíacas (radiografia, eletrocardiograma e ecocardiograma). Adicionalmente foram feitas auscultações eletrónicas, a cada um dos pacientes, em quatro dos principais pontos de auscultação sendo recolhida uma amostra individual do áudio, de cada um dos pontos de auscultação, para posterior análise. O conjunto de dados utilizado contem 687 pacientes, dos quais 545 (70.3%) possuem um batimento car- díaco normal, o que corresponde a 2180 sons e 142 (20.7%) estão identificados com sopro cardíaco, o que corresponde a 568 sons. O dataset foi recolhido no âmbito do projeto DigiScope 2.0 e a equipa verificou que as anotações feitas inicialmente estavam rudimentares. Desta forma, decidiram contratar uma aluna de medicina para fazer anotações ao dataset e uma das anotações feitas é de qual dos focos se onde melhor o sopro e os resultados da análise feita a 81 pacientes, estão apresentados na tabela5.1.

A tabela5.1apresenta o número de vezes que cada foco de auscultação foi considerado como o foco mais audível, onde se verifica que o foco ’AV’ é o foco que aparece menos vezes como mais audível e o foco ’MV’ é o que aparece mais vezes como mais audível. Para a elaboração desta dissertação vão ser utilizados os sinais de todos os focos de auscultação com várias combinações.

28 Metodologia

Tabela 5.1: Número de vezes que cada foco de auscultação foi considerado como o foco mais audível Quantidade AV 13 MV 20 PV 31 TV 17

5.2

Visão geral

Figura 5.1: Diagrama do esquema da metodologia

Para resolver o problema inicial desta dissertação, ou seja, classificar o batimento cardíaco de pacientes pediátricos, foi decidido construir uma metodologia que engloba fases do processamento de sinal. Para isso cada uma das etapas do processamento de sinal foi construída individualmente, de forma a serem testadas as funcionalidades de cada parte antes de se testar em conjunto. O esquema da metodologia pode ser observado na figura5.1.

Na primeira fase da metodologia, o pré-processamento, foram utilizados dois filtros de impulso infinito: o filtro de Butterworth 4.2.1 e o filtro de Chebyshev4.2.2 e, além de terem sido utilizados estes filtros, também foram feitas experiências sem qualquer tipo de filtragem.

5.3 Pré-processamento 29

Após a filtragem dos dados seguimos para a fase de extração de características. Foram extraídas caracte- rísticas do domínio temporal (média, desvio padrão e amplitude) e MFCCs (Mel frequency Cepstral Co- efficients). No total foram extraídas 14 características de cada som, que serão detalhadas na secção5.4e após a sua extração foi feita uma normalização usando o z-score [37] e o Cepstral Mean and Variance Nor- malization[21]. Seguido da normalização das características extraídas foram executados vários algoritmos de aprendizagem computacional, nomeadamente, SVM, KNN, ANN, XGBoost, lightGBM, random rorest e regressão linear.

Assim que cada etapa individual da cadeia foi concluída, foi construída a cadeia na totalidade e começaram as experiências e como era possível dividir de acordo com o foco de auscultação utilizado, foi exequível fazer combinações de acordo com o foco de auscultação, como por exemplo, o foco mitral com o foco aórtico.

Depois de obtidos resultados da classificação do som cardíaco de cada algoritmo será necessário combinar os resultados do som de forma a obter a classificação do paciente e, após serem obtidos os resultados das classificações dos pacientes, são calculadas as métricas de avaliação de cada algoritmo. De seguida, cada etapa da metodologia será detalhada.

5.3

Pré-processamento

Os dados gravados incluem ruído dispensável que pode ser retirado para ser possível melhorar a extração de características. Para suprimir as interferências dos sinais do som cardíaco será necessário remover algumas das frequências. Sabe-se que a frequência do batimento cardíaco está entre 0 Hz e 200 Hz, portanto as frequências acima de 200 Hz são consideradas ruído.

Para se remover o ruído foram utilizados o filtro IRR de Butterworth e o filtro IRR de Chebyshev, de tipo I e, tendo em conta que a frequência do S1 e S2, normalmente, está entre 30-80 Hz [23], foi utilizado com ambos os filtros um filtro passa-baixo, com ordem 5 e com uma frequência de corte de 100Hz. Os filtros foram utilizados em experiências diferentes sendo também efetuadas experiências sem filtro.

Os resultados da aplicação do filtro de Butterworth a um dos sons é visível na figura5.3e os resultados da aplicação do filtro de Chebyshev de tipo I ao mesmo som é visível na figura5.3

Figura 5.2: Exemplo do filtro de But- terworth aplicado a um som cardíaco

Figura 5.3: Exemplo do filtro de Chebyshev aplicado a um som cardíaco

30 Metodologia

Após a remoção de ruído dos sons cardíacos, segue-se para a recolha de características do som.

Documentos relacionados