• Nenhum resultado encontrado

4.5 Resultados

4.5.3 Avaliação: Classificadores

Os classificadores k vizinhos mais próximos (KNN), naive bayes (NB), e máquinas de vetor suporte (SVM) apresentaram os resultados descritos na Tabela 4.4. O número de vizi- nhos mais próximos utilizados no KNN foi 13 (k = 13, obtido através da análise da acurácia do classificador para diferentes valores de k) e os parâmetros do núcleo RBF da SVM foram C= 16.384 e γ = 9, 7656 × 10−4.

Analisando a acurácia, verifica-se que o classificador SVM apresenta melhores resulta- dos,e por isso é escolhido como padrão nas análises subsequentes dos demais grupos.

Tabela 4.4: Medidas de Desempenho. Indicador/Classificador KNN NB SVM Especificidade 87,50 63,89 80,56 Sensibilidade 52,78 77,78 70,83 VPN 64,95 74,19 73,42 VPP 80,85 68,29 78,46 Acurácia 70,14 70,83 75,69

Primeiramente vamos analisar apenas o conjunto de teste apresentado ao classificador SVM. Esse conjunto é composto por 144 indivíduos igualmente distribuídos nos grupos 1 e 2 (72 indivíduos cada). De acordo com o classificador, o grupo 1 possui 21 indivíduos diabé- ticos indicados como sadios, dentre os quais 8 são realmente sadios pelo exame de glicemia pós-prandial (TOTG). Já o grupo 2 possui 14 indivíduos sadios indicados como diabéticos, dentre os quais apenas 1 é diabético pelo TOTG. Assim, apenas analisando o elementos do conjunto de teste, temos que o classificador erra a identificação de 13 indivíduos de cada grupo. Portanto, a acurácia apresenta para os grupos 1 e 2 é de 81, 94%.

Antes de analisar os resultados de classificação sobre os grupos intermediários (3, 4 e 5) foram feitos gráficos que comparam GJ com as duas primeiras principais componentes obtidas de uma transformação linear sobre os índices de variabilidade de frequência cardíaca

em direções ortogonais de máxima variância, no caso, da PCA (do inglês, Principal Com- ponent Analysis), ilustrando a relação entre índices de VFC e GJ, para GJ entre 100 e 140 (100 < GJ < 140 mg/dL).

A ideia é reforçar que não é possível inferir uma relação explícita do valor de GJ com as componentes da PCA. De fato, observa-se uma diminuição do valor da componente principal em função do valor de glicemia. Isto é ilustrado no gráfico da Figura 4.2 uma vez que há uma sutil tendência entre GJ e a primeiras componentes da PCA, tal que maiores valores de glicemia implicam em menores valores da primeira componente da PCA na faixa de glicemia intermediária. Ainda na Figura 4.2, observa-se que os diabéticos identificados pelo

Figura 4.2: GJ e primeira componente da PCA classificador possuem, no geral, valores menores de componente principal.

A Figura 4.3 ilustra a relação entre GJ com as duas primeiras componentes principais da PCA. Assim, as Figuras 4.2 e 4.3 exemplificam a dificuldade de se classificar indivíduos com valores de GJ caracterizados como pré-diabéticos, ou ainda, indivíduos com valores de glicemia intermediária na faixa de GJ entre 100 e 140 mg/dL.

Para a avaliação do modelo final do classificador SVM sobre os indivíduos dos grupos 3, 4 e 5, comparou-se os resultados de classificação com o exame de glicemia pós-prandial (TOTG), bem como com a indicação dada pela história médica pregressa (HMPA04).

Analisando os rótulos do classificador sobre o grupo 3, vemos que ele é composto por 21 diabéticos e 44 indivíduos saudáveis (totalizando 65 indivíduos). Da porção de 21 dia- béticos, verifica-se que 15 indivíduos são indicados como sadios pelo exame TOTG (9 têm 110 < GJ ≤ 125 mg/dL e 4 têm 100 < GJ ≤ 110 mg/dL). Porém 11 desses são identificados

Figura 4.3: GJ e primeiras componentes da PCA

como diabéticos pela história médica pregressa (HMPA04 = 1). A ideia é que todo indivíduo com HMPA04 positivo (HMPA04 = 1) tem diabetes, e HMPA04 negativo (HMPA04 = 0) não garante que o indivíduo não seja diabético. Em relação à porção de 44 indivíduos sa- dios, verifica-se que 5 indivíduos são identificados como diabéticos pelo exame TOTG e confirmados pela história médica pregressa (4 desses possuem GJ < 100 mg/dL, a saber, 57, 87, 94 e 94). Se compararmos os resultados de classificação do grupo 3 com o exame TOTG juntamente com a HMPA04, verifica-se que o classificador erra na identificação de 4 indivíduos sadios e 5 diabéticos, tal que a acurácia apresentada para o grupo 3 será de 86, 15%.

De forma semelhante, o grupo 4 é composto por 8 diabéticos e 91 indivíduos saudáveis (totalizando 99 indivíduos). Da porção de 8 diabéticos, verifica-se que todos são indicados como sadios pelo exame TOTG e confirmados pelo história médica pregressa (HMPA04 = 0). Em relação à porção de 91 indivíduos sadios, verifica-se que 3 indivíduos são identifi- cados como diabéticos pelo exame TOTG (3 possuem GJ próxima a 100 mg/dL, a saber, 105, 112 e 115), porém não são confirmados pelo história médica pregressa (HMPA04 = 0). Se compararmos os resultados de classificação do grupo 4 como o exame TOTG e a HMPA04, verifica-se que o classificador erra apenas na identificação de 8 indivíduos sadios, tal que a acurácia apresentada para o grupo 4 será de 91, 92%.

Relacionando GJ e HMPA04 nos grupos 3 e 4, vemos que:

• no grupo 3, 39 indivíduos apresentam história médica pregressa indicando a presença de diabetes (HMPA04 = 1). A priori, todo o grupo 3 seria classificado como sadio por

meio da análise individual de GJ, pois os valores de glicemia restringem-se à faixa de GJ < 125 mg/dL. Porém, ele possui 60% de diabéticos indicados por HMPA04; • no grupo 4, apenas 2 indivíduos apresentam história médica pregressa indicando a

presença de diabetes (HMPA04 = 1). De forma análoga ao grupo 3, a priori, todo o grupo 4 seria classificado como sadio por meio da análise individual de GJ (GJ < 125 mg/dL). Assim, o grupo 4 possui ≈ 2, 02% de diabéticos indicados por HMPA04.

Ainda analisando os grupos 3 e 4, vemos que o classificador aprendeu em relação a GJ e HMPA4, em função da determinação dos grupos 1 e 2. Assim, valores de GJ próximos a 100 tendem a ser classificados como normais e, de alguma forma, a identificação de HMPA4 tem relação implícita com a VFC na determinação de indivíduos diabéticos. Além disso, a utilização de medicamentos (a exemplo do grupo 3) implica em alterações na VFC, que podem alterar a classificação.

Analisando os rótulos do classificador sobre o grupo 5, vemos que ele é composto por 18 diabéticos e 81 indivíduos saudáveis (totalizando 99 indivíduos). Da porção de 18 diabéticos, verifica-se que 11 são indicados como sadios pelo TOTG, dentro os quais apenas 1 é identi- ficado como diabético pela história médica pregressa (HMPA04 = 1). Em relação à porção de 81 indivíduos sadios, verifica-se que 18 indivíduos são identificados como diabéticos pelo exame TOTG, ao passo que pela história médica pregressa 17 desses não são confirmados como diabéticos (HMPA04 = 0). Se compararmos os resultados de classificação do grupo 5 como o exame TOTG e a HMPA04, verifica-se que o classificador erra na identificação de 10 indivíduos sadios e 1 diabético, tal que a acurácia apresentada para o grupo 5 será de 88, 89%.