• Nenhum resultado encontrado

Reconhecimento de padrões aplicados à identificação de patologias de laringe

N/A
N/A
Protected

Academic year: 2021

Share "Reconhecimento de padrões aplicados à identificação de patologias de laringe"

Copied!
109
0
0

Texto

(1)´ ´ UNIVERSIDADE TECNOLOGICA FEDERAL DO PARANA ´ ˜ EM ENGENHARIA ELETRICA ´ PROGRAMA DE POS-GRADUAC ¸ AO E ´ INFORMATICA INDUSTRIAL. BRUNO RIBEIRO SODRE´. ˜ ` RECONHECIMENTO DE PADROES APLICADOS A ˜ DE PATOLOGIAS DE LARINGE IDENTIFICAC ¸ AO. ˜ DISSERTAC¸AO. CURITIBA 2016.

(2) BRUNO RIBEIRO SODRE´. ˜ ` RECONHECIMENTO DE PADROES APLICADOS A ˜ DE PATOLOGIAS DE LARINGE IDENTIFICAC ¸ AO. Dissertac¸a˜ o apresentada ao Programa de P´osgraduac¸a˜ o em Engenharia El´etrica e Inform´atica Industrial da Universidade Tecnol´ogica Federal do Paran´a como requisito parcial para obtenc¸a˜ o do grau ´ de “Mestre em Ciˆencias” – Area de Concentrac¸a˜ o: Engenharia de Automac¸a˜ o. Orientador:. Marco Jos´e da Silva. Co-orientador: Marcelo de Oliveira Rosa. CURITIBA 2016.

(3) Dados Internacionais de Catalogação na Publicação S679r 2016. Sodré, Bruno Ribeiro Reconhecimento de padrões aplicados à identificação de patologias de laringe / Bruno Ribeiro Sodré.-- 2016. 108 f.: il.; 30 cm Texto em português, com resumo em inglês. Dissertação (Mestrado) - Universidade Tecnológica Federal do Paraná. Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial, Curitiba, 2016. Bibliografia: f. 105-108. 1. Laringe - Doenças - Diagnóstico. 2. Voz. 3. Acústica - Análise. 4. Redes neurais (Computação). 5. Reconhecimento de padrões. 6. Máquinas de vetores de suporte. 7. Métodos de simulação. 8. Engenharia elétrica - Dissertações. I. Silva, Marco José da, orient. II. Rosa, Marcelo de Oliveira, coorient. III. Universidade Tecnológica Federal do Paraná. Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial. IV. Título. CDD: Ed. 22 -- 621.3. Biblioteca Central da UTFPR, Câmpus Curitiba.

(4) UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ. Câmpus Curitiba. Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial. Título da Dissertação Nº. ____. Reconhecimento De Padrões Aplicados À Identificação De Patologias De Laringe por. Bruno Ribeiro Sodré Orientador: Prof. Dr. Marco José da Silva (UTFPR) Coorientador: Prof. Dr. Marcelo de Oliveira Rosa (UTFPR) Esta dissertação foi apresentada como requisito parcial à obtenção do grau de MESTRE EM CIÊNCIAS – Área de Concentração: Engenharia de Automação e Sistemas do Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial – CPGEI – da Universidade Tecnológica Federal do Paraná – UTFPR, às 14h do dia 23 de fevereiro 2016. O trabalho foi aprovado pela Banca Examinadora, composta pelos professores doutores:. _____________________________________ Prof. Dr. Marcelo de Oliveira Rosa (Presidente – UTFPR). ___________________________________ Prof. Dr. Eduardo Parente Ribeiro (UFPR). ___________________________________ Prof. Dr. Alexandre José T.S. Mello (UTFPR). ___________________________________ Prof. Dr. (). Visto da coordenação:. ________________________________ Prof. Dr. Emilio Carlos Gomes Wille (Coordenador do CPGEI).

(5) Dedico este estudo a` minha fam´ılia que, de uma ou outra forma, sempre estiveram presentes incentivando-me em todos os momentos deste trabalho..

(6) AGRADECIMENTOS. Agradec¸o primeiramente a Deus por estar presente em todos os momentos de dificuldades que me foram impostos durante todo o per´ıodo deste trabalho e me proporcionar condic¸o˜ es para super´a-los. Agradec¸o a` minha fam´ılia pela constante motivac¸a˜ o durante todo o per´ıodo de estudo. Agradec¸o a todos que contribu´ıram de alguma forma neste estudo. Em especial aos meus orientadores, os professores Marco e Marcelo, pelas conversas e discuss˜oes que me proporcionaram muitas ideias para a realizac¸a˜ o deste trabalho..

(7) “O sucesso n˜ao e´ medido pelos patamares alcanc¸ados, mas pelos obst´aculos superados para chegar l´a.” (Booker T. Washington)..

(8) RESUMO. ˜ ´ Bruno Ribeiro. ` SODRE, RECONHECIMENTO DE PADROES APLICADOS A ˜ DE PATOLOGIAS DE LARINGE. 108 f. Dissertac¸a˜ o – Programa de P´osIDENTIFICAC¸AO graduac¸a˜ o em Engenharia El´etrica e Inform´atica Industrial, Universidade Tecnol´ogica Federal do Paran´a. Curitiba, 2016. As patologias que afetam a laringe est˜ao aumentando consideravelmente nos u´ ltimos anos devido a` condic¸a˜ o da sociedade atual onde h´a h´abitos n˜ao saud´aveis como fumo, a´ lcool e tabaco e um abuso vocal cada vez maior, talvez por conta do aumento da poluic¸a˜ o sonora, principalmente nos grandes centros urbanos. Atualmente o exame utilizado pela endoscopia per-oral (direcionado a identificar patologias de laringe) s˜ao a videolaringoscopia e videoestroboscopia, ambos invasivos e por muitas vezes desconfort´avel ao paciente. Buscando melhorar o bem estar dos pacientes que necessitam submeter-se a estes procedimentos, este estudo teve por objetivo identificar padr˜oes ac´usticos que possam ser aplicados a` identificac¸a˜ o de patologias de laringe de modo a se criar um novo m´etodo n˜ao invasivo de avaliac¸a˜ o da laringe. Aqui duas diferentes configurac¸o˜ es de redes neurais from usadas. A primeira foi gerada a partir de 524.287 combinac¸o˜ es de 19 medidas ac´usticas para classificar vozes em normais ou de patologia da laringe, e atingiu uma acur´acia m´axima de 99,5% (96,99±2,08%). Utilizandose 3 e 6 medidas rotacionadas (obtidas atrav´es do m´etodo de componentes principais), a acur´acia foi de 93,98±0,24% e 94,07±0,29%, respectivamente. Com 6 medidas rotacionadas com pr´evia normalizadas das 19 medidas ac´usticas, a acur´acia foi de 97,88±1,53%. A segunda, para classificar 23 diferentes tipos de vozes (incluindo vozes normais), mostrou melhor acuracia na identificac¸a˜ o de hiperfuncionalidades e vozes normais com 58,23±18,98% e 52,15±18,31%, respectivamente. A pior acuracia foi obtida para fadigas vocais, com 0,57±1,99%. Excluindo-se as vozes normais, hiperfuncionalidades continou sendo as mais facilmente identific´aveis (com uma acur´acia de 57,3±19,55%) seguida de constric¸o˜ es aˆ nteroposterior (com 18,14±11,45%), e a patologia mais dif´ıcil de se identificar continua sendo a fadiga vocal (com 0,7±2,14%). Usando uma re-amostragem dos vetores de entrada das redes neurais, obteve-se acur´acia de 25,88±10,15%, 21,47±7,58% e 18,44±6,57% para tais redes com 20, 30 e 40 neurˆonios na camada intermedi´aria, respectivamente. Para comparac¸a˜ o, classificac¸a˜ o usando m´aquina de vetores suporte produziu acur´acia de 67±6,2%. Assim, mostrou-se que as medidas ac´usticas precisam ser aprimoradas para a obtenc¸a˜ o de melhores resultados de classificac¸a˜ o dentre as patologias de laringe estudadas. Ainda assim, verificou-se que e´ poss´ıvel discriminar locutores normais dos disfˆonicos. Palavras-chave: Patologias de laringe, An´alise Ac´ustica da Voz, Redes Neurais, M´aquinas de Vetores Suporte.

(9) ABSTRACT. ´ Bruno Ribeiro. PATTERN RECOGNITION APPLIED TO THE IDENTIFICATION SODRE, OF PATHOLOGIES LARYNGEAL. 108 f. Dissertac¸a˜ o – Programa de P´os-graduac¸a˜ o em Engenharia El´etrica e Inform´atica Industrial, Universidade Tecnol´ogica Federal do Paran´a. Curitiba, 2016. Diseases that affect the larynx have been considerably increased in recent years due to the condition of nowadays society where there have been unhealthy habits like smoking, alcohol and tobacco and an increased vocal abuse, perhaps due to the increase in noise pollution, especially in large urban cities. Currently the exam performed by per-oral endoscopy (aimed to identify laryngeal pathologies) have been videolaryngoscopy and videostroboscopy, both invasive and often uncomfortable to the patient. Seeking to improve the comfort of the patients who need to undergo through these procedures, this study aims to identify acoustic patterns that can be applied to the identification of laryngeal pathologies in order to creating a new non-invasive larynx assessment method. Here two different configurations of neural networks were used. The first one was generated from 524.287 combinations of 19 acoustic measurements to classify voices into normal or from a diseased larynx, and achieved an max accuracy of 99.5% (96.99±2.08%). Using 3 and 6 rotated measurements (obtained from the principal components analysis method), the accuracy was 93.98±0.24% and 94.07±0.29%, respectively. With 6 rotated measurements from a previouly standardization of the 19 acoustic measurements, the accuracy was 97.88±1.53%. The second one, to classify 23 different voice types (including normal voices), showed better accuracy in identifying hiperfunctioned larynxes and normal voices, with 58.23±18.98% and 52.15±18.31%, respectively. The worst accuracy was obtained from vocal fatigues, with 0.57±1.99%. Excluding normal voices of the analysis, hyperfunctioned voices remained the most easily identifiable (with an accuracy of 57.3±19.55%) followed by anterior-posterior constriction (with 18.14±11.45%), and the most difficult condition to be identified remained vocal fatigue (with 0.7±2.14%). Re-sampling the neural networks input vectors, it was obtained accuracies of 25.88±10.15%, 21.47±7.58%, and 18.44±6.57% from such networks with 20, 30, and 40 hidden layer neurons, respectively. For comparison, classification using support vector machine produced an accuracy of 67±6.2%. Thus, it was shown that the acoustic measurements need to be improved to achieve better results of classification among the studied laryngeal pathologies. Even so, it was found that is possible to discriminate normal from dysphonic speakers. Keywords: Laryngeal pathologies, Acoustic Voice Analysis, Neural Network, Support Vector Machines.

(10) LISTA DE FIGURAS. FIGURA 1 FIGURA 2 FIGURA 3 FIGURA 4 FIGURA 5 FIGURA 6 FIGURA 7 FIGURA 8 FIGURA 9 FIGURA 10 FIGURA 11 FIGURA 12 FIGURA 13 FIGURA 14 FIGURA 15 FIGURA 16 FIGURA 17 FIGURA 18. – – – – – – – – – – – – – – – – – –. Laringosc´opio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Nasofibrosc´opio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ilustrac¸a˜ o de Laringe Anterior e Sagital Posterior . . . . . . . . . . . . . . . . . . . . . . Estroboscopia de um ciclo vibrat´orio das pregas vocais . . . . . . . . . . . . . . . . . Estrutura neuromuscular da laringe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Estrutura cartilaginosa e fibrel´astica da laringe . . . . . . . . . . . . . . . . . . . . . . . . . Esquem´atico da Fala Humana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ilustrac¸a˜ o do trato vocal humano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ilustrac¸a˜ o da Laringe Aberta e Fechada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Frequˆencia M´edia da Voz Humana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Propagac¸a˜ o do ar pelas pregas vocais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Medidas ac´usticas de um sinal de voz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esquem´atico de um neurˆonio biol´ogico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Vetores candidatos para a classificac¸a˜ o SVM . . . . . . . . . . . . . . . . . . . . . . . . . . Vetor Escolhido para a classificac¸a˜ o SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Distribuic¸a˜ o dos dados de entrada das m´aquinas de vetores suporte . . . . . . Exemplo 1 de resultado obtido pela m´aquina de vetores de suporte . . . . . . . Exemplo 2 de resultado obtido pela m´aquina de vetores de suporte . . . . . . .. 16 17 25 26 27 28 29 29 30 31 32 49 57 61 61 70 71 71.

(11) LISTA DE TABELAS. TABELA 1 TABELA 2 TABELA 3 TABELA 4 TABELA 5 TABELA 6 TABELA 7 TABELA 8 TABELA 9. – – – – – – – – –. TABELA 10 – TABELA 11 – TABELA 12 –. TABELA 13 –. TABELA 14 –. TABELA 15 –. TABELA 16 –. TABELA 17 –. TABELA 18 –. Fatores que afetam a qualidade fonat´oria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Origem das Patologias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´Indice de sintomas de refluxo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Causas de paralisia unilateral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Matriz confus˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relac¸a˜ o entre patologia e gˆenero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relac¸a˜ o entre a numerac¸a˜ o da coluna com a medida ac´ustica . . . . . . . . . . . . Resultados redes neurais, entrada n˜ao-normalizada, configurac¸a˜ o direta . . . Combinac¸o˜ es k, redes neurais, entrada n˜ao-normalizada, configurac¸a˜ o direta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Participac¸a˜ o das medidas ac´usticas, individualmente, em relac¸a˜ o aos melhores resultados obtidos pela configurac¸a˜ o direta. . . . . . . . . . . . . . . . . . . . Participac¸a˜ o das medidas ac´usticas, individualmente, em relac¸a˜ o aos piores resultados obtidos pela configurac¸a˜ o direta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada n˜ao normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 3 entradas. A sa´ıda e´ composta de uma classificac¸a˜ o de vozes classificadas como normais ou como patol´ogicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada n˜ao normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 3 entradas. A sa´ıda e´ composta de uma classificac¸a˜ o de vozes classificadas como normais ou como patol´ogicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada n˜ao normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de uma classificac¸a˜ o de vozes classificadas como normais ou como patol´ogicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada n˜ao normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de uma classificac¸a˜ o de vozes classificadas como normais ou como patol´ogicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de uma classificac¸a˜ o de vozes classificadas como normais ou como patol´ogicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de uma classificac¸a˜ o de vozes classificadas como normais ou como patol´ogicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de 23 classificac¸o˜ es diferentes, podendo ser classificada. 35 37 40 44 62 68 73 74 76 77 78. 79. 80. 81. 82. 83. 84.

(12) TABELA 19 –. TABELA 20 –. TABELA 21 –. TABELA 22 –. TABELA 23 –. TABELA 24 –. TABELA 25 –. TABELA 26 – TABELA 27 – TABELA 28 –. como normal ou como qualquer uma das 22 patologias poss´ıveis listadas neste trabalho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de 23 classificac¸o˜ es diferentes, podendo ser classificada como normal ou como qualquer uma das 22 patologias poss´ıveis listadas neste trabalho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de 22 classificac¸o˜ es diferentes, neste caso as amostras classificadas como vozes normais foram exclu´ıdas, portanto a classificac¸a˜ o a ser feita e´ de uma patologia em relac¸a˜ o a todas as outras. . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de 22 classificac¸o˜ es diferentes, as vozes normais foram exclu´ıdas, restando a classificac¸a˜ o entre todas as patologias. . . . . . . . . . . . . . Resultados encontrados para uma rede neural com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas utilizando a t´ecnica de re-amostragem. A sa´ıda e´ composta de 23 classificac¸o˜ es diferentes constitu´ıdas de voz normal e 22 patologias. . . . . . . Resultados encontrados para uma rede neural com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas utilizando a t´ecnica de re-amostragem. A sa´ıda e´ composta das 23 classificac¸o˜ es individualizadas constitu´ıdas de voz normal e 22 patologias. Resultados encontrados para uma rede neural com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas utilizando a t´ecnica de re-amostragem, com a combinac¸a˜ o dos resultados de duas redes neurais que utilizaram 30 e 40 neurˆonios na camada oculta. A sa´ıda e´ composta de 23 classificac¸o˜ es diferentes constitu´ıdas de voz normal e 22 patologias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Resultados encontrados para as redes neurais com a entrada normalizada utilizando-se o m´etodo de reduc¸a˜ o de vari´aveis, PCA, com 6 entradas. A sa´ıda e´ composta de 23 classificac¸o˜ es diferentes, podendo ser classificada como normal ou como qualquer uma das 22 patologias poss´ıveis listadas neste trabalho. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Lista dos 10 melhores e os 10 piores resultados do classificador SVM . . . . Tabela com as porcentagens encontradas para cada um dos valores PCA . . Comparac¸a˜ o entre as medidas ac´usticas utilizadas nas duas melhores configurac¸o˜ es, utilizando a configurac¸a˜ o direta, de sa´ıda normal ou patol´ogica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 85. 86. 87. 88. 89. 90. 91. 92 93 93. 98.

(13) ´ SUMARIO. ˜ 1 INTRODUC ¸ AO .............................................................. ˜ DO PROBLEMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 DESCRIC¸AO ˜ 1.2 MOTIVAC¸AO ............................................................... ˜ BIBLIOGRAFICA ´ 1.3 REVISAO ................................................. 1.4 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Objetivos Espec´ıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ DO TRABALHO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 ORGANIZAC¸AO 2 LARINGE E PATOLOGIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 A VOZ HUMANA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 PATOLOGIAS DE LARINGE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ ANTERIOR-POSTERIOR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 CONSTRIC¸AO 3.2 CURVATURA DAS PREGAS VOCAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ 3.3 DISFONIA DE CONVERSAO ................................................ 3.4 CISTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 REFLUXO LARINGO-FAR´INGEO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 GRANULOMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 HEMILARINGECTOMIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ 3.8 HIPERFUNC¸OES ............................................................ 3.9 LEUCOPLASIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.10 PAPILOMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.11 PARALISIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.12 PARESIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.13 PRESBIFONIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.14 EDEMA DE REINKE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.15 CICATRIZES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 3.16 DISFONIA ESPASMODICA .................................................. ˜ VENTRICULAR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.17 COMPRESSAO 3.18 FADIGA VOCAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 3.19 POLIPO NAS PREGAS VOCAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 3.20 NODULOS VOCAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.21 TREMOR VOCAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 4 MEDIDAS ACUSTICAS ...................................................... ˆ 4.1 FREQUENCIA FUNDAMENTAL (PITCH) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 TEMPO FUNDAMENTAL (T0 ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˆ 4.3 FREQUENCIA FUNDAMENTAL MAIS ALTA (FHI ) . . . . . . . . . . . . . . . . . . . . . . . . . . . ˆ 4.4 FREQUENCIA FUNDAMENTAL MAIS BAIXA (FLO ) . . . . . . . . . . . . . . . . . . . . . . . . . ˜ (STD) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 DESVIO PADRAO ´ ˜ DA FREQUENCIA ˆ 4.6 EXTENSAO FUNDAMENTAL FONATORIA EM SEMI-TONS. 14 14 18 19 22 22 23 23 25 25 33 36 38 38 39 39 40 41 42 42 43 43 44 44 45 45 46 46 47 47 47 48 49 50 50 50 51 51. (PFR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4.7 TEMPO DA AMOSTRA (TSAM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.

(14) 4.8 JITTER ABSOLUTO (JITA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.9 PORCENTAGEM DE JITTER (JITT) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ MEDIA ´ 4.10 PERTURBAC¸AO RELATIVA (RAP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ DO PER´IODO DE PITCH (PPQ) . . . . . . . . . . . . 4.11 QUOCIENTE DE PERTURBAC¸AO ˜ DA FREQUENCIA ˆ 4.12 VARIAC¸AO FUNDAMENTAL (V F0 ) . . . . . . . . . . . . . . . . . . . . . . . 4.13 SHIMMER (SHDB) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.14 PORCENTAGEM DE SHIMMER (SHIM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ DA AMPLITUDE (APQ) . . . . . . . . . . . . . . . . . . . 4.15 QUOCIENTE DE PERTURBAC¸AO ˜ 4.16 VARIAC¸AO DE PICO DA AMPLITUDE (VAM) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˆ ˜ RU´IDO-HARMONICO 4.17 RELAC¸AO (NHR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ ˆ 4.18 INDICE DE TURBULENCIA DA VOZ (VTI) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 4.19 ´INDICE FONETICO SUAVE(SPI) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 CLASSIFICADORES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 REDES NEURAIS ARTIFICIAIS (RNA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 5.2 MAQUINAS DE VETORES SUPORTE (MVS) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ 5.3 MATRIZ CONFUSAO ....................................................... ´ DE COMPONENTES PRINCIPAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4 ANALISE ´ 6 MATERIAIS E METODOS ................................................... 6.1 O BANCO DE DADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 REDES NEURAIS ARTIFICIAIS - RNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ 6.3 MAQUINAS DE VETORES DE SUPORTE - SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ DAS REDES NEURAIS . . . . . . . . . . . . . . . . . . 7.1 RESULTADOS OBTIDOS ATRAVES 7.1.1 Resultados da Rede Neural: An´alise da Voz Normal e Patol´ogica - configurac¸a˜ o. 52 52 52 53 53 53 54 54 54 54 55 55 56 56 60 62 64 67 67 68 69 72 72. direta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 7.1.2 Resultados da Rede Neural: An´alise da Voz Normal vs Patol´ogica - M´etodo de Reduc¸a˜ o de Vari´aveis (PCA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ´ DAS MAQUINAS ´ 7.2 RESULTADOS OBTIDOS ATRAVES DE VETORES SUPORTE ˜ 8 DISCUSSAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˜ ................................ 8.1 MELHORES MEDIDAS DE CLASSIFICAC¸AO ˜ 8.2 MELHOR CONFIGURAC¸AO DE RECONHECIMENTO DE UMA VOZ ´ PATOLOGICA ............................................................... ˜ 8.3 MELHOR CONFIGURAC¸AO DE RECONHECIMENTO ENTRE AS. 77 91 94 95 97. PATOLOGIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 ˜ ´ 8.4 COMPARAC¸AO ENTRE REDES NEURAIS E MAQUINAS DE VETORES SUPORTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 8.5 COMPARATIVO DE DESEMPENHO COM OS TRABALHOS . . . . . . . . . . . . . . . . . . 99 ˜ 9 CONCLUSAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 9.1 TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 ˆ REFERENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105.

(15) 14. 1. ˜ INTRODUC ¸ AO. Este cap´ıtulo abordar´a a descric¸a˜ o do problema, a motivac¸a˜ o, as contribuic¸o˜ es encontradas, os objetivos e a organizac¸a˜ o proposta neste trabalho. 1.1. ˜ DO PROBLEMA DESCRIC¸AO A comunicac¸a˜ o humana e´ a mais complexa e variada de todas as comunicac¸o˜ es. existentes entre os seres vivos. Ela pode ser transmitida de diferentes formas e maneiras. A escrita, os sinais, os gestos e a fala s˜ao exemplos que foram fundamentais para que os homens pudessem se comunicar com os outros, explicar suas ideias e descobertas e deixar tudo isso se tornar hist´oria a cada dia. Por meio da comunicac¸a˜ o foi criado o molde da sociedade de hoje. Dentre todas as formas de comunicac¸a˜ o, a mais f´acil e r´apida e´ a fala. Os bebˆes, ouvindo os t˜ao variados e at´e ent˜ao desconhecidos sons, consegue reconhecer a voz de sua m˜ae e de seu pai, se este tamb´em tinha como h´abito “conversar” com ele mesmo que ainda estivesse se desenvolvendo no ventre de sua m˜ae. Ele sabe identificar emoc¸o˜ es pelo tom de voz das pessoas e por volta dos 4 meses tenta sua primeira comunicac¸a˜ o balbuciando sons onde tenta imitar o que escuta. Enquanto cresce, desenvolve sua fala de maneira extremamente acelerada e pr´oximo de 1 ano e meio j´a iniciam sua comunicac¸a˜ o pela fala e durante toda sua vida, o principal meio de comunicac¸a˜ o ser´a a sua voz. Por´em, com o passar do tempo, a sociedade tamb´em se modifica e hoje h´a v´arios fatores que prejudicam a fala. H´abitos como utilizar fumo e tabaco fazem com que as in´umeras substˆancias t´oxicas e agressivas presentes na fumac¸a agrida todos os o´ rg˜aos presentes no sistema respirat´orio, particularmente as “cordas vocais” (ou “pregas vocais”) causando irritac¸o˜ es, pigarros, tosse e edemas (inchac¸os). A ingest˜ao de a´ lcool e´ outro fator que prejudica a fala. A sensac¸a˜ o de ardˆencia e queimac¸a˜ o na regi˜ao da laringe e do aspecto de voz rouca e fraca nos indiv´ıduos que a ingerem s˜ao resultantes de abusos vocais que n˜ao foram devidamente percebidos devido a` atenuac¸a˜ o da sensibilidade devido a` ac¸a˜ o anest´esica do a´ lcool na laringe e faringe. Fatores como a utilizac¸a˜ o de drogas, a permanˆencia em locais que possuam ar condicionado e.

(16) 15. n˜ao constantemente renov´aveis ou que possuam objetos al´ergicos tamb´em prejudicam a fala (RODRIGUES et al., 2011). Contudo, o h´abito de se forc¸ar a voz para que ela se sobressaia em locais onde haja muitos ru´ıdos e barulhos, cada vez mais intensos e frequentes em nossa sociedade, s˜ao fatores que podem fazer com que a laringe tenha algum tipo de les˜ao ou patologia (RODRIGUES et al., 2011). Pessoas que utilizam a voz constantemente, como por exemplo professores, cantores, atendentes de telemarketing e palestrantes necessitam que sua laringe esteja sempre bem, por´em nem sempre isto e´ poss´ıvel (RODRIGUES et al., 2011). Quando percebem que h´a algum problema com sua voz, e´ necess´ario que busquem aux´ılio m´edico o quanto antes pois uma patologia encontrada com antecedˆencia e´ mais f´acil de ser tratada. Muitas das vezes e´ necess´ario que um fonoaudi´ologo e um m´edico otorrinolaringologista trabalhem em conjunto para uma recuperac¸a˜ o mais r´apida e eficaz. Os principais sinais de alterac¸a˜ o da voz s˜ao (FRIAN, 2012): • Falhas na voz durante as conversac¸o˜ es do dia-a-dia; • Voz rouca por v´arios dias; • Voz mais rouca na sexta-feira e de boa qualidade ap´os o descanso no fim de semana; • Muito cansac¸o (fadiga) vocal; • Diminuic¸a˜ o do volume da voz, gerando esforc¸o para conseguir falar um pouco mais alto ou gritar; • Voz mais grave (grossa) do que no in´ıcio da profiss˜ao; • Dificuldades em cantar; • Pigarro constante (necessidade de raspar a garganta); • Dor ou desconforto na a´ rea do pescoc¸o; • Tosse seca persistente; • Ardˆencia na garganta; • Sensac¸a˜ o de corpo estranho (“bolo”) na garganta. Ao se consultar com um m´edico otorrinolaringologista, o paciente ser´a questionado a respeito de seus h´abitos cotidianos como, por exemplo, se ingere bebida alco´olica e em que.

(17) 16. frequˆencia, se fuma ou fumava e se costuma ou necessita falar alto e por bastante tempo, pode ser questionado ainda se faz uso de algum medicamento controlado, se h´a casos de cˆancer na fam´ılia, entre outros. Esta entrevista, que e´ feita pelo m´edico ao paciente e que tem por objetivo recuperar suas lembranc¸as a respeito de sua patologia que o est´a afligindo, chama-se levantamento anamn´atico. Al´em disso, o paciente e´ informado a respeito de como ser´a feito o exame de videolaringoscopia. Este exame e´ muito importante pois o m´edico pode verificar a regi˜ao da hipofaringe, laringe e cordas vocais. O exame videolaringosc´opico consiste na inserc¸a˜ o, atrav´es da boca e garganta, de um laringosc´opio, conforme mostra a figura 1.. Figura 1: Foto de um laringosc´opio utilizado nos exames de videolaringoscopia. Basicamente este aparelho e´ formado por uma fibra r´ıgida acoplada a uma fonte de luz e que possui uma micro-cˆamera em sua ponta. Ele deve ser posicionado de modo que o m´edico possa visualizar a laringe do paciente por completo. Por meio de um monitor, as imagens geradas s˜ao suficientemente grandes para que o m´edico possa ver os detalhes anatˆomicos da laringe do paciente. A continuac¸a˜ o do exame consiste em solicitar ao paciente que sustente alguns sons voc´alicos por algum tempo ou diga frases que trabalham bem com a laringe. Contudo este exame n˜ao e´ t˜ao f´acil de ser realizado. Nas crianc¸as por exemplo, se elas n˜ao forem bastante colaborativas, e´ muito dif´ıcil para o profissional realizar o exame laringosc´opico de maneira adequada. Al´em disso, mesmo com a aplicac¸a˜ o de uma borrifada de Xyloca´ına na garganta, com o intuito de minimizar o efeito nauseante deste exame, muitas pessoas ainda continuam com uma sensibilidade muito grande, sendo muito dif´ıcil, ou at´e mesmo imposs´ıvel, a sua realizac¸a˜ o. Uma opc¸a˜ o e´ a utilizac¸a˜ o de um equipamento similar ao laringosc´opio, mas que utiliza uma fibra flex´ıvel ao inv´es da r´ıgida, e que tamb´em possui uma fonte de luz e uma micro-cˆamera acopladas em sua ponta.. Este equipamento e´ o.

(18) 17. nasofibrosc´opio, conforme mostra a figura 2, que deve ser inserido pela narina do paciente. As n´auseas podem n˜ao estar presentes, mas o desconforto continua grande ao paciente.. Figura 2: Foto de um nasofibrosc´opio utilizado nos exames de videonasofibroscopia.. Ap´os a inserc¸a˜ o de qualquer um dos dois aparelhos, o importante e´ que a cˆamera seja posicionada de modo que a laringe fique totalmente vis´ıvel e com boa qualidade de v´ıdeo ao m´edico. Com o exame visual de sua estrutura f´ısica, e´ solicitado ao paciente que digam uma frase simples, ou mantenham por determinado tempo alguns fonemas sustentados, popularmente conhecidos como “Diga: Ah!”. Ao se pronunciar a frase ou o termo voc´alico, do ponto de vista ac´ustico, h´a uma diferenc¸a de press˜ao entre o ar presente nos pulm˜oes e o ar presente na boca que pode alterar as condic¸o˜ es auto-oscilat´orias das pregas vocais, visto que esta possui um movimento naturalmente peri´odico quando vibra. Assim, e´ poss´ıvel afirmar que ao se visualizar alterac¸o˜ es no padr˜ao vibrat´orio h´a forte ind´ıcio de patologias neste o´ rg˜ao. Um contratempo frequente e´ que, somado ao desconforto e aˆ nsia que j´a est˜ao sentindo, alguns pacientes n˜ao conseguem pronunciar as frases, ou manter os sons voc´alicos pelo per´ıodo suficiente para que os m´edicos possam ter uma boa avaliac¸a˜ o de suas laringes. Por vezes o instrumento precisa ser retirado para evitar as fortes n´auseas e/ou desconforto e tudo deve ser novamente reiniciado. Partindo da hip´otese de que a voz do paciente deve carregar informac¸o˜ es relativas a` condic¸a˜ o de sua laringe, neste trabalho pretende-se, atrav´es das mesmas fonac¸o˜ es usadas nesses exames, analisar os sinais do fonema e da fala e diagnosticar automaticamente a condic¸a˜ o da laringe, identificando (caso existam) as patologias que a afligem. Como resultado secund´ario, mas de importˆancia cl´ınica, podem ser empregadas m´etricas extra´ıdas do sinal da fala objetivando acompanhamento da evoluc¸a˜ o no tratamento de cada um dos pacientes..

(19) 18. 1.2. ˜ MOTIVAC¸AO Duas s˜ao as principais motivac¸o˜ es deste trabalho. Al´em de buscar um exame onde o. paciente tenha o m´ınimo de desconforto poss´ıvel para ser diagnosticado corretamente acerca da patologia que possui, h´a um grande interesse em contribuir com mais uma ferramenta que fac¸a uma interac¸a˜ o entre engenharia e medicina. Profissionais de sa´ude utilizam o seu conhecimento pr´atico e suas percepc¸o˜ es sensoriais adquiridos durante os seus v´arios anos atuando em determinada a´ rea cl´ınica. Seu tato, vis˜ao e audic¸a˜ o permitem-no identificar de maneira particular, e por vezes sutil, anormalidades na sa´ude de seu paciente. Profissionais mais inexperientes necessitam de um melhor embasamento e, por conseguinte, de um maior tempo para alcanc¸arem o mesmo diagn´ostico dado pelo especialista mais antigo de profiss˜ao. Por´em, conclus˜oes iguais nem sempre acabam em resultados iguais, uma patologia mais severa necessita de uma r´apida identificac¸a˜ o; um atraso pode custar at´e a vida do paciente. Neste sentido, a engenharia vem atuando na a´ rea m´edica desenvolvendo equipamentos, t´ecnicas e novas tecnologias que s˜ao capazes de suprir esta diferenc¸a entre os profissionais de uma mesma a´ rea. Isto e´ poss´ıvel, pois estes equipamentos tratam de sinais ou dados extra´ıdos dos pacientes que s˜ao classificados quantitativamente e que, por conta disso, sempre alcanc¸am o mesmo resultado. Ao se analisar um consult´orio cl´ınico ou um hospital, e´ poss´ıvel ver que h´a v´arios aparelhos que contribuem para que a medicina atual haja de forma mais r´apida, eficaz e confi´avel. Raios-X, tom´ografos e ressonˆancia magn´etica s˜ao alguns exemplos de aparelhos que auxiliam nos diagn´osticos de v´arios pacientes sem a necessidade de m´etodos invasivos ou intervenc¸o˜ es cir´urgicas. Da mesma forma, h´a v´arios aparelhos que podem ser utilizados para medir o desempenho e funcionamento de o´ rg˜aos do corpo humano como e´ o caso do eletroencefalograma, que auxilia o profissional da medicina a avaliar a atividade cerebral de seu paciente, ou o eletrocardiograma, que monitora a sua pulsac¸a˜ o card´ıaca, dentre outros que contribuem com a medicina de uma ou outra forma. Como resultado indireto deste trabalho e´ esperado que um m´etodo surja como apoio ao diagn´ostico seguro para identificac¸a˜ o de patologias de laringe. Espera-se com isso, que v´arios pacientes que possuem patologias que possam ser classificadas como n˜ao graves possam rapidamente ser diagnosticados sem a necessidade da presenc¸a do especialista e ter o seu tratamento iniciado o quanto antes, e aqueles que sejam identificados pelo novo m´etodo como portadores de patologias mais graves sejam encaminhados para uma equipe mais especializada.

(20) 19. neste tipo de tratamento, fazendo com que haja uma melhor utilizac¸a˜ o dos m´edicos especialistas da a´ rea de otorrinolaringologia. 1.3. ˜ BIBLIOGRAFICA ´ REVISAO Inicialmente ser˜ao abordadas algumas das principais medidas ac´usticas que servir˜ao. como base de toda a an´alise feita neste trabalho. A primeira medida ac´ustica a ser descrita e´ a frequˆencia fundamental ( f0 ) que e´ definida como a taxa de vibrac¸a˜ o das pregas vocais. A vibrac¸a˜ o peri´odica na glote produz uma fonac¸a˜ o quase perfeita devido aos movimentos do trato vocal que filtram a onda sonora gl´otica. Por´em, a pr´opria vibrac¸a˜ o glotal pode ter aperiodicidades na amplitude, frequˆencia ou forma de onda em suas fases de ciclo aberta e fechada (KAWAHARA, 2002). Dada a importˆancia do seu c´alculo (que e´ usado para quantificar diretamente jitter, shimmer e outras medidas ac´usticas), diversos autores propuseram m´etodos para seu c´alculo ((ROSS et al., 1974), (RESCH et al., ¨ 2007), (HU; WANG, 2010), (ZOLZER et al., 2012), dentre outros). O jitter e´ uma medida de perturbac¸a˜ o em torno do parˆametro f´ısico de frequˆencia, neste estudo este parˆametro e´ identificado como medida ac´ustica. O jitter indica a variac¸a˜ o de f0 medida entre ciclos gl´oticos vizinhos (CUNHA, 2008). Considerando a magnitude da dispers˜ao das perturbac¸o˜ es ciclo-a-ciclo foi descrita a f´ormula que descreve o jitter m´edio que ser´a apresentada no cap´ıtulo de medidas ac´usticas (HORII, 1979). Um pouco depois, foi empregada a medida conhecida como taxa de jitter para evitar que ocorresse uma reduc¸a˜ o do jitter m´edio caso houvesse um aumento de f0 (HORII, 1979). Seguindo uma abordagem semelhante foi descrito o jitter relativo (MURRY; DOHERTY, 1980). Considerando a relac¸a˜ o entre frequˆencia fundamental e medida de perturbac¸a˜ o, considerou-se o uso de medidas de frequˆencia em semi-tons (HONJO; ISSHIKI, 1980). Dessa forma determina-se a m´edia da variac¸a˜ o em semi-tons da frequˆencia fundamental a cada per´ıodo. Constatou-se que valores acima de um semi-tom caracterizam-se por elevada disfonia (ROSA, 1998). Alterac¸o˜ es lentas no per´ıodos de pitch em fala sustentada n˜ao est˜ao relacionados com patologias por´em podem elevar as medidas de jitter e shimmer, para evitar que estes efeitos ac´usticos indiquem falsamente uma disfonia, foi criada uma medida ac´ustica relacionada a` perturbac¸a˜ o m´edia relativa (RAP) empregando uma janela de 3 amostras (KOIKE, 1973), enquanto que uma outra medida foi criada com o nome de quociente de perturbac¸a˜ o do per´ıodo de pitch (PPQ), que utiliza uma janela de 11 amostras e mais tarde esta medida tamb´em.

(21) 20. foi aplicada sobre a amplitude ciclo-a-ciclo sendo chamada de quociente de perturbac¸a˜ o da amplitude (APQ) utilizando uma janela de 5 amostras (TAKAHASHI; KOIKE, 1976). Buscouse estabelecer a fundamentac¸a˜ o matem´atica destas medidas para a discriminac¸a˜ o de patologias e grupo de controle normal (DAVIS, 1979) e (KOIKE et al., 1977). O shimmer refere-se a uma perturbac¸a˜ o da frequˆencia fundamental relacionada a` amplitude da onda sonora ou a` intensidade da emiss˜ao vocal. O valor do shimmer e´ sens´ıvel a` reduc¸a˜ o da resistˆencia gl´otica e les˜oes de massa nas pregas vocais (WERTZNER et al., 2005). Pode-se ainda dizer que o shimmer mede a instabilidade da onda lar´ıngea, usualmente medida como a variac¸a˜ o na amplitude de ciclos sucessivos (SADER; HANAYAMA, 2004). A raz˜ao harmˆonico-ru´ıdo baseia-se no fato em que a onda ac´ustica de uma vogal sustentada consiste em um componente peri´odico e de um ru´ıdo branco. O ru´ıdo branco e´ aquele que possui sua potˆencia distribu´ıda de maneira uniforme no espectro da frequˆencia, possuem distribuic¸a˜ o gaussiana e valor m´edio nulo. Quando a raz˜ao harmˆonico-ru´ıdo e´ menor que 7,4dB, a voz e´ considerada como patol´ogica, baseada na distribuic¸a˜ o HNR para vozes normais (YUMOTO et al., 1982). Agora que as principais medidas ac´usticas j´a foram exploradas, ser˜ao descritos os m´etodos j´a utilizados para se encontrar uma patologia de laringe. Atualmente existem v´arias abordagens diferentes com o objetivo de identificar as patologias de laringe que analisam apenas os sinais de voz do paciente. Uma destas abordagens enfatiza a previsibilidade dos sinais de voz utilizando um m´etodo de decomposic¸a˜ o e a transformada wavelet.. A transformada wavelet pode ser. compreendida mais facilmente se imaginarmos que e´ uma modificac¸a˜ o da transformada de Fourier, diferenciando-se dela por fornecer resultados mais espec´ıficos, pois seus sinais possuem durac¸a˜ o finita e restrita no intervalo de uma janela. J´a no caso das transformadas de Fourier, o sinal padr˜ao s˜ao sen´oides que, pela teoria, tem durac¸a˜ o infinita no dom´ınio do tempo. Esta t´ecnica utiliza um banco de filtros que ir´a decompor o sinal de voz do paciente em v´arias bandas de frequˆencia diferentes para que cada parcela deste sinal possa ser melhor analisada. Posteriormente todas as parcelas dever˜ao reconstruir o sinal de voz original. Se a comparac¸a˜ o do sinal original com o reconstru´ıdo for perfeita, a an´alise cumpriu seu objetivo (SCALASSARA, 2009). A utilizac¸a˜ o da transformada wavelet mostrou-se bastante promissora visto que possui relac¸a˜ o direta com o aumento das perturbac¸o˜ es, ou seja, quanto maior o n´ıvel de perturbac¸o˜ es no sinal, menor ser´a a sua previsibilidade. Em outras palavras, ela mostrou-se sens´ıvel aos parˆametros de HNR (Relac¸a˜ o Harmˆonico-Ru´ıdo), jitter (perturbac¸a˜ o da frequˆencia do sinal) e shimmer (perturbac¸a˜ o da amplitude do sinal), parˆametros que rotineiramente mostram-se.

(22) 21. alterados quando vozes saud´aveis s˜ao comparadas a vozes patol´ogicas. Uma segunda abordagem capaz de distinguir as vozes saud´aveis das patol´ogicas utiliza uma variac¸a˜ o do conceito de entropia de Shannon, o conceito de Kullback-Leibler. Com ele e´ poss´ıvel encontrar uma entropia relativa de duas func¸o˜ es de densidade de probabilidade que seguem o modelo proposto por Parzen (SANTOS; SCALASSARA, 2012). Este m´etodo tamb´em mostrou-se eficiente por´em requer uma escolha adequada de parˆametros de gerac¸a˜ o da janela de Parzen. Outra abordagem e´ an´alise dos parˆametros do sinal de voz dos pacientes. Nesta abordagem os valores referentes a` frequˆencia fundamental, f0 , jitter e shimmer devem ser ˜ et al., 2011). Os autores apresentaram tabelas que previamente conhecidos (FRAZAO mostraram, de forma estat´ıstica, a influˆencia de cada um destes parˆametros em vozes categorizadas como saud´aveis ou que apresentem edema de Reinke (inchac¸o das pregas vocais verdadeiras causada por ac´umulo de l´ıquido em sua camada superficial), paralisia (podendo ser unilateral ou bilateral nas pregas vocais) ou tenham n´odulos vocais 2 (les˜oes benignas causadas pelo uso excessivo da vozes ou h´abitos vocais inadequados). Em outro trabalho, a Transformada Wavelet Discreta (DWT), os Coeficientes de Predic¸a˜ o Linear (LPC) e a utilizac¸a˜ o de M´aquinas de Vetores de Suporte por M´ınimos Quadrados (LS-SVM) foram t´ecnicas empregadas que apresentaram uma precis˜ao de 90% na classificac¸a˜ o (FONSECA, 2008). Um outro estudo tamb´em utilizou a Transformada Wavelet Packet, mas neste caso foi associado o algoritmo Best Basis, um m´etodo de selec¸a˜ o que encontra a melhor base de um conjunto de func¸o˜ es poss´ıveis (PARRAGA, 2002). Esse trabalho apresentou um erro de 23,07% na classificac¸a˜ o para falsos positivos e de 14,58% para os classificados como falsos negativos. Tamb´em houve estudos baseados na teoria n˜ao-linear, que utilizaram medidas ca´oticas para a classificac¸a˜ o dos sinais de voz em voz normal ou patol´ogica.. Nesse trabalho, o. classificador utilizado foi baseado em Redes Neurais. Por haver 2 bancos de vozes, houve dois tratamentos diferenciados: no primeiro banco haviam amostras de vozes normais e 3 n´ıveis de vozes patol´ogicas, o classificador obteve uma taxa de acerto de 82,47%, no segundo banco, haviam amostras classificadas somente em normais e patol´ogicas e o classificador obteve 99,69% (HENR´IQUEZ et al., 2009). Outro estudo valeu-se da t´ecnica de an´alise discriminante utilizando func¸o˜ es lineares e quadr´aticas, com validac¸a˜ o cruzada ao considerar um intervalo de 95% de confianc¸a. Nesse trabalho, ao serem combinadas medidas de an´alise n˜ao linear com medidas de quantificac¸a˜ o de recorrˆencia, a acur´acia encontrada foi acima de 94,75% na comparac¸a˜ o entre voz saud´avel.

(23) 22. e com edemas e entre saud´aveis e n´odulos, acima de 95,44% se comparadas vozes normais e patol´ogicas e 100% com as vozes normais comparadas a` s vozes com paralisia. Nesse mesmo estudo, foram utilizados vetores h´ıbridos formados por medidas de an´alise n˜ao linear, medidas de quantificac¸a˜ o de recorrˆencia e por an´alise preditiva linear encontrando taxas de acur´acia acima de 95% nas classificac¸o˜ es entre vozes com paralisia e com edemas; resultados acima de 97,9% se comparadas vozes com edema e com n´odulos e acima de 98.2% se comparadas vozes com paralisia e vozes com n´odulos (COSTA, 2012). A t´ecnica de an´alise de quantificac¸a˜ o de recorrˆencia tamb´em foi utilizada para avaliar os dist´urbios de voz. De um modo geral, esta t´ecnica consiste em uma an´alise subjetiva dos chamados gr´aficos de recorrˆencia aliada ao m´etodo de an´alise objetiva das medidas de quantificac¸a˜ o de recorrˆencia.. Um gr´afico de recorrˆencia e´ um gr´afico bidimensional,. representados por uma matriz quadrada de ordem N, preenchida por pontos pretos, chamados de ponto recorrente, que s˜ao coordenadas i e j em que a distˆancia entre o estado corrente do sistema e o estado a ser comparado e´ menor que o raio, previamente estabelecido, no centro do estado corrente, e por pontos brancos onde esta distˆancia e´ maior que este raio. Atrav´es destes gr´aficos, e´ poss´ıvel avaliar o comportamento de sistemas dinˆamicos unidimensionais ou multidimensionais, pois eles revelam as propriedades dinˆamicas destes sistemas, ou seja, ele mostra se h´a ou n˜ao um retorno do sistema analisado na trajet´oria do espac¸o de fase (VIEIRA, 2014). Para o presente trabalho foi utilizado o m´aximo de patologias e informac¸o˜ es dispon´ıveis no banco de dados utilizado.. N˜ao houve crit´erios que separasse grupos de. determinadas patologias, ou determinadas medidas ac´usticas. O resultado foi um total de 957 vozes discriminadas dentre 23 tipos diferentes de patologias, onde foram utilizadas 19 medidas ac´usticas fornecidas pelo pr´oprio banco de dados, nenhuma medida ac´ustica foi criada. 1.4 1.4.1. OBJETIVOS OBJETIVO GERAL Este trabalho tem como objetivo minimizar o desconforto dos pacientes que tiverem. que fazer o exame de videolaringoscopia identificando um m´etodo robusto, alternativo e n˜ao invasivo de se classificar uma voz patol´ogica. Al´em disso pretende-se propor uma ideia onde possa ser utilizado um m´etodo alternativo no setor de endoscopia per-oral do Hospital de Cl´ınicas da UFPR como forma de otimizar o atendimento aos pacientes vindos da comunidade..

(24) 23. OBJETIVOS ESPEC´IFICOS. 1.4.2. Pretende-se definir um m´etodo que consiga identificar, por meio da extrac¸a˜ o de caracter´ısticas intr´ınsecas dos sinais de voz do paciente, se este e´ portador de alguma patologia de laringe e, se poss´ıvel, classificar dentre as v´arias doenc¸as existentes, qual o aflige. Ser´a utilizado um banco de dados de vozes patol´ogicas fornecidos pela Kay Elemetrics Corporation e que foi disponibilizado em 1994 para que a comunidade cient´ıfica pudesse utiliz´a-lo em seus estudos. O principal objetivo de se utilizar este banco de dados e´ ter meios de comparac¸a˜ o de resultados, visto que ele foi largamente utilizado em outros trabalhos. Assim a robustez dos dois classificadores que ser˜ao usados pode ser analisada e comparada, podendo reconhecer qual deles, MVS (M´aquinas de Vetores Suporte) ou RNA (Redes Neurais Artificiais), e´ o mais confi´avel. 1.5. ˜ DO TRABALHO ORGANIZAC¸AO Este trabalho est´a dividido em 8 cap´ıtulos. Neste primeiro cap´ıtulo apresentou-se uma. introduc¸a˜ o acerca dos assuntos que ser˜ao abordados em todo o restante do estudo. No cap´ıtulo 2 h´a uma descric¸a˜ o simplificada de como funciona a voz humana; em seguida e´ mostrado um pouco da anatomia da laringe, principal o´ rg˜ao respons´avel pela voz, como as suas cartilagens e m´usculos. Depois s˜ao explicados alguns passos comuns que a literatura indica aos fonoaudi´ologos ou m´edicos otorrinolaringologistas para uma melhor compreens˜ao dos sintomas e melhor assertividade no diagn´ostico no tratamento de pacientes e por fim s˜ao listadas algumas patologias de laringe que foram identificadas no banco de vozes analisado. No cap´ıtulo 3 s˜ao descritas as medidas ac´usticas contidas no banco de dados utilizado, para uma melhor compreens˜ao do que foi observado no momento em que este banco foi criado e os resultados que foram obtidos por este estudo. O cap´ıtulo 4 descreve os dois classificadores utilizados neste estudo: o primeiro classificador e´ baseado nas Redes Neurais Artificiais de M´ultiplas Camadas Perceptron, enquanto que o segundo classificador utilizado foram as M´aquinas de Vetores de Suporte. No cap´ıtulo 5 os materias e m´etodos s˜ao descritos. Aqui o banco de dados utilizado no trabalho e´ descrito, bem como os m´etodos propostos para uso de cada um dos classificadores usados. O cap´ıtulo 6 mostrar´a os resultados encontrados para cada um dos m´etodos, levando.

(25) 24. em considerac¸a˜ o a associac¸a˜ o feita ao classificador. No cap´ıtulo 7 e´ mostrada a discuss˜ao acerca dos resultados encontrados. Uma an´alise comparativa entre os m´etodos propostos e entre os classificadores apresentados. O cap´ıtulo 8 discorrer´a acerca da conclus˜ao deste trabalho, avaliando os problemas enfrentados, sugerindo alternativas aos que n˜ao puderam ser sanados neste estudo e os pontos fortes encontrados no decorrer das an´alises, testes e resultados..

(26) 25. 2. LARINGE E PATOLOGIAS. Este cap´ıtulo descreve inicialmente a anatomia e fisiologia da laringe para ajudar na compreens˜ao dos elementos envolvidos na produc¸a˜ o de fala e indicar como alterac¸o˜ es nesses elementos podem afetar a voz produzida.. 2.1. A VOZ HUMANA Os sons do ponto de vista da f´ısica s˜ao ondas mecˆanicas e longitudinais que se. propagam atrav´es de um meio f´ısico; por´em, quando este som refere-se a` capacidade humana de se comunicar, este conceito passa a ser muito mais complexo. Raymond H. Stetson, um dos primeiros estudiosos da fala, descreveu a fala como “speech is movement made audible” que significa “fala e´ movimento tornado aud´ıvel” (KENT; READ, 2015). O o´ rg˜ao respons´avel pela emiss˜ao de sons e´ a laringe e essa e´ a func¸a˜ o mais complexa e especializada deste o´ rg˜ao (ROSEN; SIMPSON, 2008). A figura 3 mostra, a` esquerda, uma ilustrac¸a˜ o da Laringe com uma vis˜ao posterior e ao lado a laringe com uma vis˜ao em corte sagital.. Figura 3: Ilustrac¸a˜ o da Laringe: (a) Vis˜ao anterior da laringe; (b) Corte sagital da vis˜ao posterior da laringe. (ZAGALO, 2015)..

(27) 26. A laringe e´ constitu´ıda de m´usculos que possuem formatos de dobras e s˜ao cobertos por membranas mucosas. Estes m´usculos s˜ao chamados de pregas vocais e o espac¸o que h´a entre as pregas vocais chama-se glote. Quando se est´a respirando, as pregas vocais s˜ao abertas para que o ar passe da melhor maneira poss´ıvel; j´a no processo de fala, as pregas vocais se fecham e iniciam um processo de vibrac¸a˜ o. A figura 4 mostra um ciclo vibrat´orio das pregas vocais capturados por meio de um estrobosc´opio.. Figura 4: A figura mostra um ciclo vibrat´orio das pregas vocais capturado por estrobosc´opio. Figura retirada de (ROSEN; SIMPSON, 2008). As pregas vocais originam-se na superf´ıcie posterior da cartilagem da tire´oide (glˆandula end´ocrina situada na frente da laringe, respons´avel pela secrec¸a˜ o dos hormˆonios tireo´ıdeos e sob controle da hip´ofise), que fica pr´oximo ao chamado pomo de Ad˜ao, passa pela parte posterior e se conecta a` s cartilagens ariten´oides. Enquanto nas crianc¸as metade do comprimento das pregas vocais e´ membranoso, nos adultos a parte membranosa representa dois terc¸os de seu comprimento total. Cada prega vocal e´ constitu´ıda, em sua parte anterior, de um componente membranoso que e´ envolvido principalmente na fonac¸a˜ o, e, na parte posterior, de um componente cartilaginoso envolvido principalmente na respirac¸a˜ o. Portanto, dependendo da localizac¸a˜ o de uma patologia nas pregas vocais, ela pode interferir na parte fonat´oria e/ou na respirac¸a˜ o. A laringe possui cinco m´usculos intr´ınsecos pareados a ela que s˜ao respons´aveis pela alterac¸a˜ o do comprimento, da tens˜ao, da forma e da posic¸a˜ o espacial das pregas vocais. De modo tradicional, h´a trˆes m´usculos que s˜ao categorizados como adutores (ou seja, aqueles.

(28) 27. respons´aveis pela aproximac¸a˜ o das pregas vocais) e um abdutor (respons´avel pelo afastamento das pregas vocais e um m´usculo tensor). Os m´usculos adutores s˜ao:. o m´usculo lateral cricoariten´oideo, o m´usculo. tireoariten´oideo e o m´usculo interariten´oide. O m´usculo abdutor e´ o m´usculo cricoariten´oideo posterior. J´a o m´usculo tensor e´ o m´usculo cricotire´oideo. A figura 5 mostra as estruturas neuromusculares da laringe.. Figura 5: A ilustrac¸a˜ o mostra as estruturas neuromusculares principais presentes na laringe. Figura retirada de (ROSEN; SIMPSON, 2008). O m´usculo cricoariten´oideo lateral quando contra´ıdo resulta em um movimento do processo anterolateral muscular, ao mesmo tempo que forc¸a o processo vocal e o baixo medial. Como resultado tem-se a aduc¸a˜ o e o alongamento das pregas vocais. Este m´usculo e´ executado lateralmente e, na maior parte das vezes, paralelamente com o m´usculo tireoariten´oideo. O m´usculo tireoariten´oideo consiste em duas curvaturas musculares: uma interna e outra externa. As contrac¸o˜ es de suas partes externas fazem com que o processo vocal seja trazido mais pr´oxima da comissura anterior fazendo com que as pregas vocais sejam encurtadas e aduzidas. De outro lado, se as contrac¸o˜ es forem feitas a partir de suas partes internas, as pregas vocais ser˜ao encurtadas e tornam-se mais espessas reduzindo as frequˆencias de ressonˆancia da laringe. Esta parte do m´usculo tireoariten´oideo tamb´em e´ conhecido como m´usculo vocal. O m´usculo interariten´oideo e´ constitu´ıdo de fibras transversais e obl´ıquas. A contrac¸a˜ o deste m´usculo gera uma aduc¸a˜ o ariten´oide, o fechamento da glote posterior e o estreitamento da abertura da laringe..

(29) 28. O m´usculo posterior cricoariten´oideo quando contra´ıdo, desloca o processo muscular posteriormente e caudal fazendo com que o processo vocal mova-se para cima e de forma lateral, tendo como resultado a abduc¸a˜ o. Este e´ o u´ nico m´usculo abdutor das pregas vocais e o principal respons´avel pela via a´erea gl´otica. O m´usculo cricorite´oideo e´ um tensor da laringe. Ele e´ composto por duas curvaturas musculares separadas. Quando contra´ıdas, estas curvaturas afetam o movimento na articulac¸a˜ o cricotire´oidea. Durante a contrac¸a˜ o, o espac¸o cricotire´oideo e´ estreitado, enquanto a lˆamina posterior e as articulac¸o˜ es cricoariten´oideas s˜ao forc¸adas, resultando em um alongamento, um aperto e um estreitamento das pregas vocais, aumentando a frequˆencia de ressonˆancia, resultando em uma aduc¸a˜ o das pregas vocais (ROSEN; SIMPSON, 2008).. Figura 6: A ilustrac¸a˜ o mostra as estruturas cartilaginosas e fibrel´asticas principais presentes na laringe. Figura retirada de (ROSEN; SIMPSON, 2008). Do ponto de vista histol´ogico, que avalia a composic¸a˜ o e func¸a˜ o dos tecidos vivos, as pregas vocais s˜ao constitu´ıdas de cinco camadas diferentes. A figura 6 mostra a estrutura cartilaginosa e da laringe. A camada mais externa constitui-se de um epit´elio escamoso fino e r´ıgido que e´ respons´avel por manter a forma das pregas vocais. A segunda camada e´ chamada de camada superficial da lˆamina pr´opria, ou espac¸o de Reinke, e e´ composta por uma matriz fibrosa solta com consistˆencia gelatinosa mole. A terceira camada e´ a camada intermedi´aria da lˆamina pr´opria e e´ composta principalmente de tecido el´astico. A quarta camada e´ chamada de.

(30) 29. camada profunda da lˆamina pr´opria e e´ composta de fibras de col´ageno mais densas que agem como um feixe que recobre o m´usculo vocal. A quinta camada compreende o m´usculo vocal (LUNDY; CASIANO, 1999). H´a dois tipos diferentes de cartilagens encontradas na laringe, as hialinas e as el´asticas. Enquanto que as primeiras podem sofrer processo de calcificac¸a˜ o com o passar do tempo, as el´asticas n˜ao se calcificam. A partir dessas definic¸o˜ es anatˆomicas e fisiol´ogicas, tratar-se-´a do funcionamento da laringe. A figura 7 mostra de forma simplificada como e´ o caminho do ar at´e ser transformado em voz, enquanto a figura 8 mostra uma ilustrac¸a˜ o de uma secc¸a˜ o sagital m´edia do aparelho vocal.. Figura 7: Foto esquem´atica que mostra o mecanismo da fala humana de forma simplificada (FRIAN, 2012).. Figura 8: A ilustrac¸a˜ o mostra o trato vocal atrav´es de uma secc¸a˜ o sagital m´edia (MAIA, 2009).. No momento em que h´a somente a respirac¸a˜ o, as pregas vocais s˜ao bastante separadas.

(31) 30. facilitando a passagem de ar e ficando com um formato triangular. J´a no momento em que h´a a produc¸a˜ o da fala, estas pregas se aproximam umas das outras. A figura 9 ilustra, de modo simples este mecanismo.. Figura 9: A ilustrac¸a˜ o mostra uma laringe normal quando aberta, somente respirac¸a˜ o, e como fica quando fechada, produzindo sons (FRIAN, 2012).. Isso ocorre porque elas s˜ao tracionadas pelos m´usculos estriados presentes no local. O ar proveniente do pulm˜ao aumenta a press˜ao no local forc¸ando as pregas a se abrirem. Neste momento a relac¸a˜ o de forc¸as (el´astica dos tecidos da laringe e aerodinˆamica do ar) gera uma complexa vibrac¸a˜ o e uma frequˆencia fundamental e´ formada. Esta frequˆencia fundamental depende do tamanho das pregas vocais e variam conforme descrito na figura 10. De acordo com a figura, as crianc¸as, por possu´ırem pregas menores, possuem vozes mais agudas, ou seja, uma frequˆencia mais alta, em m´edia acima de 250Hz. Em seguida est˜ao as mulheres com frequˆencias que est˜ao na faixa entre 150Hz a 250Hz. Por u´ ltimo est˜ao os homens, que possuem as maiores pregas vocais e, portanto possuem frequˆencia menores que podem alcanc¸ar at´e 150Hz em m´edia. Por´em, se todo o restante do sistema fonat´orio pudesse ser isolado e somente o som produzido pela passagem do fluxo de ar dos pulm˜oes pela laringe pudesse ser ouvido, este som seria praticamente inaud´ıvel. O que faz com que o som gerado seja amplificado e modulado tornando-os intelig´ıveis e aud´ıveis aos ouvidos humanos, e´ um conjunto de cavidades da pr´opria laringe em conjunto com as narinas, os seios paranasais e a boca, aliando assim a articulac¸a˜ o e a ressonˆancia para compor a fonac¸a˜ o. Al´em de todo este conjunto, para a produc¸a˜ o adequada do som v´arias estruturas mecˆanicas devem ser acionadas ao mesmo tempo. Com exemplo podemos citar uma respirac¸a˜ o adequada, que e´ essencial haver uma press˜ao subgl´otica suficientemente forte nos pulm˜oes que consigam gerar uma forc¸a capaz de romper a forc¸a el´astica das pregas vocais. Outro exemplo e´ o adequado controle das musculaturas da laringe que devem produzir, al´em do fechamento da glote, a correta tens˜ao das pregas vocais e o seu tempo de abertura. Ou ainda a capacidade favor´avel de vibrar e flexionar os tecidos das pregas vocais. Uma vez que sejam atendidas tais.

(32) 31. Figura 10: A figura mostra a frequˆencia m´edia da voz humana relacionada a` idade e ao sexo. Quanto maior a prega vocal, mais grave e´ o som produzido pela sua fala (FRANCESCO, 2012).. condic¸o˜ es, o som e´ gerado adequadamente a partir da vibrac¸a˜ o das pregas vocais. A passagem do fluxo de ar proveniente dos pulm˜oes, gerando uma press˜ao subgl´otica suficientemente forte e capaz de vibrar as pregas vocais e´ demonstrada na ilustrac¸a˜ o 11. Conforme a ilustrac¸a˜ o, pode-se identificar 8 passos que completam o ciclo de uma passagem de som pelas pregas vocais (ROSEN; SIMPSON, 2008): 1. As pregas vocais est˜ao completamente fechadas, por´em h´a um aumento da press˜ao subgl´otica, representada pela seta; 2. Os l´abios inferiores comec¸am a se separar devido ao aumento da press˜ao subgl´otica; 3. Com o cont´ınuo aumento da press˜ao, apenas os l´abios superiores est˜ao em contato. Este e´ o limiar do bloqueio da passagem de ar pelas pregas vocais; 4. Um sopro de ar e´ liberado atrav´es das pregas vocais que, neste momento est˜ao completamente separadas; 5. O fluxo de ar neste ponto e´ m´aximo. 6. Os l´abios inferiores das pregas vocais iniciam seu fechamento devido a` s forc¸as de Bernoulli associadas a` s forc¸as de recolhimento el´astico. 7. O fluxo de ar e´ reduzido, e os bordos inferiores s˜ao completamente aproximadas..

(33) 32. Figura 11: Ilustrac¸a˜ o da propagac¸a˜ o da onda de ar proveniente dos pulm˜oes, passando atrav´es das pregas voc´alicas (ROSEN; SIMPSON, 2008).. 8. O fluxo de ar volta a ser interrompido devido ao fechamento das pregas vocais. Ondas sonoras produzidas pelas pregas vocais passam atrav´es de v´arias cavidades da faringe, oral e nasal, que alteram o som da onda que e´ emitido. As cavidades da faringe e nasal s˜ao fixas para cada indiv´ıduo e em grande parte moldam o som da voz. Elas n˜ao podem ser mudadas voluntariamente, mas um edema (inchac¸o) dos tecidos devido a uma inflamac¸a˜ o podem causar mudanc¸as na voz. Mudanc¸as na forma da cavidade oral atrav´es de movimentos da l´ıngua, maxila, palato mole e bochechas determinam sons espec´ıficos que s˜ao emitidos. A l´ıngua, palato e bochechas em particular, selecionam os sons desejados contidos na complexa onda peri´odica que e´ a voz..

(34) 33. 3. PATOLOGIAS DE LARINGE. Antes de serem descritos os dist´urbios que afetam a voz, cabe uma breve explicac¸a˜ o sobre sua percepc¸a˜ o. De uma forma mais abrangente, pode-se dizer que qualquer alterac¸a˜ o do sistema produtor da voz cujo resultado n˜ao seja o satisfat´orio ao paciente, pode ser considerado um dist´urbio de voz. V´arios s˜ao os sintomas descritos mas alguns deles podem ser (NYEE, 2015): • Rouquid˜ao ou alterac¸a˜ o no tom, no timbre ou na qualidade da voz; • Fadiga vocal; • Falha ao se falar ou ao se cantar; • Dificuldade de alterar tons na fala ou no canto; • Desconforto ou sensac¸a˜ o de queimac¸a˜ o na garganta; • Sensac¸a˜ o que h´a alguma coisa parada na garganta; • Dificuldade em tornar a voz mais forte ou mais suave; • Falta de ar enquanto fala; • Voz trˆemula ou in´ıcios e paradas abruptas de voz que o paciente tenha dificuldade em controlar • Percepc¸a˜ o de ser necess´ario tossir ou limpar a garganta frequentemente; • Sensac¸a˜ o de aperto, desconforto ou uma queimac¸a˜ o na garganta. V´arios aspectos externos a` laringe podem resultar em uma disfonia afetando as pregas vocais; portanto, al´em dos exames f´ısicos faz-se necess´ario o levantamento do hist´orico vocal do paciente.. Isso porque, somente com o exame f´ısico, mesmo utilizando instrumentos. sofisticados, a resposta que o m´edico procura nem sempre e´ direta. Com isso, as informac¸o˜ es.

Referências

Documentos relacionados

5 “A Teoria Pura do Direito é uma teoria do Direito positivo – do Direito positivo em geral, não de uma ordem jurídica especial” (KELSEN, Teoria pura do direito, p..

nesta nossa modesta obra O sonho e os sonhos analisa- mos o sono e sua importância para o corpo e sobretudo para a alma que, nas horas de repouso da matéria, liberta-se parcialmente

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do

Neste momento a vacina com a melhor perspetiva de disseminação pelos cuidados de saúde é a M.vaccae, pela sua ação como vacina terapêutica, aguardando-se a sua

Considerando-se que o trabalho de Coordenação Pedagógica revela complexidades pró- prias que, num contexto prático, posiciona o profissional perante a validação de registros de

Desta forma, foram criadas as seguintes hipóteses de investigação: H1 – O compromisso organizacional e o engagement são diferentes para as categorias dos militares dos

Neste estudo foram estipulados os seguintes objec- tivos: (a) identifi car as dimensões do desenvolvimento vocacional (convicção vocacional, cooperação vocacio- nal,

A Ética Resolvendo Conflito Entre Direito e Moral Nesse outro estágio percebe-se que a eticidade contempla um Estado em que suas leis não são sentidas como mera coerção ao