Exemplo Formatação TCCI2(Sem 1-16 - Fagner Bruce de Lima)

(1)

UNIVERSIDADE DO ESTADO DO AMAZONAS - UEA ESCOLA SUPERIOR DE TECNOLOGIA - EST

FAGNER BRUCE DE LIMA

SELEÇÃO DE SINAIS DE ÁUDIO POR ANÁLISE DE FREQUÊNCIA E APLICAÇÃO DE FILTROS DIGITAIS

Manaus 2016

(2)

FAGNER BRUCE DE LIMA

SELEÇÃO DE SINAIS DE ÁUDIO POR ANÁLISE DE FREQUÊNCIA E APLICAÇÃO DE FILTROS DIGITAIS

Projeto de pesquisa desenvolvido durante a disciplina de Trabalho de Conclusão de Curso II e apresentada à banca avaliadora do Curso de Engenharia Elétrica da Escola Superior de Tecnologia da Universidade do Estado do Amazonas, como pré-requisito para obtenção do título de Engenheiro Eletricista.

Orientador: Wheidima Carneiro de Melo

Manaus 2016

(3)

Universidade do Estado do Amazonas – UEA Escola Superior de Tecnologia - EST

Reitor:

Cleinaldo de Almeida Costa

Vice-Reitor:

Mario Augusto Bessa de Figueiredo

Diretor da Escola Superior de Tecnologia:

Roberto Higino Pereira da Silva

Coordenador do Curso de Engenharia Elétrica:

Cláudio Gonçalves

Banca Avaliadora composta por: Data da defesa: 14/ 06/ 2016.

Prof. Wheidima Carneiro de Melo (Orientador) Prof. Cláudio Gonçalves

Prof. Jozias Parente de Oliveira

CIP – Catalogação na Publicação

Lima, Fagner Bruce de

Seleção de sinais de áudio por análise de frequência e aplicação de filtros digitais / Fagner Bruce de Lima; [orientado por] Wheidima Carneiro de Melo. – Manaus: 2016.

61 f. p.: il.

Trabalho de Conclusão de Curso (Graduação em Engenharia Elétrica). Universidade do Estado do Amazonas, 2016.

1. Processamento Digital de Sinais 2. Filtros Digitais FIR 3. Filtros Digitais IIR

I. Carneiro de Melo, Wheidima.

(4)

FAGNER BRUCE DE LIMA

SELEÇÃO DE SINAIS DE ÁUDIO POR ANÁLISE DE FREQUÊNCIA E APLICAÇÃO DE FILTROS DIGITAIS

Pesquisa desenvolvida durante a disciplina de Trabalho de Conclusão de Curso II e apresentada à banca avaliadora do Curso de Engenharia Elétrica da Escola Superior de Tecnologia da Universidade Estadual do Amazonas, como pré-requisito para a obtenção do título de Engenheiro Eletricista.

Nota obtida: _____ (____________________________________)

Aprovada em 14/ 06/ 2016

Área de concentração: Processamento Digital de Sinais

BANCA EXAMINADORA

_________________________________ Orientador: Wheidima Carneiro de Melo, Mr.

_________________________________ Avaliador: Cláudio Gonçalves, Dr.

________________________________ Avaliador: Jozias Parente de Oliveira, Dr.

(5)

Dedicatória

Dedico este trabalho a todos que se interessam pelo aprendizado e pela obtenção de conhecimento. Aos que se inclinam pelo estudo de Processamento Digital de Sinais. Aos que gostam de Matemática.

(6)

Agradecimentos

A Deus por tudo, tudo. A minha família que sempre me apoiou, alegrou, incentivou e

cativou bondosamente, cuidando e

observando. Aos amigos pela amizade verdadeira. Ao meu orientador pela

paciência, bons direcionamentos e

incentivo. Ao professor da disciplina de TCC pelas instruções de formatação do trabalho escrito.

(7)

“O estudo aprofundado da natureza é a

fonte mais fecunda das descobertas matemáticas”

(8)

RESUMO

O presente trabalho está dividido em quatro seções primárias: referencial teórico, metodologia, implementação e referencial teórico. A primeira seção apresenta uma revisão dos assuntos de interesse para o desenvolvimento deste trabalho, os quais sejam: propagação das ondas sonoras e a faixa de frequência dos ouvidos humanos, para saber como se comporta o som e quais seus aspectos importantes; sinais em tempo discreto, que descreve o processo de discretização do sinal em tempo contínuo; séries e transformadas de Fourier, para se ter conhecimento de como os sinais são transformados para o domínio da frequência; filtros digitais não-recursivos; filtros digitais recursivos, essa subseção juntamente com a anterior serve para dar a ideia de como separar um sinal específico de um sinal superposto; linguagem matlab para desenvolvimento dos algoritmos apresentados nos apêndices A e B e entendimento do que está no anexo A; trabalhos anteriores que apresenta os dois principais estudos usados como guias para elaboração deste trabalho. A segunda seção é a metodologia na qual estão as etapas e materiais necessários à criação do algoritmo de seleção de sinais de áudio. A terceira seção é a implementação que faz execução dos passos propostos na metodologia. A quarta seção é a análise e interpretação dos resultados, na qual se faz descrição dos comportamentos observados dos resultados obtidos por meio do programa. Ao final é colocada a conclusão, nela define-se que o método de separação só é perfeitamente aplicável a áudios cujos espectros em amplitude possuem faixas perfeitamente distintas.

Palavras-chave:

séries e transformadas de Fourier – filtros digitais não-recursivos – filtros digitais recursivos

(9)

ABSTRACT

This work is divided into four primary sections: theoretical framework, methodology, implementation and theoretical framework. The first section provides a review of the issues of interest for the development of this work, which are: propagation of sound waves and the frequency range of the human ear, to know how the sound and what important aspects; discrete-time signals, which describes the discretization process continuous-discrete-time signal; series and Fourier Transforms, to have knowledge of how the signals are transformed to the frequency domain; non-recursive digital filters; recursive digital filters, this subsection along with the previous serves to give the idea of how to separate a specific signal to a signal superimposed; matlab language for development of the algorithms presented in Appendices A and B and understanding of what is in Annex A; previous work that presents the two main studies used as guides for the preparation of this work. The second section is the methodology on what are the steps and materials needed for the creation of the selection algorithm of audio signals. The third section is the implementation that makes execution of the steps proposed in the methodology. The fourth section is the analysis and interpretation of the results, in which description of the observed behaviors of the results obtained through the program. The end is placed the completion, it defines that only separation method is perfectly applicable to audios whose amplitude spectra have tracks perfectly distinct.

Keywords:

series and Fourier transforms-non-recursive digital filters – recursive digital filters

(10)

SUMÁRIO

INTRODUÇÃO ... 11

1 REFERENCIAL TEÓRICO ... 13

1.1 PROPAGAÇÃO DAS ONDAS SONORAS E A FAIXA DE FREQUÊNCIA DOS OUVIDOS HUMANOS ... 13

1.1.1 Potência, Intensidade e Decibéis ... 14

1.1.2 Princípio da Superposição ... 15

1.2 SINAIS EM TEMPO DISCRETO ... 15

1.3 SÉRIES E TRANSFORMADAS DE FOURIER ... 17

1.3.1 Séries de Fourier em Tempo Discreto ... 17

1.3.2 Transformada de Fourier em Tempo Discreto ... 20

1.4 FILTROS DIGITAIS NÃO-RECURSIVOS ... 21

1.4.1 Forma direta, cascata e com fase linear ... 22

1.5 FILTROS DIGITAIS RECURSIVOS ... 23

1.6 LINGUAGEM MATLAB ... 24

1.7 TRABALHOS ANTERIORES ... 25

2 METODOLOGIA ... 26

2.1 DESENVOLVIMENTO DO ALGORITMO ... 27

2.2.1 Primeira parte do algoritmo: programa principal ... 27

2.2.2 Segunda parte do algoritmo: soma dos áudios ... 29

2.2.3 Terceira parte do algoritmo: filtragem e plotagem dos espectros de magnitude ... 30

3 IMPLEMENTAÇÃO ... 32

3.1 AQUISIÇÃO DOS ARQUIVOS DE ÁUDIO ... 33

3.2 PLOTAGEM DE SINAIS DE ÁUDIO NO DOMÍNIO DO TEMPO ... 34

3.3 PLOTAGEM DE SINAIS DE ÁUDIO SUPERPOSTOS NO DOMÍNIO DO TEMPO ... 35

3.4 ESPECTRO DOS SINAIS DE ÁUDIO E DA SUPERPOSIÇÃO ... 35

3.5 ESPECÍFICAÇÕES DAS FREQUÊNCIAS DE FILTROS ... 35

3.6 FILTRAGEM NO DOMÍNIO DA FREQUÊNCIA E DO TEMPO DOS SINAIS DE ÁUDIO ... 37

4 ANÁLISE E INTEPRETAÇÃO DOS RESULTADOS ... 38

CONCLUSÃO ... 41

REFERÊNCIAS BIBLIOGRÁFICAS ... 43

OBRAS CONSULTADAS ... 44

APÊNDICE A – PRIMEIRA PARTE DO ALGORITMO ... 45

APÊNDICE B – TERCEIRA PARTE DO ALGORITMO ... 48

APÊNDICE C – SINAIS DE ÁUDIO DOS GRUPOS 1, 2 E 3 ... 50

(11)

APÊNDICE E – ESPECTROS DOS SINAIS DE ÁUDIO ... 54

APÊNDICE F – ESPECTROS FILTRADOS DOS SINAIS ... 57

APÊNDICE G – SINAIS DE ÁUDIO FILTRADOS E ORIGINAIS ... 60

(12)

11

INTRODUÇÃO

O tema deste trabalho é seleção de sinais de áudio por análise de frequência e aplicação de filtros digitais. Sabe-se que as variáveis analógicas descrevem a maioria dos fenômenos naturais, como o som, porém não é possível manipular sinais analógicos nos sistemas computacionais, por isso esses sinais são convertidos em equivalentes digitais. O problema a ser abordado decorre da incapacidade dos sistemas não conseguirem, por si só, fazer a distinção de um sinal específico de áudio se a fonte de aquisição consistir de uma superposição de sons. É preciso, assim, aplicar um método de isolamento do sinal, quando for misturado a outros sons. Este trabalho tem por hipótese a ideia de que é possível realizar a separação de sinais de áudio fazendo uma análise de sua representação no espectro de amplitudes, com a aplicação de filtros digitais. O presente trabalho tem como objetivo a criação de um algoritmo que possibilite a manipulação de arquivos de áudio, realizando a simulação da superposição deles, obtendo seu espectro de amplitudes e também o espectro de cada áudio para projetar os filtros digitais. Depois de projetados, esses serão aplicados à superposição para obter o áudio que se deseja selecionar, o algoritmo servirá para testará, portanto, a hipótese.

A justificativa é o aprofundamento nas disciplinas do curso de engenharia elétrica. Principalmente: Física, Sinais e Sistemas, Processamento Digital de Sinais e Linguagem de Programação. Também, justifica-se este trabalho, pela implementação de uma ferramenta útil que separará um sinal de outros que não são de interesse. Ajudando, por exemplo, a obter de um áudio cheio de ruídos, conteúdos de interesse como um estudo, uma palestra ou uma música.

Será feita uma revisão teórica que abrangerá os seguintes assuntos: Propagação das ondas sonoras e a faixa de frequência dos ouvidos humanos; Sinais em Tempo Discreto Série e Transformadas de Fourier em Tempo Discreto; Filtros Digitais Não-Recursivos (IIR); Filtros Digitais Recursivos (FIR) e Linguagem Matlab. Estes assuntos estão no breve resumo a seguir.

Este trabalho está divido em quatro seções primárias citadas a seguir: Referencial Teórico; Metodologia; Implementação e Análise e Interpretação dos Resultados.

A primeira seção está destinada ao Referencial Teórico, a qual consiste na revisão dos assuntos citados acima. A propagação das ondas sonoras e a faixa de frequência dos ouvidos humanos para entender como são produzidos os sons, quais características pode-se utilizar para obter o algoritmo. Os sinais em tempo discreto para saber como são obtidos dos sinais de tempo contínuo. As séries e transformadas para entender como representar um sinal discreto no domínio da frequência. Os filtros digitais para ter conhecimento de como retirar as componentes do áudio. A linguagem matlab para criar o algoritmo utilizando bons recursos e ferramentas.

(13)

12

A última subseção do referencial teórico está destinada a trabalhos anteriores que serviram de base e exemplo no uso de ferramenta e no modo de avaliação da separação dos sinais de áudio. A segunda seção é a metodologia, nela serão descritas as etapas para construção do algoritmo; qual o tipo de pesquisa realizada, qual material de estudo, qual método foi utilizado, quais os procedimentos técnicos, quais os materiais foram utilizados, como eles foram obtidos, quais as etapas foram seguidas para o desenvolvimento do algoritmo, como está divido, como foram manipulados os áudios em separados e a sua superposição, a construção dos filtros, como foram gerados os gráficos, tanto no domínio do tempo, quanto no domínio da frequência.

A terceira seção está destinada à implementação, nela descreve-se a execução dos passos da metodologia. Os gráficos obtidos na implementação serão mostrados em apêndices, assim como o conjunto de algoritmos, com exceção de uma parte dele que se encontra no anexo A.

A quarta seção está destinada a análise e interpretação dos resultados, onde serão descritas as informações sobre as faixas de frequências escolhidas, qual filtro possibilitou um resultado mais rápido. Elas são apresentadas em uma análise de cada dos grupos de áudio formado. Por fim, apresenta-se a conclusão, nela é feita uma relação entre o que foi predefinido e o que se obteve, em resumo revela que o método de separação só é perfeitamente aplicável a áudios cujos espectros em amplitude possuem faixas perfeitamente distintas.

(14)

13

1 REFERENCIAL TEÓRICO

Nesta seção será feita uma revisão dos assuntos relacionados ao tema deste trabalho. Esses assuntos reproduzem o conteúdo de disciplinas de Física, Sinais e Sistemas e Processamento Digital de Sinais. Essa revisão servirá de auxílio para entender o conteúdo da seção seguinte.

1.1 PROPAGAÇÃO DAS ONDAS SONORAS E A FAIXA DE FREQUÊNCIA DOS OUVIDOS HUMANOS

As ondas sonoras podem se propagar através dos gases, líquidos e sólidos. A propagação é iniciada por uma fonte que gera o som, no princípio ela empurra as moléculas do meio e as moléculas empurradas aproximam-se das outras que estão mais à frete. Com efeito, isso cria uma região de alta pressão, a qual é chamada de zona de compressão, pois as partículas estão sendo comprimidas pela força imposta pela fonte, desse modo elas ficam mais próximas.

A fonte pode, ainda, atrair moléculas para perto por um processo de atração o que produz uma região com poucas moléculas onde estas se encontravam originalmente. Essa região é chamada de zona de rarefação. Quando os movimentos, em que as moléculas são empurradas e atraídas, se repetem criam-se as condições para a propagação da onda. Esse fenômeno, é empregado nos sistemas de comunicações devido a técnicas sofisticadas. A Figura 1 ilustra as ideias anteriores.

Figura 1 - Alto-falante produzindo onda sonora

Fonte: Elaborada pelo autor

A onda sonora é uma onda mecânica. Assim, ela só pode se deslocar através de um meio material. As propriedades do meio determinam a velocidade com que a onda se desloca. Para especificar melhor, a temperatura e a massa molecular do meio influenciam diretamente na velocidade. As medições realizadas à temperatura ambiente (20ºC) para o ar, definem a velocidade do som em 343m/s. Se a temperatura for maior, então as moléculas se movimentarão

c v c_v c v c v c v c v c v c v

Zona de compressão Zona de rarefação

(15)

14 mais rapidamente e o som se propagará mais rápido. Caso a temperatura seja menor as moléculas levarão mais tempo para se movimentar e a propagação será mais lenta.

Os ouvidos humanos podem ouvir ondas sonoras senoidais com frequência entre 20Hz e 20kHz. Estas frequências produzem formas diferentes com que se percebe o som. Sons com frequências até 20Hz são considerados de tom subgrave, como o do trovão. Entre 20Hz e 300Hz os sons são classificados como de tom grave, como o do contrabaixo. A faixa de 300Hz a 5200Hz é a dos sons médios como o do telefone. Os pratos de bateria produzem um som considerado agudo, esse tipo de som tem faixa de 5200Hz até 20kHz. A partir dessa última frequência os sons são classificados como ultrassons como o do apito para cães. (KNIGHT, 2009)

1.1.1 Potência, Intensidade e Decibéis

As ondas possuem a capacidade de transferir energia de um ponto a outro. Percebe-se isso no aquecimento da Terra pelos raios do Sol. Um modo de quantificar essa energia é através da potência. A potência de uma onda é definida pela taxa de energia transferida na unidade de tempo medida em watts.

Um outro modo de analisar como a potência de um som é percebida é através do conceito de intensidade. A intensidade I é a relação entre a potência P dissipada em uma área

a. A unidade da intensidade é o W/m2_. ] m / W [ a P I_ 2 (1)

Pela equação acima o valor constante da potência de um som torna-se mais intensa conforme se diminui o valor da área. Assim, a luz de uma lanterna é mais intensa que a luz da sala, por exemplo. Em relação a audição humana existem dois valores limites para a potência

do som. O menor é conhecido por limiar de audição e possui o valor de 1x10-12_W/m2 _(em

frequências médias). O maior é conhecido por limiar de dor com o valor de 10W/m2_.

O volume do som dos aparelhos está baseado nestes valores. Eles são usados para definir uma escala de volume. Essa escala é definida como nível de intensidade sonora, expressa em decibel (dB). Esta escala varia do valor de 0dB até o valor de 130dB correspondendo, respectivamente, ao limiar de audição e ao limiar de dor. A equação mostrada a seguir deixa mais claro como esse valor foi obtido.

(16)

15 Nesta escala o limiar de audição representa um valor em que não se percebe a intensidade do som.

A equação abaixo permite calcular cada valor dessa escala.

        0 10 I I log ) dB 10 ( (2)

Onde βé o valor em dB da relação entre a intensidade analisada I e a intensidade do

limiar de audição I . Logo se I =₀ I = 1x100 -12W/m2, então β= 0dB. Se I = 10W/m2, então β=

130dB. Experimentos feitos mostraram que o som é percebido como duas vezes maior para uma variação de 10dB na intensidade. (KNIGHT, 2009)

1.1.2 Princípio da Superposição

Superposição é a combinação de duas ou mais ondas. O princípio deste fenômeno é enunciado abaixo.

Princípio da superposição: quando duas ou mais ondas estão presentes simultaneamente

em um mesmo ponto do espaço, o deslocamento do meio neste ponto é a soma dos deslocamentos que seriam produzidos por cada uma separadamente. (KNIGHT, 2009)

A superposição dos sons de áudio nem sempre é percebida pelo ser humano. O cérebro humano tem uma habilidade de focar em um som específico. Dessa maneira se houver diferentes fontes sonoras o ouvido será capaz de diferenciar cada fonte. Mas o mesmo não acontece com os sistemas computacionais.

1.2 SINAIS EM TEMPO DISCRETO

Antes de entender o que são sinais em tempo discreto é necessário saber o que são sinais. Os sinais são considerados entidades ou alguma coisa que possui e transporta informação. Essa informação auxilia na descrição do comportamento e do estado de um sistema físico. A representação dos sinais está contida em um padrão de variação. Modela-se esse padrão através de funções matemáticas de uma ou mais variáveis, dele interpretam-se as informações obtidas.

Uma das maneiras de classificar os sinais é definir se são contínuos ou discretos. Os sinais contínuos se referem ao modo como sua função matemática está definida em relação a

(17)

16 variável independente. Se a variável independente é o tempo, então a função será contínua quando variar em um contínuo temporal. Se a função está definida somente para instantes discretos, então o sinal é dito discreto em relação ao tempo. De outra maneira, os sinais discretos podem ser observados como uma sequência de números. (OPPENHEIM; SCHAFER, 2011)

Então, pode-se escrever uma sequência de números x. Cada número desta sequência pode ser localizado a partir de um número n. Cada valor da sequência é representado por x[n], como na equação (3), onde n pertence ao conjunto dos números inteiros. Com essas referências se define o sinal digital. Um sinal é digital quando é discretizado tanto na variável dependente quanto na variável independente. Os sistemas chamados digitais só podem manipular quantidades digitais. Então, tanto a entrada quanto a saída devem ser digitais para serem manipulados nesses tipos de sistemas. Em símbolos, as sequências podem ser representadas como mostrado na equação abaixo extraída de (OPPENHEIM; SCHAFER, 2011).

x = {x[n]}, -∞ < n < ∞, (3)

Os valores discretizados, na maioria das vezes, são oriundos de um processo de amostragem que se faz em uma função contínua. Para a realização da amostragem do sinal define-se um período de amostragem designado pela letra T. A cada intervalo de um período captura-se o valor instantâneo da função. A Figura 2 mostra uma função contínua que será discretizada.

Figura 2 - Sinal senoidal contínuo inalterado

O sinal contínuo é a função f(t) = sen[(2π/4)t]. O período dela é de 4 segundos. A função é contínua, pois está definida para todos os instantes de 0 a 4s. Sempre haverá um valor de amplitude relacionado a qualquer um dos infinitos números de tempo entre 0 e 4s nesse período.

0 0.4 0.8 1.2 1.6 2 2.4 2.8 3.2 3.6 4 -1

0

1 Função senoidal em tempo contínuo

A m pl it ud e f( t) Tempo(s) , , , , , , , ,

(18)

17 Mas nos sinais de tempo discreto isso não acontece. Cada uma das amplitudes relaciona-se a um instante discreto. Não há amplitudes entre duas amostras discretas como mostra a Figura 3.

Figura 3 - Amostragem do sinal senoidal

Os traços verticais, destacados na figura acima, são as amostras do sinal senoidal em instantes separados por um intervalo de 0,2s, período de amostragem. Deve-se observar que o eixo do tempo na Figura 2 é diferente na Figura 3. Nessa última figura são mostrados números inteiros para o eixo das variáveis independentes. O gráfico se forma a partir da relação x[n] =

f(0,2._{n). Como já foi explicado, 0,2 corresponde ao período de amostragem. Isso quer dizer que,}

a cada 0,2 segundos se toma uma amostra da função senoidal contínua. Então, por exemplo,

quando n = 2, x[2] = f(0,2._{2) = f(0,40). Forma-se, assim, todos os valores do sinal em tempo}

discreto. Cada uma das amostras é plotada no gráfico da Figura 3.

1.3 SÉRIES E TRANSFORMADAS DE FOURIER

Jean Baptiste Joseph Fourier (1768-1830), matemático francês, apresentou, pela

primeira vez, as séries e transformadas que levam seu nome. Os resultados de Fourier não foram recebidos com entusiasmo pelo mundo científico. Ele não teve nem mesmo a oportunidade de ter seu trabalho publicado como um artigo científico.

Fourier teve a brilhante ideia de que qualquer função periódica prática pode ser representada como uma soma de senoides. Se a entrada de um circuito consistir de vários sinais periódicos, a saída será uma versão do somatório dos sinais. (ALEXANDER; SADIKU, 2013)

1.3.1 Séries de Fourier em Tempo Discreto

Nesta seção será mostrada a representação de um sinal de tempo discreto com a série de Fourier.

0 2 4 6 8 10 12 14 16 18 20

-1 0

1 Função senoidal em tempo discreto

x[ n] = f (n *0 .2 ) n ,

(19)

18 Antes, porém, é preciso ter conhecimento de combinações lineares de exponenciais complexas harmonicamente relacionadas que serão usadas nas séries. As equações de (4) a (10) foram retiradas de (OPPENHEIM; SCHAFER, 2011).

Um sinal de tempo discreto x[n] é periódico com período N quando é válida a expressão: x[n] = x[n + N]. O menor inteiro positivo em que se confirma a expressão anterior é denominado

de período fundamental. De modo que a frequência fundamental é obtida por0 2/N. Essa

ideia é aplicada, inclusive a funções exponenciais complexas. Assim _ej(2π/N)n_{é periódica com}

período N. O conjunto de todas os sinais exponenciais complexas de tempo discreto é dado por

,... 2 , 1 , 0 k , e e ] n [ jk n jk(2 /N)n k  0        ₍₄₎

As frequências fundamentais dessas funções são múltiplas deω , por isso é dito que elas ₀

são harmonicamente relacionadas. Além disso, é importante saber que há apenas N sinais distintos que podem ser representados pela Equação (4). Isso ocorre porque as exponenciais

que apresentam diferença apenas por um múltiplo de 2π , possuem sempre os mesmos valores.

Esse fato permite saber que ₀[n]_N[n], ₁[n]_N_₁[n], em geral que _k[n]_k__rN[n].

Esse conjunto de exponenciais complexas harmonicamente relacionadas pode

representa os sinais periódicos de forma geral. Isto através de combinações lineares de _k[n].



_ _  _   k n ) N / 2 ( jk k k n jk k k k k [n] a e a e a ] n [ x 0 (5)

A equação acima só precisa incluir os N termos para os quais as exponenciais são distintas. Logo, o somatório em k varia em N termos inteiros. Por exemplo, k = 0, 1, ..., N-1,

ou k = 1, 2, ..., N ou k = 2, 3, ..., N+1. Essa variação em k indica-se isso pela notação k = N _.

A equação matemática que perfaz essa indicação de variação de k é mostrada a seguir



         N k n ) N / 2 ( jk k N k n jk k N k k k [n] a e a e a ] n [ x 0 (6)

A Equação (6) é chamada de série de Fourier de tempo discreto, os coeficientes ak são

chamados de coeficientes da série de Fourier. Interessa saber, como no caso do tempo contínuo, o modo de calcular esses coeficientes para um sinal qualquer x[n] com período fundamental N.

(20)

19 Para isso calculam-se os N valores de x[n] aplicando a Equação (6). Os resultados são mostrados através da Equação (7). Ela mostra o somatório de cada valor de 0 a N-1 do intervalo.



          N k k N ) 1 N )]( N / 2 ( jk [ k ) N / 2 ( jk k N k k; x[1] a e ;...; x[N 1] a e a ] 0 [ x ₍₇₎

A Equação (7) forma um conjunto de N equações linearmente independentes, ele pode

ser solucionado para obter os coeficientes ak a partir dos valores dados de x[n], com forma

fechada. A base para o cálculo dos coeficientes está no fato de que, a soma dos valores de uma exponencial complexa periódica sobre um período é zero. Exceto se a exponencial complexa resultar em uma constante. O procedimento para achar os coeficientes é, primeiramente,

multiplicar os dois membros da Equação (6) por _e-jr(2π/N)n_{e depois realizar um somatório sobre}

N parcelas, também, nos dois membros.

 



                 N n k N n ) N / 2 ( jk n ) N / 2 ( jk k N n n ) N / 2 ( rj _[(_a _e ₎_e _] e ] n [ x _(8.a)



                        N k n N n ) N / 2 )( r k (j k N n n ) N / 2 ( rj _a _e e ] n [ x (8.b)

O somatório interno no membro direito da Equação (8.b) será sempre igual a zero, mas se k = r ou k-r for múltiplo de N, então o somatório não será N. A partir disso chega-se a equação N a e ] n [ x _r N n n ) N / 2 ( rj _



   (9.a)         



   N n n ) N / 2 ( rj r _N x[n]e 1 a (9.b)

A Equação (9.b) é uma expressão em forma fechada para se determinar os coeficientes da série de Fourier. Estes coeficientes são obtidos a partir dos valores de x[n]. Eles possibilitam a formação do par de série de Fourier para o caso do tempo discreto, esse par está logo abaixo

(21)

20          



          N n n ) N / 2 ( jk N n n jk k N k n ) N / 2 ( jk k N k n jk k e ] n [ x N 1 e ] n [ x N 1 a e a e a ] n [ x 0 0 (10)

Com os valores de x[n] pode-se obter os coeficientes da série de Fourier e vice-versa.

1.2.2 Transformada de Fourier em Tempo Discreto

O raciocínio aplicado para encontrar a transformada de Fourier em tempo contínuo, também é aplicado para achar a transformada em tempo discreto. Considera-se, a princípio, um sinal aperiódico discreto finito. Assim, as amostras deste sinal estão dentro de um intervalo,

cujos limites indica-se por N1 e N2. Todos os valores que estão fora do intervalo considerado

são iguais a zero. Com os valores do intervalo pode-se construir um outro sinal de tempo discreto. Mas este novo sinal é periódico, de modo que durante um período ele é exatamente igual a sequência aperiódica. Conforme se aumenta o período da sequência periódica, mantendo os valores idênticos do primeiro sinal e zerando todos os outros valores, os dois sinais se tornam mais e mais semelhantes. Se o período da sequência tender ao infinito, então se tornam iguais. Designando a sequência não periódica por x[n] e a periódica por x’[n] observa-se uma direção para se obter a transformada de tempo discreto. Isso porque é conhecida a representação em série de Fourier de x’[n]. Na Equação (10) é mostrada a relação dos pares da série de Fourier. (OPPENHEIM; SCHAFER, 2011)



        _  n n ) N / 2 ( jk N N n n ) N / 2 ( jk k _N x[n]e 1 e ] n [ x N 1 a 2 1 (11)

Este resultado é válido para a sequência aperiódica, pois seus valores são nulos fora do intervalo considerado. O último somatório da Equação (11) é a transformada de Fourier para

tempo discreto X(ejɷ_{). Observa-se que o coeficiente a}

k é proporcional X(ejɷ). O espaçamento

entre as amostras no domínio da frequência é ɷ0 =2π/N. Se for observado, na Equação (10), que



    _  N k n ) N / 2 ( jk k N k n jk ke a e a ] n [' x 0 (12)

(22)

21 fazendo a substituição do resultado Equação (11) na Equação (12) chega-se ao resultado abaixo



      _    N k 0 n jk jk N k n jk jk ₀ ₀ ₀ ₀ e ) e ( X 2 1 e ) e ( X N 1 ] n [ ' x ₍₁₃₎

conforme N vai aumentando o valor de ɷ0 vai diminuindo. Quando N tende ao infinito a

Equação (13) passa a ser uma integral. Logo x’[n] torna-se igual a x[n] e a equação acima passa

a ser a Equação (14). Esta é uma integral da qual se obtém x[n] a partir dos valores de X(ejɷ_{) .}

(OPPENHEIM; SCHAFER, 2011)



   _   2 n j j ₎_e _d e ( X 2 1 ] n [ x ₍₁₄₎

1.4 FILTROS DIGITAIS NÃO-RECURSIVOS

Os filtros digitais não-recursivos possuem esse nome devido as características existentes na equação de diferenças que os representa. De modo geral, as equações de diferenças são como se mostra baixo. (OPPENHEIM; SCHAFER, 2011)



     N 0 k M 0 k k ky[n k] b x[n k] a (15)

Quando N = 0, a equação acima passa a ser



              M 0 k 0 k _x_[_n _k_] a b ] n [ y (16)

A saída do sistema representado por y[n] é uma função dos valores presentes e prévios da entrada. Por isso ela é denominada equação não recursiva, pois não dependente de valores da saída calculados previamente. (OPPENHEIM; SCHAFER, 2011)

Os filtros digitais não-recursivos são descritos em termos da Equação (16). Os valores

dos coeficientes (bk/ao) são, na verdade, valores da resposta ao impulso h[k]. Desse modo, a

(23)

22 intervalo [0, M]. Por isso se diz que filtros não-recursivos são filtros com resposta ao impulso de duração finita (FIR, do inglês Finite-duration Impulse Response). Utilizando a transformada z pode-se representar a Equação (16) da seguinte forma



    M 0 k k z ) k ( h ) z ( X ) z ( Y ) z ( H (17)

A Equação (17) revela uma maneira de se obter a resposta ao impulso dos filtros FIR. Para construção de H(z) são necessários blocos de atraso, multiplicadores e somadores. Esses blocos podem ser representados por meio de símbolos convencionais ou através de diagrama de fluxo de sinais. Escolheu-se a última opção para representação neste trabalho. Ela será mostrada aplicada na forma direta para obtenção de H(z). (DINIZ; SILVA; NETTO, 2014)

1.4.1 Forma direta, cascata e com fase linear

Esta forma é chamada direta, pois seus coeficientes multiplicadores são obtidos diretamente da função de transferência do filtro. Outra denominação para esse tipo de representação é forma canônica. Na figura abaixo mostra a estrutura para se obter a y[n] por meio da forma direta.

A forma em cascata é outro tipo de representação para H(z). Os coeficientes gerados nessa forma não necessariamente explicitam a resposta ao impulso ou sua função de transferência. São criadas a partir de estruturas equivalentes, abaixo a equação dessa forma. y[n] h[0] h[1] h [ 2 ] h[M-2] h[M-1] h[M] z-1 _z-1 _z-1 _z-1 x[n] ...

(24)

23







   __     N 1 k 2 k 2 1 k 1 k 0 z z ) z ( H (18)

Na Equação (18), N depende da ordem do filtro. Se a ordem M do filtro for par, então o valor de N é M/2. Se M for ímpar, então N = (M+1)/2. (DINIZ; SILVA; NETTO, 2014)

A forma com fase linear é, na verdade, uma subclasse dos filtros FIR. Os filtros com fase linear se caracterizam por apresentarem atraso de grupo constante. Isso implica que a resposta em frequência é como mostrada na Equação (19). A forma dessa equação é

exponencial. Onde nela B(ω ) é real, ₀  e  são constantes. (DINIZ; SILVA; NETTO, 2014)

Isso se faz necessário para se obter a função do impulso por meio da Equação (20).

 

  _ _ j j j ₎ _B _e e ( H (19)

 



         B e d 2 e ) n ( h j j (n ) ₍₂₀₎

Nas equações acima o atraso de grupo é considerado como múltiplo de meia amostra. De modo que para um filtro apresentar fase linear com atraso de grupo constante, a resposta ao

impulso tem que satisfazer h(n) = e2jϕ._h*_{(2τ - n). (DINIZ; SILVA; NETTO, 2014)}

1.5 FILTROS DIGITAIS RECURSIVOS

A função de transferência de um filtro recursivo é dada por



       _N 1 i i i M 0 i i i z a 1 z b ) z ( D ) z ( N ) z ( H (21)

Como na maioria dos casos tais funções de transferência resultam em filtros cuja resposta ao impulso tem comprimento infinito, os filtros recursivos também são chamados, algo imprecisamente, de filtros com resposta ao impulso de duração infinita (ou IIR, do inglês Infinite-duration Impulse Response). (DINIZ; SILVA; NETTO, 2014)

Esse tipo de filtro é assim chamado porque a saída não depende somente dos valores calculados e prévios da entrada. A saída depende de valores prévios da própria saída. De modo

(25)

24 igual aos filtros FIR, os filtros IIR podem ser representados de forma direta e em cascata. Existe ainda a forma paralela que utiliza blocos de segunda ordem para decompor a função de transferência. Ao todo, na forma paralela, existem três formas alternativas, sendo duas canônicas em relação ao número de elementos multiplicadores.

Em geral, filtros IIR são capazes de aproximar uma resposta na frequência prescrita com um número de multiplicações menor que os filtros FIR. Por esse motivo, filtros IIR podem ser mais adequados a algumas aplicações práticas, especialmente aquelas envolvendo processamento de sinais em tempo real. (DINIZ; SILVA; NETTO, 2014)

1.6 LINGUAGEM MATLAB

MATLAB é uma linguagem de programação de alto nível orientado ao cálculo técnico que integra um ambiente amigável para o cálculo, a visualização de resultados e a codificação de programas. Geralmente é utilizado em: cálculo e matemática; desenvolvimento de algoritmos; aquisição de dados; modelamento; simulação e prototipagem; análises, exploração e visualização de dados. Gera gráficos científicos e de engenharia. Desenvolvimento de aplicações com interfaces gráficas.

O nome MATLAB provém de Matrix Laboratory (Laboratório de Matrizes) dado que em sua origem foi escrito para facilitar o desenvolvimento do software matricial. MATLAB tem revolucionado desde 1970 através da atenção das necessidades de seus principais usuários, tanto em âmbitos acadêmicos como empresariais.

Um comando no Matlab é uma ordem ou instrução que o usuário insere em um sistema de informação, desde a linha de comandos (shell) ou desde uma chamada de programação. Os comandos se digitam desde a posição do cursor; e para sua execução, estes devem finalizar-se pressionando a tecla ENTER. Então, apresenta-se o resultado ou informação.

As funções do Matlab executam um conjunto de instruções que tomam como dados um conjunto de argumentos de entrada e devolve como resultado um conjunto de argumentos de saída. São muito úteis para trabalhar quando se tem mais de um programa para fazer algo.

Os arranjos são elementos dispostos em dimensões (no caso de dimensão 2, se tem filas e colunas). Estes elementos não necessariamente obedecem a algum conjunto de regras algébricas (por exemplo, as de álgebra linear), são somente elementos que contém valores. Seja no caso mais usual, de dimensão 2, no qual os elementos estão dispostos em forma retangular com de m filas e n colunas. Existe ainda matriz de células que suportam matrizes.

(26)

25 Uma variável é formada por um espaço no sistema de armazenamento, ou memória principal do computador, que no Matlab recebe o nome de workspace, e um nome simbólico (um identificador) que está associado ao dito espaço. Esse espaço contém uma quantidade ou informação conhecida ou desconhecida, quer dizer, um valor. O nome da variável é a forma usual de se referir ao valor armazenado: esta separação entre nome e conteúdo permite que o nome seja usado independentemente da informação exata que representa.

O identificador, no código fonte do computador pode estar ligado a um valor durante o tempo de execução e o valor da variável pode, portanto, variar durante o curso da execução do

programa.Essas são as principais informações sobre o Matlab. (ARELLANO, 2013)

1.7 TRABALHOS ANTERIORES

Esta seção apresenta trabalhos anteriores que serviram de base e exemplo para este. A partir deles pôde-se explorar conceitos e utilização de ferramentas. Os conceitos estão relacionados à análise dos sinais de áudio quando estão superpostos. As ferramentas estão relacionadas com o uso das componentes para fazer separação no domínio da frequência.

O primeiro trabalho estudado foi a monografia do aluno Leonardo Sequeira Santana da Universidade Federal do Amazonas (UFAM), cujo tema foi Filtros Digitais Aplicados para Separação de Sinais de Áudio. Nela se faz a aplicação dos filtros digitais do tipo FIR para a separação dos sinais. Foi com base neste trabalho que se escolheram os áudios. Também se realizou a experiência com os filtros FIR, mas acrescentou-se a utilização dos filtros IIR. O programa do anexo A é dessa monografia, também, os programas do apêndice A e B são inspirados nos programas elaborados nela, porém acrescentaram-se funções e modificação na manipulação dos dados. De modo que pudessem trabalhar com as variáveis satisfatoriamente.

O segundo trabalho estudado foi do aluno de pós-graduação Fernando Alves de Lima Moreto da Escola Politécnica da Universidade de São Paulo, cujo tema foi Análise de Componentes Independentes Aplicada à Separação de Sinais de Áudio. Dele extraiu-se informação para avalição da separação dos sinais. Nesse trabalho a referência se faz com o método de medição. Isso se faz com uma soma de quatro parcelas, fonte desejada, degradação, ruído e artefato. O sistema para essa aplicação é o sistema BSS_Eval desenvolvido no Matlab. Esses dois trabalhos serviram como inspiração e forneceram exemplos de como trabalhar e analisar a separação dos sinais de áudio, aqui o enfoque foi o uso de tipos diferentes de filtros digitais, para saber qual deles é mais útil em relação ao tempo, avaliando o tempo e o número da ordem dos filtros.

(27)

26

2 METODOLOGIA

O presente trabalho será uma Pesquisa Aplicada, cujo objetivo é a realização de uma pesquisa exploratória sobre o material bibliográfico e de laboratório adquiridos sobre o assunto. Os procedimentos técnicos a serem utilizados serão os de pesquisa bibliográfica e experimental. Como método de abordagem, será utilizado o hipotético-dedutivo e a elaboração seguirá o método de procedimento monográfico. A coleta de dados será feita por documentação indireta, sendo estes dados qualitativos e interpretados de forma global.

Foram feitas pesquisas bibliográficas nas seguintes disciplina: Física 2, Sinais e Sistemas, Processamento Digital de Sinal e Linguagem de Programação em Matlab. Para o desenvolvimento prático deste trabalho foi utilizado um notebook acer aspire E 15 com processador Intel® CoreTM i5-4210U e 1.7GHz. Foram utilizados 9 arquivos de áudio em formato .wav, com taxa de amostragem de 44100Hz, 16 bits por amostra e com dois canais. Utilizou-se, também, o software MATLAB R2013b (8.2.0.701).

Em Física 2 foi feita revisão da propagação das ondas sonoras; em Sinais e Sistemas revisão sobre: classificação de sinais, representações de séries e transformada Fourier para sinais de tempo discreto; em Processamento Digital de Sinal revisão sobre: aproximações para filtros FIR e IIR. Por fim, realizou-se pesquisa sobre linguagem de programação matlab do software MATLAB R2013b.

A partir dos conhecimentos adquiridos iniciou-se o desenvolvimento do algoritmo de seleção de sinais de áudio. Inicialmente foi feita a aquisição de arquivos de áudio a partir de uma base de dados, site que os disponibiliza gratuitamente. Em seguida esses arquivos tiveram seus nomes modificados para melhor manipulação. O padrão dos novos nomes é audio(i). Esse i é um valor inteiro que varia de 1 a 9, não se utiliza o parêntese. Logo após, iniciou-se o desenvolvimento do algoritmo, no Matlab, em new script. Esse foi subdividido em três partes. Para melhor compreensão acompanhar o texto com os apêndices A e B e anexo C. Os apêndices A e B se referem a primeira e terceira parte do algoritmo, respectivamente. O anexo C se refere a segunda parte do algoritmo. Ao final da descrição de cada parte, feita a seguir, são colocados os fluxogramas, eles resumem o funcionamento e auxiliam no seu entendimento. Depois de obtidos os sinais filtrados será feita a relação sinal/ruído para cada um dos áudios com os dois tipos de filtros, isso será por métrica. Esses valores mostrarão se os áudios filtrados possuem maior potência do sinal de interesse ou maior potência dos ruídos.

(28)

27 2.1 DESENVOLVIMENTO DO ALGORITMO

2.2.1 Primeira parte do algoritmo: programa principal

A primeira parte do algoritmo foi intitulada programa_principal, ela está no apêndice A. No início definiu-se duas variáveis audinic e audfin. Elas representam, respectivamente, o valor inicial e final das interações do laço for. O comando switch foi utilizado para assegurar que sempre 3 dos 9 áudios fossem superpostos e de modo sequencial.

Para a criação do primeiro grupo armazenou-se o valor 1 em audinic e o valor 3 em audfin, para o segundo grupo armazenou-se o valor 4 em audinic e o valor 6 em audfin e para a criação do terceiro grupo armazenou-se o valor 7 em audinic e o valor 8 em audfin.

Para tornar os arquivos de áudio em formato reconhecível pelo Matlab primeiro criou-se uma matriz de células w{i,1}, i muda de valor de acordo a interação do laço for. Ao final essa matriz possui os nomes de todos os áudios no formato audio(i).wav. Cada um desses nomes tornou-se argumento da função audioread(“argumento”) que retornou as amostras dos áudios e a frequência de amostragem, essa é constante e de valor igual a 44100Hz. Essas amostras foram guardadas na matriz y e a frequência de amostragem em fs.

Para se obter somente um dos canais de áudio utilizou-se o comando y(:,1) que armazenou em y todas amostras, mas apenas da primeira coluna dessa matriz. Para se obter o tempo criou-se uma matriz tempo(i), cujos valores provêm do quociente entre o comprimento da matriz y e fs. O valor de tempo foi comparado com o valor 10s. Para tempo maior que 10s armazenou-se em y as amostras para produzir um tempo de 10s através do comando y(1:10*fs).

Para criação dos gráficos utilizou-se um vetor x cuja quantidade é a mesma do áudio corrente definida de modo linear pela função linspace(). O comando switch foi usado para plotar os gráficos dos áudios de um grupo com cores diferentes. Mas o gráfico do primeiro áudio de cada grupo tem sempre a mesma cor, o mesmo com o segundo e terceiro áudio de cada grupo. Os áudios dos grupos foram armazenados na matriz de células audiowave{i,1}, conforme interação do laço. As frequências de amostragem foram colocadas na matriz de células audiofs{i,1}. A matriz superposicao{i,1} serviu para armazenar as amostras do áudio(i), mas quando i se tornou maior que o valor audinic, então utilizou a segunda parte do algoritmo. Pois, assim, as amostras do segundo áudio da interação do laço eram somadas às amostras do primeiro. O resultado foi somado com as amostras do terceiro áudio da interação. Por fim, obteve-se a superposição de 3 áudios que foi armazenada em superposicao{audfin,1}.

(29)

28

Em seguida, criou-se a janela com quatro gráficos através de um vetor x com o comprimento igual ao vetor da superposicao{audfin, 1}, Utilizou-se o comando plot() colocando como argumento o vetor x e a superposicao{audfin, 1}, também acrescentou-se os vetores dos áudios da matriz audiowave{}. Depois a função sound() foi usada para ouvir os áudios sem alteração nenhuma e sua superposição dos áudios. A Figura 5 mostra o fluxograma.

Figura 5 - Fluxograma da primeira parte do programa. Programa principal

INÍCIO

audinic; audfin; audio1; audio2; audio3; audio4; audio5; audio6; audio7; audio8; audio9; i; w{}; y(); fs; tempo();

audiowav{}; audiofs{}; superposicao{}

i = audinic: audfin

w{i;1} ← audioi.wav’

[y, fs] ← audioi.wav

y ← y(i;1) tempo(i) ← length(y) / fs tempo(i) > 10 ? y ← y(1:10*s) sim audiowave{i,1} ← y audiofs{i,1} ← fs superposicao ← audiowave{i,1} não i > audinic ?

superposicao{i,1} ← soma(superposicao{i-1,1},audiowave{i,1})

sim

FIM

(30)

29

Figura 6 - Fluxograma da segunda parte do programa. Soma de áudios

Nas linhas restantes da primeira parte utilizou-se a função criada na terceira parte do algoritmo para plotar o gráfico no domínio da frequência da superposição e de um áudio específico.

2.2.2 Segunda parte do algoritmo: soma dos áudios

O algoritmo relativo a segunda parte está no anexo A. Dois áudios são passados à função somaaudio() em forma de argumentos. O primeiro é representado por a1 e o segundo por a2.

Duas variáveis, length1 e length2, armazenam os comprimentos de a1 e a2, respectivamente. Por meio do if comparou-se o tamanho de a1 e a2. Se length1 fosse maior, então se acrescentava zeros à a2 por meio da função zeros(length1-length2,1). Se length2 fosse maior, então se acrescentava zeros à a1 por meio da função zeros(length2-length1,1). O acréscimo de zeros deixava a matriz de menor comprimento com o mesmo comprimento da maior. Depois somou-se a1 e a2. A Figura 6 mostra o fluxograma para a segunda parte.

INÍCIO a1, a2 length1 ← length(a1) length2 ← length(a2) length1 > length2 ? a2 = [ a2 ; zeros(length1 - length2, 1)] sim soma ← a1 + a2 não FIM

(31)

30 2.2.3 Terceira parte do algoritmo: filtragem e plotagem dos espectros de magnitude

A função filtespc() foi criada para realizar a terceira parte do algoritmo, ela está no apêndice B. Ela consta de uma parte auxiliar e outra completa. A parte auxiliar necessita de dois argumentos. O primeiro representa a matriz de amostras de um áudio. O segundo representa a frequência de amostragem. A parte completa necessita de três argumentos. O primeiro corresponde à matriz do áudio. O segundo à frequência de amostragem. O Terceiro ao número do áudio a ser analisado.

A parte auxiliar foi estruturada como se segue. A variável L foi criada para armazenar o comprimento do vetor das amostras do áudio por meio da função length(). Depois criou-se a variável NFFT que armazena a potência de 2 de um número. O quadrado deste número é maior ou igual ao valor do comprimento do vetor de amostras do áudio. Para isso utilizou-se a função nextpow2(). Criou-se a matriz Y para armazenar os valores da aplicação da FFT. Depois criou-se a matriz f que contém valores do eixo das variáveis independentes.

Plotou-se em um gráfico os módulos de Y em função de f. Depois escolheu-se as faixas de frequência para construção dos filtros. A quantidade de filtros dependeu da quantidade de faixas que se quis filtrar em cada áudio. A escolha das faixas de frequências foi feita observando o espectro de um áudio específico e do áudio superposto. Para o áudio1 foram produzidos dois filtros. Para o áudio 2 foram produzidos 9 fitros. Para os áudios de 3 a 7 foram produzidos, para cada um, 2 fitros. Para o áudio 8 foi produzido um filtro. Para o áudio 9 foram produzidos 4 filtros.

Estes procedimentos foram realizados com a parte auxiliar do apêndice B. Os filtros foram criados com a ferramenta fdatool do Matlab .

No workspace do Matlab digitou-se fdatool para ter acesso a ferramenta de desenho de fitros. No fdatool, em Response Type escolheu-se Bandpass para criação de um filtro passa-faixa. Em Design Method escolheu-se o tipo FIR, filtro com resposta finita ao impulso. Em FIR escolheu-se a opção window,cria filtro a partir do método de janelamento. Em Filter Order escolheu-se a opção Minimum order, escolha automática da ordem mínima que o filtro deve ter. Em Options, window, escolheu-se Kaiser.

Em Frequency Specifications definiu-se os valores da frequência de amostragem (Fs), frequência da faixa de rejeição inferior (Fstop1), frequência inferior da faixa de passagem (Fpass1), frequência superior da faixa de passagem (Fpass2), frequência da faixa de rejeição superior (Fstop2). Os valores em Frequency Specifications são definidos de acordo com cada faixa de frequência observadas no espectro de cada áudio gerado pelo algoritmo auxiliar. Em

(32)

31 Magnitude Specifications, escolheu-se dB em Unit, especifica as magnitudes em decibéis. Não se fez alteração nos valores de atenuação.

Depois dessas especificações clicou-se em Design Filter para produzir o filtro. Depois em File/ Generate MATLAB Code clicou-se em Filter Design Function para se obter o código utilizado na terceira parte do algoritmo, em sua versão completa. Pelo que se voltou ao algoritmo e se incluiu linhas de códigos para identificar o número de filtros que seriam utilizados para cada áudio. Em seguida criaram-se arranjos de matrizes para armazenar o conteúdo filtrado por cada filtro criado. Ao final armazenou-se o conteúdo filtrado no domínio do tempo e da frequência em duas matrizes, respectivamente.

Instruções foram adicionada para reproduzir o som do áudio filtrado e plotar a superposição e o áudio filtrado no domínio da frequência. Os filtros FIR e IIR são empregados por meio de instruções que são argumentos da função filter. Elas controlam a aplicação dos filtros gerados em fdatool, de modo que cada áudio possui grupo específico de filtros FIR e IIR.

Acrescentaram-se a esta terceira parte do algoritmo instruções para obter a relação sinal/ ruído de cada um dos sinais de áudio. Alternativamente pôde-se utilizar a função snrn do Matlab. Esta função corrigiu o valor da relação sinal/ruído para um valor predeterminado. De modo o resultado é a criação de uma matriz com amostras do áudio corrigido, como o ruído mais atenuado. Na página seguinte mostra-se, na Figura 7, o fluxograma da terceira parte.

Assim, o sistema como um todo funciona com uma fonte de aquisição de áudios, as amostras desses áudios são somadas para simular a superposição, depois transfere-se para o domínio da frequência as amostras da superposição e de cada um dos áudios; faz-se a escolha das faixas de frequência para construção dos filtros. Depois de construídos eles são aplicados para capturar as faixas de frequências correspondentes ao áudio de interesse. Com as amostras resultantes do processo anterior aplica-se a função sound para ouvir o resultante e avaliar pela relação sinal/ruído.

(33)

32 n 9 8 2 ≠ 1, 3, 4, 5, 6, 7 INÍCIO audio, fs, n, audiowave yk ← cell(N,1) Yk ← cell(N,1) k > 1? sim FIM L ← length(audio) NFFT ← 2^nexpower(L) Y ← fft(audio, NFFT)/L f ← fs/2*linspace(0,1,NFFT/2+1) N=2 N=9 N=4 N=1 ‘Valor inválido’ k = 1: N

yk{k,1} ← filter(filtrofirk_audion,audio)

Yk{k,1}← fft(yk{k,1},NFFT)/L

yk{k,1} ← yk{k,1} + yk{k-1,1}

Yk{k,1} ← Yk{k,1} + Yk{k-1,1}

não

y10 ← yk{N,1}

Y10 ← Yk{N,1}

Figura 7 - Fluxograma da terceira parte do programa. Passagem para o domínio da frequência.

(34)

33

3 IMPLEMENTAÇÃO

3.1 AQUISIÇÃO DOS ARQUIVOS DE ÁUDIO

Os noves arquivos de áudio foram retirados do endereço https://www.freesound.org/. Esse site permite o download dos arquivos gratuitamente, desde que se faça um cadastro, também gratuito. Para isso acessou-se a aba register na parte superior direita ao lado de log in, conforme mostrado na Figura 8. Clicou-se nela e abriu-se uma página chamada registration onde se colocou os seguintes dados: username, first name, last name, e-mail, e-mail confimation, password e password confirmation. Digitou-se ainda um código numérico para a verificação de no robot. Em seguida clicou-se em register para confirmação do registro. Depois validou-se por e-mail o registro. Realizou-se o log in e escolheu-se os arquivos para fazer o download.

Figura 8 - Parte superior do layout do site com aba de registro destacada

Fonte: www.freesound.org

Utilizou-se a ferramenta de pesquisa search sounds, abaixo de register. Deve-se digitar palavras em inglês. O primeiro arquivo de som baixado foi o do ar condicionado. Para

encontra-lo digitou-se air conditioning na aba de pesquisa. Mostraram-se players de sinais de áudio no

domínio do tempo organizados de cima para baixo, escutou-se o som de um deles clicando em play, conforme Figura 9.

Figura 9 - Arquivo de áudio representado no domínio do tempo

Fonte: www.freesound.org

A figura acima representa um desses arquivos. Para uma melhor seleção utilizou-se a ferramenta de filtros, localizada ao lado direito da tela, cujas opções são type, samplerate,

(35)

34 bitdepth, bitrate, channels, packs e users. Neste trabalho utilizou-se type(wav), samplerate(44100), bitdepth(16) e channels(2). Depois de baixado o arquivo de som do ar condicionado repetiu-se estas etapas para baixar os áudios de um telefone tocando, voz masculina, alarme de carro, pássaro cantando, mulher cantarolando, contrabaixo, secador e um sino. Os nomes dos arquivos são listados abaixo:

 328175__kentspublicdomain__electric-machine-engine-rumble-large-air-conditioner.wav (ar condicionado)

 15826__transitking__telephonering.wav (telefone)  67703__acclivity__alphabet-male.wav (voz masculina)  203287__kabit__car-alarm.wav (alarme de carro)

 329547__ivolipa__canarian-bird-in-cage-singing-short.wav (pássaro cantando)  183565__pssoundproject__woman-humming.wav (mulher cantarolando)

 115655__jayc66__double-bass-plucked-rucksack.wav (contrabaixo)  146157__danamac__dryer-2-loop-quiet.wav (secador)

 320724__robinhood76__05936-old-cathedral-bell-looping.wav (sino)

Os arquivos tiveram seus nomes alterados, como já foi explicado. Conforme estão na sequência de cima para baixo passaram a ser renomeados para audio1.wav, audio2.wav, audio3.wav, audio4.wav, audio5.wav, audio6.wav, audio7.wav, audio8.wav e audio9.wav. Depois disso, eles foram colocados na pasta destinada aos arquivos do Matlab no diretório documentos. Para efeitos de programação foi selecionado apenas um dos dois canais que cada áudio possui, por isso selecionou-se o áudio do telefone com apenas um canal.

A seguir são descritas as etapas para obtenção de gráficos e valores de frequência para o projeto de filtros. Serão utilizadas as expressões primeira parte do algoritmo, terceira parte do algoritmo. Nessa sequência, elas indicam a utilização do algoritmo do apêndice A e do algoritmo do apêndice B.

Também será usada a expressão: seção, a qual se referirá a um conjunto específico de linhas de instruções. Elas estão indicadas por linhas tracejadas nos algoritmos e o nome em formato de comentário.

3.2 PLOTAGEM DE SINAIS DE ÁUDIO NO DOMÍNIO DO TEMPO

Esses sinais foram criados a partir das linhas de instruções da primeira geração de gráficos na primeira parte do algoritmo dentro do laço for. Selecionou-se as linhas de instruções

(36)

35 e se desfez o formato de comentário com ctrl+t. Salvou-se a alteração com ctrl+s. Executou-se o programa com F5. O resultado pode ser visto no apêndice C. Cada linha de figuras forma um grupo.

Obtidos os gráficos selecionaram-se as linhas de geração de gráficos e deixo-as em formato de comentário por meio do comando ctrl+r. Os comandos citados serão doravante apenas referenciados por meio de expressões.

3.3 PLOTAGEM DE SINAIS DE ÁUDIO SUPERPOSTOS NO DOMÍNIO DO TEMPO

Alterou-se os valores de audinic e audfin para obtenção dos gráficos de cada grupo. Para o grupo 1 audinic = 1 e audfin = 3. Para o grupo 2 audinic = 4 e audfin = 6. Para o grupo 3 audinic = 7 e audfin = 9.

Selecionou-se, então, as linhas de instruções para segunda geração de gráficos e as

retirou do modo comentário. Salvou-se a alteração e se executou o programa. O resultado pode ser visto no apêndice D. O conjunto de figuras mostra a influência de cada sinal de cada grupo para formação do sinal superposto. Depois disso selecionou-se as linhas de instruções para deixá-las em formato de comentário. Salvou-se a alteração feita.

3.4 ESPECTRO DOS SINAIS DE ÁUDIO E DA SUPERPOSIÇÃO

Na primeira parte do algoritmo, selecionou-se as linhas de instruções da seção análise do espectro de amplitude - parte auxiliar retirando-a da forma de comentário. Salvou-se a alteração. Depois na terceira parte do algoritmo selecionou-se as linhas de instruções de análise do espectro de amplitude - parte auxiliar, retirou-as do modo comentário. Salvou-se as alterações. Voltou-se à primeira parte e se executou o programa. O resultado obtido para cada grupo pode ser visto no apêndice E.

3.5 ESPECÍFICAÇÕES DAS FREQUÊNCIAS DE FILTROS

Depois de observar os espectros de cada áudio e o espectro da superposição de cada grupo. Definiu-se as especificações de frequências que estão na tabela a seguir. Estes valores foram inseridos de modo conveniente nas opções do fdatool para desenvolvimento dos filtros designados para cada áudio. Depois formatou-se as linhas de instruções citadas nas duas partes do algoritmo para o modo de comentário.

(37)

36

Tabela 1

Frequências dos filtros FIR e IIR passa-faixa relativos a cada áudio do algoritmo de seleção de sinais de áudio para o trabalho de conclusão de curso na

Escola Superior de Tecnologia da Universidade do Estado do Amazonas em 2016

Áudios Especificações de Frequências para fdatool

Filtro Fstpo1 (Hz) Fpass1 (Hz) Fpass2 (Hz) Fstop2 (Hz)

audio1 1 0 50 450 500 2 600 650 950 1000 audio2 1 1200 1250 1300 1350 2 1600 1650 1750 1800 3 3250 3300 3350 3400 4 4250 4300 4350 4400 5 5900 5950 6050 6100 6 7650 7700 7800 7850 7 9100 9150 9250 9300 8 11700 11750 11900 11950 9 12750 12800 13000 13050 audio3 1 200 250 900 950 2 1750 1800 3000 3050 audio4 1 25 75 150 200 2 2150 2200 3150 3200 audio5 1 3200 3250 5000 5050 2 7200 7250 8000 8050 audio6 1 170 220 500 550 2 600 650 1000 1050 audio7 1 0 20 100 150 2 130 150 180 200 audio8 1 100 150 350 400 audio9 1 210 260 275 325 2 270 320 330 380 3 480 530 550 600 4 1070 1120 1130 1180

(38)

37 3.6 FILTRAGEM NO DOMÍNIO DA FREQUÊNCIA E DO TEMPO DOS SINAIS DE ÁUDIO

Na primeira parte do algoritmo selecionou-se a seção: terceira parte do algoritmo – completa, a linha filtespc(superposicao{i,1}, fs, x), retirando-a do modo comentário. Substitui-se x pelos números dos áudios. Na terceira parte do algoritmo Substitui-selecionou-Substitui-se as linhas referentes a seção terceira parte do algoritmo – completa. Retirou-as do modo comentário. Executou-se o programa, para o audio1 o resultado é mostrado abaixo.

Figura 10 - Filtragem do audio1 da superposição do grupo 1

Em (a) mostra-se o espectro da superposição, (b) espectro do áudio e em (c) mostra-se uma comparação entre o áudio filtrado e original.

No apêndice F mostra-se com mais detalhes os espectros filtrados em relação ao espectro da superposição. Na última figura do apêndice mostra-se os sinais de áudios originais e os sinais obtidos por meio da aplicação dos filtros. Os sinais originais estão na cor verde e os seus correspondentes estão em ciano. Na figura acima em (b) mostra-se a o espectro da superposição da qual se filtra as componentes dos espectros do áudio 1 mostrados em (c). Em (a) a cor ciano é o sinal da superposição e o verde a do áudio original.

0 2 4 6 8 10

-0.5 0

0.5 Áudios no domínio do tempo

Tempo(s) (a) A m pl it ud e

áudio original áudio filtrado

0 0.5 1 1.5 2 x 104 0 0.02 0.04 Sinal da superposição Frequência(Hz) (b) M ag ni tu de 0 0.5 1 1.5 2 x 104 0 0.02

0.04 Sinal do áudio1 filtrado

Frequência(Hz) (c) M ag ni tu de , , , , , , , , , ,

(39)

38

4 ANÁLISE E INTEPRETAÇÃO DOS RESULTADOS

Na aquisição dos arquivos o segundo áudio baixado não possui dois canais de áudio, apenas um. Não houve prejuízo para o desenvolvimento do trabalho. O algoritmo suprimiu de todos os outros áudios o segundo canal de áudio. Todos foram manipulados tendo um só canal. Os resultados gráficos obtidos são iguais quando aplicados os filtros FIR e IIR. Entretanto os filtros FIR apresentaram média no tempo de execução de 15,44s e os IIR tiveram média de 3s. Essas médias resultam do fato de que os filtros do IIR necessitaram de uma ordem inferior a 40 para as equações de diferenças, enquanto os filtros FIR tiveram como ordem mínima 4427.

A plotagem dos sinais de áudio no domínio do tempo que está no apêndice C produziu gráficos iguais aos mostrados nos players no site. De modo que se tornou um parâmetro visual para validar a primeira geração de gráficos do algoritmo. Semelhantemente, a segunda geração de gráficos que está no apêndice D e que produziu os gráficos da superposição de cada grupo junto com seus respectivos áudios. Porém a real confirmação se deu por meio da função sound. Com ela pôde-se escutar o conteúdo do áudio de cada grupo e da combinação.

Na Figura 12 percebeu-se que as amplitudes do sinal superposto compõem um formato que se assemelha ao das amplitudes do audio2 nos intervalos de 0 a 2s e 6 a 8s, Figura 12.c. Nos intervalos de 2 a 6s e de 8 a 10s a forma das amplitudes tem maior semelhança com a forma do audio1, Figura 12.b. Também foi possível perceber a participação do audio3 no formato da superposição. O audio3 representa um homem soletrando as letras do alfabeto em inglês. Sua participação pôde ser percebida por meio de variações correspondentes as letras a, b, d e f.

Na Figura 12 avaliou-se que a forma do sinal combinado do grupo 2 é semelhante à forma do audio4. A forma do áudio6 pôde ser percebida no primeiro segundo e entre 8 e 9s. O audio5 só pôde ser percebido indiretamente na formação do sinal combinado. Percebe-se sua contribuição pelas diferenças de amplitudes entre a superposição e os sinais dos áudios 4 e 6.

Na figura 14 o sinal resultante da soma dos áudios do grupo 3 tem o formato semelhante ao do audio9. Pôde-se perceber a contribuição do audio8 ao longo de todo o tempo, mas principalmente no final. O audio7 só pôde ser percebido na contribuição da amplitude do sinal superposto em relação a amplitude dos demais sinais.

No apêndice E, na Figura 15, observou-se que o espectro do sinal combinado de 0 a 2500Hz tem a forma semelhante ao espectro do áudio1. Nas frequências restantes a semelhança é com o espectro do audio2. O audio3 possui amplitudes menores 0,0025, por isso não é visualmente percebido no espectro da Figura 15. d. O exposto foi a razão para construção de

(40)

39 dois filtros para o áudio1. Pois depois da frequência de 1000Hz as harmônicas têm amplitudes reduzidas abaixo de 0,0025.

As frequências de passagem para os filtros tiveram seus valores definidos na tabela 1. Observou-se que naquelas faixas há menos interferência das harmônicas dos outros dois espectros. Para o audio2 foram feitos 9 filtros, pois comparando as Figura 15.b e Figura15.d notou-se nove conjuntos de harmônicas. Partes das faixas de frequência do audio3 estão dentro das faixas de frequência dos filtros do audio1. A construção dos seus dois filtros se deu por escolha de faixas em que há menos interferência do áudio 1.

Para o grupo2 observou-se que o espectro do sinal combinado mostra com evidência as amplitudes dos espectros dos áudios 4 e 6. O audio5, em comparação, tem amplitudes que não o destacam na Figura 16.d. As faixas de frequência dos áudios não apresentaram interseções, exceto as dos áudios 4 e 6. Mas extensão da interseção começa em 170Hz e termina em 200Hz. A construção dos filtros para os áudios do grupo 3 se deu com maior atenção, pois as harmônicas dos 3 áudios estão muito próximas. A faixa de interseção está no intervalo de 130Hz a 400Hz. Então os filtros projetados tiveram faixas de frequência muito próximas. Utilizou-se dois filtros para os primeiros áudios e quatro para o último.

Os resultados do apêndice G, mostraram que a ferramenta fdatool produziu os filtros conforme as especificações de frequência da Tabela 1. Desse modo, quando se compara o conteúdo dos espectros filtrados com os originais, nota-se que há supressão de partes do espectro original. A quantidade de faixas de frequências de cada áudio é a mesma quantidade de filtros projetados. Não se fez um apêndice mostrando o resultado para cada um dos filtros IIR, pois os resultados gráficos são iguais aos dos filtros FIR, a diferença perceptível está no tempo de execução citado.

Entretanto, notam-se diferenças nos valores da relação sinal/ruído dos sinais para os dois tipos de filtros. Os números obtidos revelam que a potência do ruído é maior que a potência do áudio, exceto no audio9 quando está sujeito ao filtro IIR. Esta avaliação é feita em relação ao sinal na saída do filtro. Por isso, na descrição do funcionamento da terceira parte do algoritmo, indica-se o acréscimo de instruções para correção das relações de sinal/ruído obtidas. Os valores dessas relações são apresentados na tabela 2.

Por ela observa-se que, quantos a utilização dos filtros FIR os números da relação sinal/ruído dos áudios 1 e 8 é menor que os correspondentes obtidos pelos filtros IIR. Em todos os áudios verifica-se o contrário. Observa-se que o último áudio, audio9, possui um valor positivo, aplicando-se o filtro IIR, mostrando o único caso em que a potência do sinal é maior que a do ruído.

(41)

40 Tabela 2

Relação Sinal/Ruído relativa a cada áudio do algoritmo de seleção de sinais de áudio para o trabalho de conclusão de curso na

Escola Superior de Tecnologia da Universidade do Estado do Amazonas em 2016

Áudios Relação Sinal/Ruído(dB)

Filtros FIR Filtros IIR

audio1 -1,0747 -1,7350 audio2 -2,4691 -1,0573 audio3 -7,2810 -6,7053 audio4 -3,1354 -2,9374 audio5 -2,6682 -2,6041 audio6 -2,5578 -1,6078 audio7 -5,4212 -5,1942 audio8 -0,5069 -1,0267 audio9 -0,0661 6,4689