• Nenhum resultado encontrado

5.4 Valida¸c˜ ao dos Atributos

5.4.1 Experimento 1

Este experimento refere-se ao desempenho do mapeamento dos descritores de primeira ordem para um valor de BPM. Foi utilizado o banco total (972 m´usicas). Todas as m´etricas (1, 2 e 3) referentes `a janela de precis˜ao (4% do ground-truth tempo), aplicada na literatura, foram consideradas, ou seja, m´ultiplos e subm´ultiplos do BP M alvo (1, 1/2, 2, 1/3, 3, 4, 1/4, 6). Um acerto para uma dada m´usica foi considerado se, em pelo menos um n´ıvel de detalhe DW T , o andamento mapeado estava dentro da janela de precis˜ao. A tabela 5.1 exibe estes resultados.

Tabela 5.2: Resultados do mapeamento direto para varia¸c˜ao do limiar T h α Tempo na janela de precis˜ao, νT hCR+

1 16, 29%

0, 75 23, 13%

0, 50 24, 10%

0, 25 24, 43%

0 24, 43%

O novo atributo foi mais informativo do que todos os outros atributos de primeira ordem usados conjuntamente.

A partir do confronto dos resultados deste ensaio, foi poss´ıvel chegar a duas conclu- s˜oes. A primeira refere-se ao sucesso do novo atributo proposto para fins de extra¸c˜ao de informa¸c˜ao pertinente ao andamento musical. A segunda conclus˜ao ´e que os resultados sugerem que a aplica¸c˜ao destes atributos em fun¸c˜oes P eDF multirresolucionais foram ca- pazes, em geral, de extrair informa¸c˜ao pertinente ao andamento das m´usicas indicando que estes podem ser importantes como entradas para uma etapa decis´oria posterior.

5.4.2 Experimento 2

Este segundo experimento refere-se ao uso de outros limiares para o c´alculo do νT hCR+ . Para executar esta tarefa utilizou-se um limiar referente ao valor rms da P eDF : T h = α · P eDFrms, onde α ´e um fator multiplicativo. Os resultados encontrados s˜ao mostrados

na tabela 5.2.

Os valores demonstram que um limiar diferente de zero n˜ao melhorou a performance do mapeamento do atributo νT hCR+ e, por isto, o valor de limiar utilizado foi o T h = 0. 5.4.3 Experimento 3

Este experimento refere-se ao uso de descritores de segunda ordem. Esta classe n˜ao permite o mapeamento do atributo para o andamento da pe¸ca musical, mas gera infor- ma¸c˜oes qualitativas a respeito da P eDF . Parte-se do pressuposto que as fun¸c˜oes P eDF mais informativas s˜ao as que apresentam uma caracter´ıstica quasi -peri´odica. Em contraste, as menos informativas apresentam forma de onda pouco ou nada peri´odicas e/ou similar a um ru´ıdo. Desta forma, atributos que possam qualificar as fun¸c˜oes P eDF quanto `a periodicidade, grau tonal e grau de ru´ıdo podem auxiliar o back-end do nosso sistema, a m´aquina aplicada, a dar mais peso as informa¸c˜oes advindas de determinado n´ıvel DWT em detrimento de outros menos informativos.

Para a valida¸c˜ao num´erica dos atributos de segunda ordem foi utilizado um conjunto de sinais prot´otipos assim denominados:

• x1, sen´oide de 1Hz • x2, sen´oide de 2Hz • x3, sen´oide de 3Hz • x4, sen´oide de 4Hz • x20, sen´oide de 20Hz • x440, sen´oide de 440Hz • x1k, sen´oide de 1kHz • x10k, sen´oide de 10kHz • xwn, ru´ıdo branco

Os tons, com amplitude igual a 1, foram gerados no Matlabr e o ru´ıdo branco no programa Audacity.

Todos os atributos de segunda ordem foram calculados a partir destes sinais, e seus resultados foram confrontados com os valores esperados para suas vers˜oes ideais. Os resul- tados apresentaram conformidade com os valores padr˜ao [1].

5.4.4 Experimento 4

Este ensaio tamb´em refere-se ao uso dos descritores de segunda ordem. Desta vez, aplicaram-se os descritores nas P eDF para tentar classific´a-las, relativamente, quanto ao grau de periodicidade, grau tonal e de ru´ıdo. O objetivo foi descobrir qual seria o grau de seletividade destes atributos, ou seja, se eles produzem informa¸c˜ao num´erica capaz de criar um ordenamento da PeDF mais adequada para a menos adequada, no sentido de quasi -periodicidade. Para todos os atributos, 10 m´usicas de gˆeneros musicais distintos foram utilizadas. Assim, as 6 resolu¸c˜oes de cada observa¸c˜ao foram utilizadas para o c´alculo dos atributos e o posterior ordenamento de forma crescente destes valores. Este ranking de valores, para cada tipo de atributo, entre as resolu¸c˜oes foi ent˜ao comparado com os gr´aficos das P eDF para verificar se havia boa classifica¸c˜ao. As an´alises dos resultados est˜ao descritas a seguir.

5.4.4.1 Atributo 2: Desvio Padr˜ao (νσ)

O atributo νσ representa o desvio padr˜ao da distribui¸c˜ao das diferen¸cas de localiza¸c˜ao

entre picos adjacentes nas P eDF . Quanto maior a resolu¸c˜ao wavelet, mais pontos ter´a o vetor e consequentemente oscila¸c˜oes mais velozes podem ser representadas. Desta forma, h´a uma tendˆencia de aumento do νσ com o aumento do n´ıvel de detalhe. Isto demonstra

que o νσ isoladamente n˜ao possui boa seletividade para um conjunto de P eDF , o que foi

confirmado com experimentos preliminares. Resolveu-se, ent˜ao, gerar uma medida relativa da seguinte forma:

νσR =

νσ

νη

(5.5) Esta nova medida apresentou mais seletividade quanto `a periodicidade das P eDF . Isto foi verificado pela an´alise gr´afica das P eDF do conjunto de 10 m´usicas. Os νσR foram

calculados para cada n´ıvel wavelet e ordenados de forma crescente. Os que resultaram em valores menores foram considerados como pertencendo `as fun¸c˜oes P eDF mais peri´odicas e os gr´aficos exibiram grande conformidade com esta hip´otese.

Aqui cabe uma observa¸c˜ao importante: a pdf (p∆pk(δ)) ideal da distribui¸c˜ao dos ∆pk

deve ser um impulso localizado em um valor δi referente `a ocorrˆencia de uma ´unica dife-

ren¸ca entre picos adjacentes. Esta representaria a P eDF mais informativa do ponto de vista de νσ. O que se pˆode observar ´e que fun¸c˜oes P eDF reais quando “comportadas” (bas-

tante informativas) exibem p∆pk(δ) com dois impulsos de pesos distintos, enquanto fun¸c˜oes

de periodicidade com baixa informa¸c˜ao exibem pdf com 3 ou mais impulsos com pesos relativamente equilibrados.

5.4.4.2 Atributo 5: Spectral Spread (νSS)

O valor do atributo νSS tende a aumentar quando aumenta-se a frequˆencia dos sinais

prot´otipos, indicando que este descritor isoladamente tenderia a classificar P eDF de reso- lu¸c˜oes mais baixas como sendo as mais informativas. Desta forma, optou-se por utilizar uma medida relativa do νSS que foi denominada νSSR:

νSSR =

νSS

νSC

(5.6) Este novo descritor proposto exibiu uma boa seletividade para P eDF no que se refere ao grau de ru´ıdo. Isto foi verificado pela an´alise gr´afica das fun¸c˜oes P eDF do conjunto de 10 m´usicas. Os νSSR foram calculados para cada n´ıvel wavelet e ordenados de forma

crescente. Os que resultaram em valores menores foram considerados como pertencendo `as P eDF menos ruidosas, e os gr´aficos exibiram grande conformidade com esta hip´otese.

Em geral, as P eDFD1foram classificadas na ´ultima posi¸c˜ao, ou seja, geraram os maiores

valores de νSSR. Isto deve-se ao fato de que este detalhe tende a ser pouco informativo, pois

refere-se `a faixa de frequˆencias entre 11, 025kHz e 22, 050kHz, onde h´a pouca informa¸c˜ao sobre as periodicidades, mas muito ru´ıdo nas m´usicas em geral.

5.4.4.3 Atributo 6: Spectral Skewness (νSSk)

O νSSk tende a ser alto para fun¸c˜oes perfeitamente peri´odicas (com exce¸c˜ao de sen´oides

tendendo ao ru´ıdo branco (com exce¸c˜ao do ru´ıdo branco ideal, que tamb´em gera uma indefini¸c˜ao).

Os resultados das an´alises gr´aficas para o conjunto de m´usicas citado anteriormente demonstraram uma seletividade pobre quanto ao grau de ru´ıdo das P eDF multirresoluci- onais. Os νSSk foram calculados para cada n´ıvel wavelet e ordenados de forma crescente.

Contudo, quanto maior a resolu¸c˜ao, maior tendˆencia `a assimetria da distribui¸c˜ao de am- plitudes do espectro. Logo, para uma mesma m´usica, n˜ao houve condi¸c˜ao para confrontar as fun¸c˜oes P eDF de acordo com a hip´otese de seletividade do atributo.

5.4.4.4 Atributo 8: Spectral Crest Factor (νSCF)

Este atributo exibiu seletividade limitada para P eDF . Isto foi verificado pela an´alise gr´afica das P eDF de um conjunto de 10 m´usicas de gˆeneros distintos. Os νSCF foram

calculados para cada n´ıvel wavelet e ordenados de forma crescente. Os que resultaram em valores menores foram considerados como sendo mais ruidosos. Contudo, os resultados n˜ao mostraram conformidade com os gr´aficos analisados, exibindo polariza¸c˜ao de alguns n´ıveis DWT. Altas resolu¸c˜oes em geral s˜ao classificadas como ru´ıdo.

5.4.4.5 Atributo 9: Spectral Rolloff (νSR)

Para sen´oides ideais, o νSRtende ao valor da frequˆencia da sen´oide, e isto foi confirmado

para os sinais prot´otipos. Para o ru´ıdo branco prot´otipo, o descritor tende a 0, 85 · fS/2.

O valor do atributo νSR tende a aumentar quando aumenta-se a resolu¸c˜ao da P eDF ,

dificultando uma an´alise comparativa entre as resolu¸c˜oes. Desta forma, resolveu-se utilizar uma medida relativa do νSR que denominamos de νSRR:

νSRR =

νSR

0, 85 · fSeq/2

(5.7) onde fSeq = fS/(2i· h).

Este descritor exibiu uma seletividade limitada para P eDF no que se refere ao grau de ru´ıdo. Isto foi verificado pela an´alise gr´afica das fun¸c˜oes P eDF do conjunto de 10 m´usicas. Os νSRR foram calculados para cada n´ıvel wavelet e ordenados de forma crescente. Os

que resultaram em valores maiores foram considerados como tendendo ao ru´ıdo, j´a que a medida resulta em compara¸c˜ao com a referˆencia do ru´ıdo branco. Contudo, a tendˆencia dos valores maiores continuou nas P eDF de baixa resolu¸c˜ao (A5, D5 e D4). Esta polariza¸c˜ao

do descritor se deve ao fato de que, em baixa resolu¸c˜ao, o per´ıodo mais proeminente tende a ocorrer pr´oximo a fSeq.

5.4.4.6 Atributo 10: Spectral Decrease (νSD)

Este descritor deve ser aplicado em fun¸c˜oes P eDF que contenham n´ıvel m´edio. Todos os atributos foram calculados a partir de P eDF pr´e-processadas sendo o n´ıvel DC retirado. Logo, o uso do νSD foi reconsiderado. Foram utilizadas outras referˆencias para o c´alculo

da declividade: o νSC e o νERf 1. Contudo, o atributo continuou sem exibir seletividade

apreci´avel nesta aplica¸c˜ao e, devido ao seu desempenho, foi descartado do conjunto de atributos escolhidos.

5.4.4.7 Atributo 11: Spectral Flatness (νSF)

O νSF exibiu excelente desempenho seletivo classificando as fun¸c˜oes P eDF . Para isto

os atributos foram calculados e ordenados de forma crescente. As fun¸c˜oes P eDF que obtiveram valores maiores para o descritor foram consideradas como sendo mais ruidosas, tendˆencia de espectro plano. O ordenamento mostrou um alto grau de conformidade com os resultados gr´aficos. Este atributo mostrou-se adequado ao uso comparativo entre as resolu¸c˜oes, sem a necessidade de relativiz´a-lo, pois a faixa valores ´e similar.

5.4.4.8 Atributo 12: Predictivity Ratio (νP R)

O νP R exibiu excelente desempenho seletivo classificando as fun¸c˜oes P eDF . Para

isto, os atributos foram calculados e ordenados de forma crescente. As fun¸c˜oes P eDF que obtiveram valores menores para o descritor foram consideradas como sendo mais peri´odicas. O ordenamento mostrou um alto grau de conformidade com os resultados gr´aficos. Este atributo mostrou-se adequado ao uso comparativo entre as resolu¸c˜oes, pois a faixa de valores ´e similar.

5.4.5 Avalia¸c˜ao

Os resultados obtidos nos experimentos anteriores mostraram que alguns atributos ob- tiveram uma performance melhor. Desta forma, optou-se por reserv´a-los como um grupo especial doravante denominado de principais atributos. Assim, dentre os atributos de pri- meira ordem, os principais foram νη, νSC e νERf 1. Utilizou-se, para esta escolha, um

crit´erio de acerto superior a 60 % nos experimentos de mapeamento direto. Para os atri- butos de segunda ordem, os escolhidos como grupo principal foram νSF, νP R, νσR e νSSR.

A metodologia utilizada para a sele¸c˜ao destes ´ultimos foi denominada, ranking seletivo.

5.5 Sele¸c˜ao de Atributos

O m´etodo de sele¸c˜ao de atributos escolhido para ser utilizado neste trabalho foi o da sele¸c˜ao forward usando ortogonaliza¸c˜ao de Gram-Schmidt [18]. Neste contexto, ´e poss´ıvel aplicar este m´etodo utilizando um modelo linear com respeito aos seus parˆametros como

hip´otese onde as vari´aveis de entrada s˜ao os atributos em si, ou monˆomios formados pela multiplica¸c˜ao dos atributos, resultando em modelos polinomiais de segunda ordem ou de ordens superiores. Neste trabalho, foram testados os modelos at´e a segunda ordem, pois ordens superiores acarretariam um n´umero proibitivo de monˆomios.

Como crit´erio de parada, utilizamos uma sonda randˆomica para verificar a probabili- dade de que ela assumisse determinada posi¸c˜ao no processo de ranking via GS. Para isto, o ranking foi realizado 1000 vezes, pois notou-se que, a partir de 200 experimentos, os resultados j´a demonstravam satura¸c˜ao, indicando estabilidade da estat´ıstica. Com os re- sultados destes rankings, foi constru´ıda a cdf do ranking da sonda randˆomica FR(r) usando

uma abordagem frequentista. O limiar de confiabilidade foi FR(r) ≤ 10% para descobrir o

n´umero de atributos que seria suficientemente informativo.

As sondas foram geradas a partir do embaralhamento dos vetores de atributos na matriz de treinamento, pois isto garante um dos crit´erios estabelecidos no m´etodo de que as sondas tenham mesma distribui¸c˜ao que os atributos.

Desta forma, 4 ensaios foram realizados utilizando monˆomios simples e compostos, e um ´unico vetor de descritores contendo todos os n´ıveis wavelets ou um vetor por n´ıvel. 5.5.1 Experimento 1

Este experimento buscou a observa¸c˜ao do comportamento dos atributos escolhidos para representar as PeDF. Aqui foram realizadas 3 rodadas do ranking com Gram-Schmidt para uma matriz de treinamento com os 13 atributos (Trei1) absolutos escolhidos avaliados

anteriormente, 12 atributos absolutos (Trei2) (retirado o νSD) e 12 atributos (Trei3),

sendo dois deles relativos (νσe νSS). Na figura 5.1, pode-se observar o MSE para os 3 casos

em fun¸c˜ao dos vetores DWT (A5 = vetor 1, D5 = vetor 2, D4 = vetor 3, D3 = vetor 4,

D2 = vetor 5 e D1 = vetor 6). Desta forma, utilizou-se um vetor de descritores x ∈ Rn,

com n = 12 ou 13 atributos. O melhor desempenho com a predi¸c˜ao linear foi obtido pela matriz Trei3, o que confirma parcialmente a nossa hip´otese de que usar os atributos

relativos, anteriormente identificados como sendo mais informativos, representaria melhor as caracter´ısticas das PeDF.

5.5.2 Experimento 2

Neste experimento, um vetor de atributos x ∈ R72, referente a 12 atributos vezes 6 resolu¸c˜oes, foi utilizado (retirado o νSD). A sonda randˆomica foi introduzida como o

atributo 73, sendo as sondas geradas a partir da matriz Trei3 ∈ R72×972. Desta forma,

foram obtidos, da figura 5.2, um n´umero m´ınimo de atributos admiss´ıveis de 21, obedecendo ao limiar de confiabilidade de 10%. O MSE m´ınimo foi igual a 634, 73, o que indicou que

1 2 3 4 5 6 750 800 850 900 Vetor DWT MSE MSE Trei1 MSE Trei2 MSE Trei 3

Figura 5.1: Evolu¸c˜ao do MSE com o aumento da resolu¸c˜ao DWT

este modelo n˜ao foi capaz de aprender devidamente a rela¸c˜ao entre atributos e alvos. Desta forma, a sele¸c˜ao de atributos realizada gerou um resultado limitado.

0 20 40 60 0 0.2 0.4 0.6 0.8 1 r (ranking) F R (r) F R(22)=11,8% F R(21)=9,4%

Figura 5.2: CDF do ranking da sonda randˆomica

Ao realizar uma an´alise dos 21 atributos do ranking mais significativo, o que se repetiu mais nos experimentos, pode-se observar a ocorrˆencia dos atributos conforme a figura 5.3. Estas ocorrˆencias foram computadas para os atributos multirresolucionais. O sexto atributo (spectral skewness) n˜ao foi classificado entre os 21 primeiros.

2 4 6 8 10 12 0 1 2 3 Atributo Número de ocorrências

5.5.3 Experimento 3

Neste experimento, um vetor de atributos x ∈ R12 referente a cada n´ıvel wavelet foi utilizado (retirado o νSD). A sonda randˆomica foi introduzida como o atributo 13, sendo as

sondas geradas a partir da matriz equivalente com 972 observa¸c˜oes para os respectivos n´ıveis DWT. As cdf FR(r) dos rankings R das sondas randˆomicas de cada resolu¸c˜ao est˜ao descritas

na figura 5.4. Obedecendo ao limiar de confiabilidade m´aximo de 10%, os resultados encontrados para o n´umero de atributos admiss´ıveis est˜ao descritos na tabela 5.3, assim como os erros m´ınimos da previs˜ao do modelo.

Tabela 5.3: Resultados do ranking para modelo de primeira ordem, n´ıveis DWT versus quantidade de atributos admiss´ıveis

N´ıvel DWT Qtd. de atributos MSE

A5 9 738,19 D5 6 865,43 D4 6 855,51 D3 5 833,83 D2 7 840,82 D1 6 850,41

Os erros deste ensaio (tabela 5.3) indicam que este modelo tamb´em n˜ao foi capaz de aprender devidamente a rela¸c˜ao entre atributos e alvos. Desta forma, a sele¸c˜ao de atributos realizada gerou resultados limitados. A figura 5.5 exibe os histogramas, por resolu¸c˜ao, dos atributos selecionados nos rankings.