3.3 Personaliza¸c˜ ao de HRTFs
3.3.1 Redu¸c˜ ao de dimensionalidade usando o Isomap
De um modo geral, as t´ecnicas de redu¸c˜ao de dimensionalidade fornecem um m´etodo para transformar um conjunto de dados representado em uma matriz X de tamanho D × N , em um conjunto de dados correspondente de baixa dimensionalidade representado em uma matriz Y de tamanho d × N , onde d<D. A matriz X est´a composta por N vetores xi de dimens˜ao D,
X = {x1, ..., xN} ⊂ RD. (3.1)
J´a a matriz Y est´a composta por N vetores yi de dimens˜ao d,
Y = {y1, ..., yN} ⊂ Rd. (3.2) 1Define-se uma variedade (i.e. manifold ) como uma superf´ıcie curva n˜ao linear que ´e localmente euclidiana [77].
Cap´ıtulo 3. Personaliza¸c˜ao de HRTFs usando Isomap no plano horizontal 29 Novo Indivíduo HRTF Reconstrução baseada na vizinhança Modelo
Rede Neural Artificial Parâmetros Antropométricos ISOMAP Redução de Dimensionalidade Base de Dados de HRTFs F a se d e T re in a me n to HRTF de baixa dimensionalidade
Figura 3.1: Diagrama de blocos da abordagem proposta para personalizar HRTFs no plano horizontal.
Neste trabalho, utiliza-se a t´ecnica de redu¸c˜ao de dimensionalidade n˜ao-linear chamada de Isomap (Isometric Feature Mapping, mapeamento de caracter´ısticas isom´etricas) e considera-se todas as HRTFs no plano horizontal como pontos no espa¸co de alta dimensionalidade D. Por- tanto, cada HRTF ´e representada por um vetor xi de dimens˜ao D.
M´etodos lineares de redu¸c˜ao de dimensionalidade como o PCA procuram um espa¸co de baixa dimensionalidade que preserve a variˆancia medida no espa¸co de alta dimensionalidade. J´a o Isomap procura um espa¸co de baixa dimensionalidade que preserve a geometria intr´ınseca dos dados, conforme capturado pela distˆancia geod´esica (i.e a distˆancia no grafo) na variedade [80]. Assim, a ideia b´asica do Isomap ´e encontrar um espa¸co de baixa dimensionalidade de forma que pontos de alta dimensionalidade pr´oximos s˜ao mapeados perto e pontos de alta dimensionalidade distantes s˜ao mapeados longe, conforme medido pela distˆancia geod´esica.
O Isomap tem trˆes passos que s˜ao detalhados a seguir [80]:
Passo 1: Construir o grafo G(V, E) a partir do conjunto de dados de entrada X. Cada amostra xi ∈ X ´e representada por um v´ertice vi ∈ V , e dois v´ertices vi e vj s˜ao conectados
por uma aresta (vi, vj) ∈ E de comprimento dX(xi, xj) se xi for um dos K vizinhos mais
pr´oximos de xj. O comprimento da aresta dX(xi, xj) ´e dado pela distˆancia Euclidiana entre
xi e xj [80, 81]. Para determinar os vizinhos de cada v´ertice, a abordagem mais simples ´e
selecionar, para cada v´ertice, um n´umero fixo de vizinhos mais pr´oximos, K, conforme medido pela distˆancia Euclidiana ou outra m´etrica. Entretanto, outros crit´erios podem ser utilizados para selecionar os vizinhos. De fato, a sele¸c˜ao dos vizinhos pode ser bastante sofisticada [82]. Por exemplo, pode-se selecionar todos os vizinhos que est˜ao dentro de um determinado raio ou apenas selecionar um n´umero m´aximo de vizinhos mais pr´oximos. De modo geral, a sele¸c˜ao de vi- zinhos no Isomap apresenta uma oportunidade para incorporar conhecimento pr´evio do problema.
Cap´ıtulo 3. Personaliza¸c˜ao de HRTFs usando Isomap no plano horizontal 30
Passo 2: Calcular os caminhos m´ınimos entre todos os v´ertices no grafo G. As distˆancias resultantes s˜ao armazenadas em pares na matriz DG. A matriz de distˆancias DG representa as
distˆancias geod´esicas entre todas as amostras na variedade [81].
Passo 3: Construir o espa¸co de baixa dimensionalidade calculando os autovetores de τ (DG).
Define-se τ (D) como
τ (D) = −HSH/2, (3.3)
onde S ´e a matriz de distˆancias ao quadrado,
Sij = D2ij, (3.4)
e H ´e a matriz de centraliza¸c˜ao (centering matrix ),
Hij = δij − 1/N. (3.5)
Lembre que N ´e o n´umero de amostras e δ ´e fun¸c˜ao delta de Kronecker. Finalmente, seja λp
o p-´esimo autovalor (em ordem decrescente) da matriz τ (DG), e vip o i-´esimo componente do
p-´esimo autovetor [80]. Ent˜ao, define-se o p-´esimo componente do vetor de dimens˜ao d, yi, como
sendo
yi =pλpvpi. (3.6)
Como indicado no primeiro passo do Isomap, a constru¸c˜ao do grafo ´e uma oportunidade para incorporar conhecimento pr´evio do problema. No problema estudado neste texto, sabe-se que existe correla¸c˜ao devido `a simetria direita-esquerda das HRTFS em frequˆencias abaixo de 5.5 kHz [83]. Al´em disso, para ressaltar a individualidade das HRTFs ao longo de certa dire¸c˜ao, Nishino et al. [69] utilizaram redu¸c˜ao de dimensionalidade usando o PCA separadamente para cada dire¸c˜ao e ouvido. Neste trabalho, em lugar de aplicar o Isomap separadamente para cada dire¸c˜ao e ouvido, prop˜oe-se construir o grafo do Isomap levando em conta o conhecimento pr´evio mencionado.
Assim, uma de nossas contribui¸c˜oes ´e nosso procedimento de constru¸c˜ao do grafo do Isomap. Considere de novo a base de dados de alta dimensionalidade na matriz de tamanho D × N
X = {x1, ..., xN} ⊂ RD
da Equa¸c˜ao 3.1 formada por N HRTFs dos dois ouvidos de P indiv´ıduos em M azimutes no plano horizontal (i.e. N = 2 · P · M ). Conectou-se cada HRTF xi a K vizinhos e estabeleceu-se
os correspondentes comprimentos das arestas como sendo sijdX(xi, xj), onde sij ´e um fator de
escalamento, segundo as seguintes regras:
Regra 1: A ideia geral desta regra ´e manter pr´oximas HRTFs da mesma dire¸c˜ao e ouvido. Assim, se xi e xj representarem HRTFs do mesmo azimute e ouvido, ent˜ao conectar xi e xj,
e definir sij = 0.01 a fim de ressaltar a individualidade de HRTFs ao longo de determinada
Cap´ıtulo 3. Personaliza¸c˜ao de HRTFs usando Isomap no plano horizontal 31 E θ E E D D D Frente
Figura 3.2: Exemplo da primeira regra para construir o grafo do Isomap. Os v´ertices simbolizam HRTFs de alta dimensionalidade de P = 3 indiv´ıduos. Cada cor representa um indiv´ıduo diferente, onde E = Ouvido Esquerdo e D= Ouvido Direito. Note que o comprimento de todas as arestas ´e igual a 0.01 · dX(xi, xj) e que cada v´ertice conecta-se a P − 1 = 2 vizinhos.
conecta-se a P − 1 vizinhos. Para ilustrar, a Figura 3.2 mostra um exemplo de aplica¸c˜ao desta regra para P = 3 indiv´ıduos, onde cada cor representa um indiv´ıduo diferente.
Regra 2: A ideia geral desta regra ´e manter pr´oximas HRTFs de dire¸c˜oes sim´etricas. Assim, sejam θi e θj azimutes de HRTFs representadas por xi e xj respectivamente. Independentemente
do indiv´ıduo, se xi e xj representarem HRTFs de ouvidos opostos e se θj for o azimute espelho
horizontal de θi (i.e. θj = 360 − θi), ent˜ao conectar xi e xj, e definir sij = 0.01 no intuito de
tirar vantagem da simetria esquerda-direita. Ao aplicar esta regra, cada v´ertice conecta-se a P vizinhos. Para ilustrar, a Figura 3.3 mostra um exemplo de aplica¸c˜ao desta regra para P = 3 indiv´ıduos, onde cada cor representa um indiv´ıduo diferente.
θ E E E D D D Frente θ
Figura 3.3: Exemplo da segunda regra para construir o grafo do Isomap. Os v´ertices simbolizam HRTFs de alta dimensionalidade de trˆes indiv´ıduos. Cada cor representa um indiv´ıduo diferente, onde E = Ouvido Esquerdo e D= Ouvido Direito. Note que o comprimento de todas as arestas ´e igual a 0.01 · dX(xi, xj) e que cada v´ertice conecta-se a P = 3 vizinhos.
Regra 3: A ideia geral desta regra ´e manter perto HRTFs espacialmente pr´oximas do mesmo indiv´ıduo e ouvido. Assim, seja θi e θj azimutes de HRTFs do mesmo indiv´ıduo e o mesmo
ouvido representadas por xi e xj respectivamente. Se θj for o azimute mais pr´oximo maior do
que θi ou se θj for o azimute mais pr´oximo menor do que θi, ent˜ao conectar xi e xj, e definir
sij = 1. Ao aplicar esta regra, cada v´ertice conecta-se a 2 vizinhos. Para ilustrar, a Figura 3.4
Cap´ıtulo 3. Personaliza¸c˜ao de HRTFs usando Isomap no plano horizontal 32 θ D Frente D D D D D D D E E E E E E E E
Figura 3.4: Exemplo da terceira regra para construir o grafo do Isomap. Os v´ertices simbolizam HRTFs de alta dimensionalidade de um mesmo indiv´ıduo, onde E = Ouvido Esquerdo e D= Ouvido Direito. Note que o comprimento de todas as arestas ´e igual a dX(xi, xj) e que cada v´ertice conecta-se a 2
vizinhos.
Antes de aplicar o Isomap, ´e necess´ario escolher dois parˆametros: o n´umero de vizinhos, K, e a dimensionalidade intr´ınseca, d. Devido `a constru¸c˜ao de grafo proposta, o n´umero de vizinhos ´e
K = 2P + 1, (3.7)
dos quais P − 1 vizinhos foram obtidos da primeira regra, P da segunda regra e dois da terceira regra, onde P ´e o n´umero de indiv´ıduos no conjunto de dados X. Quanto `a dimensionalidade intr´ınseca, d, ela foi estimada analisando a variˆancia residual. A Figura 3.5 mostra os autovalores normalizados (em ordem decrescente) calculados a partir do conjunto de dados X. Como os autovalores fornecem a variˆancia em cada dimens˜ao, quando eles forem menores do que determinado limiar, pouco benef´ıcio ´e obtido ao acrescentar uma dimens˜ao [81]. Um valor t´ıpico do limiar ´e de 0.025 [84]. Usando tal limiar, definiu-se a dimensionalidade intr´ınseca como sendo:
d = 4.
Ao contr´ario de trabalhos anteriores [74], aplicou-se o Isomap apenas uma vez, sobre todo o conjunto de dados para as HRTFs de todos os indiv´ıduos, ouvidos e dire¸c˜oes, levando em considera¸c˜ao a sele¸c˜ao de vizinhan¸ca proposta para construir o grafo. A Figura 3.6 mostra a variedade calculada pelo Isomap para todas as dire¸c˜oes e ouvidos de 30 indiv´ıduos (i.e. P = 30, ent˜ao K = 2P + 1 = 61 vizinhos) a partir da base de HRTFs CIPIC [7] no plano horizontal, onde a cor representa o ˆangulo de azimute em graus.
Na Figura 3.6a, plota-se o primeiro componente do Isomap em fun¸c˜ao do azimute a fim de ressaltar as caracter´ısticas de simetria das HRTFs. Na Figura 3.6b e 3.6c, a variedade em duas e trˆes dimens˜oes mostra a variabilidade das HRTFs ao longo das dire¸c˜oes. Note que em cada dire¸c˜ao existem pequenos agrupamentos de HRTFs de baixa dimensionalidade
Cap´ıtulo 3. Personaliza¸c˜ao de HRTFs usando Isomap no plano horizontal 33 1 2 3 4 5 0 0. 1 0. 2 0. 3 0. 4 0. 5 x: 5 y: 0.0244 Dimensionalidade Intrínseca Au to va lo r N o rma liza d o
Figura 3.5: Estimativa de Dimensionalidade Intr´ınseca. Usando um limiar de 0.025, a dimensionalidade intr´ınseca foi escolhida como sendo d=4.
que correspondem a azimutes sim´etricos de ouvidos opostos. A variabilidade dentro desses agrupamentos ´e devido `as diferen¸cas anatˆomicas entre indiv´ıduos (veja Figura 3.7). Observe na Figura 3.6b que os agrupamentos n˜ao est˜ao uniformemente distribu´ıdos. A grande separa¸c˜ao entre alguns agrupamentos ´e causada pela amostragem n˜ao uniforme nas medi¸c˜oes da base de dados CIPIC. Conforme explicado na Se¸c˜ao 2.3.1 que a base de HRTFs CIPIC tem resolu¸c˜ao m´axima de 5◦ para dire¸c˜oes pr´oximas ao plano mediano, por´em a resolu¸c˜ao em dire¸c˜oes laterais ´
e baixa (15◦-20◦).