• Nenhum resultado encontrado

Fábio Pacheco Freeland

N/A
N/A
Protected

Academic year: 2021

Share "Fábio Pacheco Freeland"

Copied!
98
0
0

Texto

(1)

T´ECNICAS DE GERAC¸ ˜AO DE SOM TRIDIMENSIONAL

F´abio Pacheco Freeland

TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAC¸ ˜AO DOS PROGRAMAS DE P ´OS-GRADUAC¸ ˜AO DE ENGENHARIA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESS ´ARIOS PARA A OBTENC¸ ˜AO DO GRAU DE MESTRE EM CIˆENCIAS EM ENGENHARIA EL´ETRICA.

Aprovada por:

Prof. Paulo Sergio Ramirez Diniz, Ph.D.

Prof. Luiz Wagner Pereira Biscainho, D.Sc.

Prof. Marcio Nogueira de Souza, D.Sc.

Prof. Alexandre Santos de la Vega, D.Sc.

RIO DE JANEIRO, RJ - BRASIL JULHO DE 2001

(2)

FREELAND, F´ABIO PACHECO

T´ecnicas de Gera¸c~ao de Som Tridimen-sional [Rio de Janeiro] 2001

IX, 90 pp., 29,7 cm (COPPE/UFRJ, M.Sc., Engenharia El´etrica, 2001)

Tese - Universidade Federal do Rio de Janeiro, COPPE

1.Som Tridimensional 2.Aproxima¸c~ao de Fun¸c~oes de Transfer^encia 3.Filtros IIR

(3)

Agradecimentos

Gostaria de agradecer, primeiramente, a meus pais, Victor e Inˆes, meus irm˜aos, Renata, Miriam e Eduardo, minha noiva Juliana e meus amigos que, de uma forma ou de outra, formaram uma base bastante forte que possibilitou o de-senvolvimento deste trabalho.

Novamente `a Juliana pela paciˆencia, compreens˜ao e companherismo durante todo o decorrer desse trabalho.

Agrade¸co, tamb´em, a meus orientadores, Paulo Sergio Ramirez Diniz e Luiz Wagner Pereira Biscainho, pelo suporte e id´eias que fizeram com que esse trabalho fosse vi´avel e trouxesse alguma contribui¸c˜ao para o grupo de Processamento de Sinais, bem como para as pessoas que trabalham na ´area de ´audio. E, ainda, pela tranq¨uilidade essencial que me passaram.

Ao amigo e colega Cristiano N. dos Santos, pela ajuda e id´eias no decorrer dessa tese, ao amigo Paulo Antˆonio A. Esquef, que, mesmo estando longe, ajudou-me muito com a obten¸c˜ao de material utilizado nesse trabalho, aos amigos e colegas Ailton D. Santana Jr., Alexandre G. Ciancio, Andr´e C. Vliese, Augusto H. Dantas, Cassio B. Ribeiro, Cassio G. G. Duarte, Charles B. do Prado, Felipe R. Aquino, Lara Christiana R. L. Feio, Lisandro Lovisolo, Maria Heveline V. Duarte, Mauro F. de Carvalho, Ranniery da S. Maia e Rog´erio Caetano pelo companherismo e ajuda no ultrapassar dos obst´aculos f´ısicos e psicol´ogicos.

Tamb´em, aos professores, secret´arias e funcion´arios, que proporcionaram um ambiente profissional bastante agrad´avel.

A todas estas pessoas, muito obrigado, esperando que possa retribuir `a altura tudo o que fizeram por mim.

(4)

Resumo da Tese apresentada `a COPPE/UFRJ como parte dos requisitos necess´arios para a obten¸c˜ao do grau de Mestre em Ciˆencias (M.Sc.)

T´ECNICAS DE GERAC¸ ˜AO DE SOM TRIDIMENSIONAL

F´abio Pacheco Freeland

Julho/2001

Orientadores: Paulo S´ergio Ramirez Diniz Luiz Wagner Pereira Biscainho

Programa: Engenharia El´etrica

O som tridimensional tem sido utilizado em v´arias ´areas, destacando-se entre elas as de realidade virtual e afins, como a cinematogr´afica, a de simuladores e a de jogos eletrˆonicos.

Esta tese tem como objetivo principal o estudo de t´ecnicas de gera¸c˜ao de som tridimensional, principalmente do ponto de vista da localiza¸c˜ao e movimenta¸c˜ao do som.

Nesse contexto, ´e proposta uma nova forma de interpola¸c˜ao com vistas `a di-minui¸c˜ao da complexidade computacional requerida pelo sistema de realidade virtual mantendo a sensa¸c˜ao de naturalidade para o ouvinte.

(5)

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the requirements for the degree of Master of Science (M.Sc.)

TRIDIMENSIONAL SOUND GENERATION TECHNIQUE

F´abio Pacheco Freeland

July/2001

Advisors: Paulo S´ergio Ramirez Diniz Luiz Wagner Pereira Biscainho

Department: Electrical Engineering

Tridimensional sound has been used in many areas, such as virtual reality and those related to it, like movies, simulators and electronic games.

The main objective of this thesis is to study techniques for generation of tridimensional sound, specially from localization and sound motion points of view.

In this context, it is proposed a new form of interpolation aiming to de-crease the computational complexity required by the virtual reality systems while preserving the auditory sensations natural.

(6)

Sum´

ario

1 Introdu¸c˜ao 1

1.1 Motiva¸c˜ao . . . 1

1.2 Aspectos Gerais de Implementa¸c˜ao . . . 2

1.2.1 Localiza¸c˜ao e Movimenta¸c˜ao . . . 3

1.2.2 Ambienta¸c˜ao . . . 5

1.3 Objetivo desta Tese . . . 7

2 Fun¸c˜oes de Transferˆencia Relativas `a Cabe¸ca (HRTFs) 8 2.1 Aquisi¸c˜ao das HRTFs . . . 9

2.1.1 Configura¸c˜ao do Sistema de Medi¸c˜ao . . . 9

2.1.2 Cabe¸ca Artificial . . . 12

2.1.3 Compensa¸c˜ao de Fun¸c˜oes de Transferˆencia Externas `a Cabe¸ca Artificial . . . 13

2.2 Caracter´ısticas das HRTFs . . . 15

2.2.1 Fatores Envolvidos na Percep¸c˜ao . . . 15

2.2.2 Importˆancia dos Fatores na Percep¸c˜ao . . . 18

2.3 Avalia¸c˜ao das HRTFs . . . 25

2.4 Utiliza¸c˜ao das HRTFs para Gera¸c˜ao de Som Tridimensional . . . 26

3 Fun¸c˜oes de Transferˆencia Interposicionais (IPTFs) 29 3.1 Id´eia Principal . . . 30

3.2 Fun¸c˜oes de Transferˆencia Interposicionais . . . 31

3.2.1 Gera¸c˜ao das IPTFs . . . 33

3.3 Interpola¸c˜ao Utilizando as IPTFs . . . 35

(7)

3.4 Coment´arios . . . 42

4 Simplifica¸c˜ao das IPTFs 44 4.1 M´etodos para Simplifica¸c˜ao das IPTFs . . . 45

4.1.1 M´etodo BMR . . . 45

4.1.2 Identifica¸c˜ao Adaptativa por Equation Error . . . 49

4.1.3 M´etodos de Suaviza¸c˜ao de Espectro . . . 52

4.1.4 M´etodos de Aproxima¸c˜ao Complexa . . . 55

4.2 T´ecnicas de Simplifica¸c˜ao . . . 57

4.2.1 Simplifica¸c˜ao das HRTFs Utilizadas na Raz˜ao (IPTF) . . . 57

4.2.2 Simplifica¸c˜ao das IPTFs . . . 58

4.2.3 Simplifica¸c˜ao de Fun¸c˜oes Suavizadas . . . 64

4.3 Conclus˜oes e Solu¸c˜ao Adotada . . . 68

5 Movimento da Fonte Virtual 71 5.1 Algoritmo de Movimento . . . 72

5.1.1 Testes com IPTFs sem Simplifica¸c˜ao . . . 74

5.2 Movimento com IPTFs Simplificadas–Solu¸c˜ao Adotada . . . 75

6 Conclus˜ao 82

Referˆencias Bibliogr´aficas 85

(8)

Lista de Figuras

1.1 Gera¸c˜ao de som tridimensional com sistema multi-canal . . . 4

1.2 Compara¸c˜ao entre as dire¸c˜oes do som direto e do som refletido. . . 6

2.1 Esquema do sistema de medi¸c˜ao das HRTFs. . . 10

2.2 Obten¸c˜ao do par de HRIRs para cada posi¸c˜ao. . . 13

2.3 Diagrama em blocos do sistema de medi¸c˜ao. . . 14

2.4 Verifica¸c˜ao da diferen¸ca de tempo interaural (ITD). . . 16

2.5 ITD e ILD ao se variar a eleva¸c˜ao da fonte. . . 17

2.6 Regi˜ao de importˆancia dos fatores ITD e ILD (I). . . 19

2.7 Regi˜ao de importˆancia dos fatores ITD e ILD (II). . . 20

2.8 Regi˜ao de importˆancia dos fatores ITD e ILD (III). . . 21

2.9 Regi˜ao de importˆancia dos fatores relacionados com as reflex˜oes na pina e no tronco (I). . . 22

2.10 Regi˜ao de importˆancia dos fatores relacionados com as reflex˜oes na pina e no tronco (II). . . 23

2.11 Regi˜ao de importˆancia dos fatores relacionados com as reflex˜oes na pina e no tronco (III). . . 24

2.12 M´etodo de interpola¸c˜ao bilinear. . . 28

3.1 Fun¸c˜ao de transferˆencia interaural (ITFs). . . 30

3.2 Modelo das HRTFs atrav´es das ITFs. . . 31

3.3 Compara¸c˜ao das dinˆamicas das fun¸c˜oes ipsi- e contralateral com a ITF. 32 3.4 Fun¸c˜ao de Transferˆencia Interposicional. . . 33

3.5 Aproxima¸c˜oes de fase m´ınima. . . 35

(9)

3.7 Limita¸c˜ao da regi˜ao de interpola¸c˜ao para o conjunto de fun¸c˜oes

esco-lhido. . . 37

3.8 Distˆancias angulares absolutas utilizadas no c´alculo dos parˆametros α, β e γ. . . 38

3.9 Diagrama em blocos da interpola¸c˜ao utilizando as IPTFs. . . 40

3.10 An´alise gr´afica do teste feito para a interpola¸c˜ao. . . 41

3.11 Exemplo do teste da interpola¸c˜ao (I). . . 42

3.12 Exemplo do teste da interpola¸c˜ao (II). . . 43

4.1 Identifica¸c˜ao adaptativa IIR. . . 50

4.2 Identifica¸c˜ao de sistemas por equation-error. . . 51

4.3 Aproxima¸c˜ao aplicando o m´etodo BMR sobre as HRTFs. . . 59

4.4 Aproxima¸c˜ao aplicando o m´etodo BMR sobre as IPTFs. . . 61

4.5 Exemplo de resultado do m´etodo BMR sobre as IPTFs representadas por filtros IIR. . . 62

4.6 Redu¸c˜ao de ordem aplicando o m´etodo equation error. . . 64

4.7 Efeito das grandes varia¸c˜oes nas altas freq¨uˆencias sobre o m´etodo de redu¸c˜ao de ordem das IPTFs. . . 65

4.8 Exemplo de simplifica¸c˜ao das IPTFs suavizadas com a t´ecnica BMR com aproxima¸c˜ao FIR. . . 67

4.9 Atua¸c˜ao da suaviza¸c˜ao em fun¸c˜oes com “picos” elevados. . . 69

4.10 Exemplo de suaviza¸c˜ao utilizando a m´edia geom´etrica. . . 70

5.1 Diagrama em blocos do algoritmo de movimento. . . 73

5.2 Exemplo de mudan¸ca de parˆametros durante o movimento. . . 74

5.3 Efeito do transit´orio dos filtros. . . 76

5.4 Exemplo de diagrama de p´olos e zeros das IPTFs. . . 77

5.5 Deslocamento dos p´olos das IPTFs em dire¸c˜ao `a origem. . . 78

5.6 Efeito do transit´orio dos filtros com redu¸c˜ao dos m´odulos dos p´olos pr´oximos a −1. . . 79

(10)

Cap´ıtulo 1

Introdu¸c˜

ao

1.1

Motiva¸c˜

ao

O som ´e um importante elemento na percep¸c˜ao do ambiente em nossa volta. ´

E com aux´ılio dele que pessoas com deficiˆencia visual podem ter uma vida pratica-mente normal. Isso se torna poss´ıvel porque no som est´a embutida grande parte da informa¸c˜ao do ambiente em que se est´a imerso.

Al´em dessa caracter´ıstica, o som tem a capacidade de transmitir/criar emo-¸c˜oes. Essa propriedade se mostra claramente quando se toma um susto ao se ouvir um barulho um pouco mais forte ou quando se sente a emo¸c˜ao transmitida pelo autor de uma pe¸ca musical.

Essas caracter´ısticas do som tˆem sido largamente utilizadas pela ind´ustria cinematogr´afica e em jogos eletrˆonicos para criar sensa¸c˜oes cada vez mais real´ısticas e emocionantes.

Sistemas de realidade virtual devem gerar um som que seja o mais real poss´ıvel para uma situa¸c˜ao determinada ao sistema; por isso, necessitam de t´ecnicas de gera¸c˜ao de efeitos sonoros mais precisas.

Algumas t´ecnicas que vˆem sendo vastamente utilizadas nessas aplica¸c˜oes s˜ao as de gera¸c˜ao de som tridimensional. Estas t´ecnicas ganharam for¸ca quando o sistema digital de reprodu¸c˜ao multicanal come¸cou a ser utilizado em salas de cinema, pois as equipes de efeitos sonoros, pensando nesse tipo de sistema de reprodu¸c˜ao, come¸caram a utilizar efeitos de localiza¸c˜ao e movimento, criando um som mais envolvente.

(11)

Essas t´ecnicas se dividem em dois principais grupos, do ponto de vista da reprodu¸c˜ao: as que geram o som tridimensional em caixas ac´usticas e as que o geram em fones de ouvido. As relacionadas com caixas ac´usticas podem-se dividir ainda naquelas que geram o efeito utilizando dois canais e naquelas que geram o efeito utilizando mais de dois canais.

A t´ecnica a ser utilizada depende da aplica¸c˜ao. Em sistemas de realidade virtual, a utiliza¸c˜ao de fones de ouvido torna-se mais adequada, tendo em vista que esse sistema ´e utilizado por apenas um usu´ario; e, mesmo que seja utilizado por mais de um usu´ario, o que ´e ouvido por um n˜ao pode ser escutado pelo outro da mesma maneira. J´a em sistemas de proje¸c˜ao de filmes, a utiliza¸c˜ao de fones de ouvido se torna pouco pr´atica, pois, al´em de o sistema ser muito mais sujeito a problemas t´ecnicos, a utiliza¸c˜ao de fones parece um pouco desconfort´avel para o espectador. Nesse caso, o sistema multicanal se torna mais adequado. No caso dos jogos eletrˆonicos, a forma de reprodu¸c˜ao ´e escolhida mais por raz˜oes econˆomica e pr´atica do que qualquer outra coisa. Na maioria dos casos, o sistema de reprodu¸c˜ao encontrado em computadores pessoais e videojogos tem como terminais duas caixas ac´usticas. E, como um jogo n˜ao deve exigir equipamentos especiais para seu fun-cionamento (isso pode acarretar a n˜ao aceita¸c˜ao do jogo pelo mercado), os efeitos sonoros devem estar voltados para a reprodu¸c˜ao em caixas. No m´aximo, a utiliza¸c˜ao de um par de fones de ouvido pode ser sugerida.

Para cada uma dessas t´ecnicas de gera¸c˜ao de sons tridimensionais, diferentes aspectos s˜ao levados em conta na implementa¸c˜ao. Alguns deles ser˜ao discutidos na pr´oxima se¸c˜ao.

1.2

Aspectos Gerais de Implementa¸c˜

ao

As t´ecnicas utilizadas em um sistema de gera¸c˜ao de som tridimensional podem ser divididas em dois principais grupos: o respons´avel pela localiza¸c˜ao espacial do som e o respons´avel pela sua ambienta¸c˜ao.

(12)

1.2.1

Localiza¸c˜

ao e Movimenta¸c˜

ao

A separa¸c˜ao em duas partes pode ser feita porque a sensa¸c˜ao de localiza¸c˜ao tem como principal causa a geometria da cabe¸ca humana. A frente de onda gerada por uma fonte em uma determinada posi¸c˜ao percorre dois caminhos principais em dire¸c˜ao aos dois ouvidos, respectivamente. Nesse percurso, algumas modifica¸c˜oes, diferentes para cada um dos caminhos, s˜ao atribu´ıdas `as frentes de onda. Essas altera¸c˜oes atribu´ıdas ao som s˜ao o resultado de reflex˜oes no tronco e na pina (ouvido externo) e da difra¸c˜ao causada pela cabe¸ca (chamada tamb´em de sombra da cabe¸ca). Dependendo da forma de reprodu¸c˜ao, a cria¸c˜ao da sensa¸c˜ao de localiza¸c˜ao se d´a de maneiras bem distintas. No caso da utiliza¸c˜ao de caixas ac´usticas, a preo-cupa¸c˜ao est´a em gerar um campo ac´ustico que dˆe a impress˜ao de localiza¸c˜ao, j´a que as modifica¸c˜oes relacionadas ao conjunto cabe¸ca-tronco-pina ser˜ao atribu´ıdas pelo pr´oprio conjunto do ouvinte. Esse campo ac´ustico ´e gerado pela composi¸c˜ao das frentes de onda referentes a cada caixa ac´ustica.

No caso dos sistemas multicanal, a posi¸c˜ao de cada caixa deve ser determinada e cada uma ´e excitada de forma a compor o campo desejado. Nessa forma de reprodu¸c˜ao, que ´e chamada de Base de Vetores Balanceada em Amplitude (VBAP– Vector Base Amplitude Panning [1]), cada caixa ´e representada por um vetor com origem na posi¸c˜ao do ouvinte, e o m´odulo desses vetores ´e tal que a soma vetorial deles tem m´odulo 1 na dire¸c˜ao desejada para a fonte virtual (veja na Figura 1.1).

Para o caso est´ereo com caixas ac´usticas, outras alternativas como inser¸c˜ao de atraso e diferen¸cas na fase entre os canais [2] devem ser utilizadas. Mas problemas como interferˆencia entre canais acabam por prejudicar a eficiˆencia do sistema de localiza¸c˜ao.

A utiliza¸c˜ao de caixas ac´usticas torna o problema da interferˆencia bastante relevante [3], por isso devem ser utilizadas caixas bem direcionais e a sala de re-produ¸c˜ao deve ser preparada acusticamente para ter poucas reflex˜oes. Pode-se no-tar tamb´em que, ao se utilizarem apenas dois canais, n˜ao ´e poss´ıvel, de uma forma simples, conseguir posicionar a fonte virtual fora do plano formado pelos pontos correspondentes `as posi¸c˜oes das caixas e do ouvinte. No caso multicanal, isso se torna poss´ıvel, mas devem existir caixas acima e abaixo do plano horizontal. Na Figura 1.1, vˆe-se a fonte virtual acima do plano horizontal. Para que seja poss´ıvel

(13)

Ouvinte Caixa Z

Caixa Y

Caixa X Fonte Virtual

Figura 1.1: Esquema de gera¸c˜ao de som tridimensional com sistema multicanal. posicionar a fonte virtual abaixo do plano horizontal, ´e necess´ario mais um canal com a caixa a ele relacionada posicionada abaixo desse plano (n˜ao necessariamente no eixo vertical).

J´a no caso est´ereo utilizando fones de ouvido, a mesma sensa¸c˜ao obtida com o campo ac´ustico deve ser reproduzida. Para isso, ´e necess´ario saber como o cami-nho modifica o som; isso significa que ´e preciso levar em considera¸c˜ao as altera¸c˜oes ocasionadas pelo conjunto cabe¸ca-tronco-pina. Essa informa¸c˜ao de como o conjunto cabe¸ca-tronco-pina altera o som pode ser representada por fun¸c˜oes de transferˆencia entre o ponto onde est´a a fonte virtual e cada um dos ouvidos. Essas fun¸c˜oes de transferˆencia, chamadas de Fun¸c˜oes de Transferˆencia Relativas `a Cabe¸ca (HRTFs– Head-Related Transfer Functions) s˜ao medidas com o aux´ılio de uma cabe¸ca artifi-cial.

A cabe¸ca artificial consiste de uma esp´ecie de cabe¸ca de manequim oca com orif´ıcios no lugar das orelhas. Por dentro da cabe¸ca, 2 microfones muito sens´ıveis e calibrados s˜ao colocados nos orif´ıcios. Por fora da cabe¸ca, no entorno desses orif´ıcios s˜ao colocados orelhas moldadas em material especial (parecido com uma borracha), de forma que a cabe¸ca possa ser considerada um bom modelo para a cabe¸ca humana

(14)

m´edia. Em uma sala anec´oica, repete-se para v´arios pontos diferentes a medi¸c˜ao da fun¸c˜ao de transferˆencia entre uma fonte sonora real e os ouvidos da cabe¸ca artificial. Essas medi¸c˜oes s˜ao feitas em pontos pertencentes a uma esfera de raio r que envolve a cabe¸ca. Ao final das medi¸c˜oes, obtˆem-se duas fun¸c˜oes de transferˆencia para cada ponto medido, uma referente a cada ouvido.

Em [4], Gardner e Martin executaram tais medi¸c˜oes, que depois disponibi-lizaram na Internet. Essas fun¸c˜oes medidas por eles s˜ao utilizadas em todo este trabalho.

Como n˜ao ´e poss´ıvel obter as HRTFs para todas as dire¸c˜oes poss´ıveis, torna-se necess´aria uma forma de interpola¸c˜ao para que torna-seja poss´ıvel posicionar a fonte virtual em todos os pontos em volta do ouvinte. Em [5], ´e utilizada uma interpola¸c˜ao bilinear. Essa interpola¸c˜ao consiste de uma pondera¸c˜ao das HRTFs mais pr´oximas que delimitam a regi˜ao no espa¸co onde se encontra a posi¸c˜ao desejada para a fonte virtual.

A interpola¸c˜ao se torna mais necess´aria ainda quando se precisa dar no¸c˜ao de movimento ao som. O movimento exige a interpola¸c˜ao para que n˜ao se gere um som se movimentando “em saltos” e para que o n´umero de HRTFs medidas n˜ao aumente muito.

1.2.2

Ambienta¸c˜

ao

O som tridimensional gerado somente a partir das HRTFs tem a informa¸c˜ao de localiza¸c˜ao. Essa informa¸c˜ao, no entanto, n˜ao ´e suficiente, tendo em vista que o som que estamos acostumados a ouvir carrega, tamb´em, bastante informa¸c˜ao do ambiente em que foi gravado. Isso implica voltar um pouco da aten¸c˜ao para a cria¸c˜ao da ambienta¸c˜ao adequada `a posi¸c˜ao virtual desejada.

A ambienta¸c˜ao ´e constru´ıda por modificadores externos ao sistema cabe¸ca-tronco-pina mencionado anteriormente: reflex˜oes em anteparos, absor¸c˜ao atmosf´eri-ca e absor¸c˜ao pelos anteparos s˜ao efeitos atribu´ıdos `a ambienta¸c˜ao. Tais modifiatmosf´eri-cado- modificado-res n˜ao s˜ao totalmente independentes da localiza¸c˜ao, pois para cada nova frente de onda criada por reflex˜oes est´a impl´ıcita uma localiza¸c˜ao. Por exemplo, uma frente de onda refletida em um anteparo chega aos ouvidos percorrendo um caminho di-ferente do som direto (que parte da fonte para os ouvidos sem encontrar nenhum

(15)

anteparo). Os efeitos da reflex˜ao s˜ao aplicados ao som no momento da reflex˜ao, e o de localiza¸c˜ao, ao chegar ao ouvinte. Portanto, esse som refletido tem a ele atribu´ıda uma posi¸c˜ao diferente da posi¸c˜ao da fonte.

Isso pode ser percebido melhor na Figura 1.2. Nessa Figura, pode-se notar a diferen¸ca de dire¸c˜ao entre o som direto e o refletido. Nota-se tamb´em que, no caso dos sons refletidos, o sistema de localiza¸c˜ao deve atribuir a cada reflex˜ao uma dire¸c˜ao diferente, de forma dar uma sensa¸c˜ao mais real do ambiente em quest˜ao.

. Som Refletido Som Direto Fonte Anteparo Ouvinte

Figura 1.2: Compara¸c˜ao entre as dire¸c˜oes do som direto e do som refletido. Al´em das reflex˜oes, a ambienta¸c˜ao artificial tamb´em carrega em si a in-forma¸c˜ao da distˆancia `a fonte (j´a que as HRTFs s˜ao medidas a uma distˆancia fixa da cabe¸ca artificial), das absor¸c˜oes atmosf´ericas e daquelas ocorridas quando das reflex˜oes em anteparos.

Quanto `a distˆancia da fonte, pode-se utilizar a lei do inverso do quadrado da distˆancia [2], que d´a a amplitude do sinal como proporcional ao inverso da distˆancia do ouvinte `a fonte. Isso pode ser feito porque o modelo adotado para a fonte, nesse caso, ´e o de uma fonte omnidirecional e, assim, essa redu¸c˜ao da energia com a distˆancia ´e causada simplesmente pelo fato de a energia se distribuir igualmente em todas as dire¸c˜oes.

Existe um efeito que ´e desconsiderado pela parcela da ambienta¸c˜ao mostrada acima: a absor¸c˜ao atmosf´erica. O efeito da absor¸c˜ao depende n˜ao s´o da distˆancia como tamb´em da freq¨uˆencia. Em [6], ´e mostrada uma forma anal´ıtica de se calcular

(16)

a atenua¸c˜ao imposta pela distˆancia para cada freq¨uˆencia como conseq¨uˆencia dessa absor¸c˜ao sem levar em conta a atenua¸c˜ao modelada pela lei do inverso da distˆancia, que atua em todas as freq¨uˆencias igualmente. Se esse efeito for, ent˜ao, utilizado em conjunto com a lei do inverso da distˆancia, resolve-se o caso das atenua¸c˜oes dependentes da distˆancia [5, 7].

Para o caso das atenua¸c˜oes causadas em reflex˜oes, pode-se utilizar um fator de absor¸c˜ao inerente a cada superf´ıcie. Esse modelo n˜ao ´e absolutamente rigoroso, pois ´e sabido que para a reflex˜ao ser perfeita os comprimentos de onda das freq¨uˆencias que comp˜oem o som devem ser menores que o menor comprimento da superf´ıcie do anteparo. Portanto, para sons com comprimentos de onda maiores (freq¨uˆencias baixas), pode ocorrer uma parcela importante de reflex˜ao difusa que os atenuar´a, pelo fato de distribuir a energia da onda incidente em v´arias dire¸c˜oes. Essa varia¸c˜ao do fator de absor¸c˜ao com a freq¨uencia normalmente n˜ao ´e modelada como tal, mas o efeito da difus˜ao pode ser considerda.

1.3

Objetivo desta Tese

Esta tese se ocupa da implementa¸c˜ao de um sistema de gera¸c˜ao de som tri-dimensional utilizando fones de ouvido.

Tem como objetivo principal o estudo das t´ecnicas de gera¸c˜ao de som tri-dimendional, principalmente do ponto de vista da localiza¸c˜ao e movimenta¸c˜ao do som, para servir de base a futuros estudos.

Al´em disso, ´e proposta uma nova forma de interpola¸c˜ao das HRTFs visando `a redu¸c˜ao da complexidade computacional na gera¸c˜ao do movimento, diminuindo o n´umero de multiplica¸c˜oes por amostra calculada.

Tem-se em vista a aplica¸c˜ao dessa t´ecnica em sistemas de realidade virtual, jogos eletrˆonicos e quaisquer aplica¸c˜oes que se utilizem de fones de ouvido e requei-ram do som uma maior sensa¸c˜ao de realidade.

(17)

Cap´ıtulo 2

Fun¸c˜

oes de Transferˆ

encia Relativas

`

a Cabe¸ca (HRTFs)

Todos os sistemas de gera¸c˜ao de som tridimensional com vistas `a reprodu¸c˜ao utilizando fones de ouvido tˆem, de alguma forma, que levar em considera¸c˜ao as modifica¸c˜oes atribu´ıdas `as frentes de onda sonora pelo conjunto receptor que consiste da cabe¸ca, da pina e do tronco.

Essas modifica¸c˜oes podem ser representadas por fun¸c˜oes de transferˆencia de-pendentes da dire¸c˜ao de que est´a vindo o som. Essas fun¸c˜oes de transferˆencia s˜ao chamadas de Fun¸c˜oes de Transferˆencia Referentes `a Cabe¸ca (Head-Related Transfer Functions–HRTFs).

Essas fun¸c˜oes, como j´a foi mencionado, s˜ao medidas de v´arias dire¸c˜oes dife-rentes em condi¸c˜oes especiais. Um conjunto delas foi obtido por Gardner e Martin em [4] e, na Se¸c˜ao 2.1, ser´a mostrada a descri¸c˜ao do procedimento de medi¸c˜ao uti-lizado naquela referˆencia para se ter uma vis˜ao mais precisa do processo de gera¸c˜ao de som tridimensional.

Ap´os a Se¸c˜ao 2.1–Aquisi¸c˜ao das HRTFs, nesse cap´ıtulo discutem-se al-gumas caracter´ısticas importantes das HRTFs na Se¸c˜ao 2.2–Caracter´ısticas das HRTFs; tecem-se alguns coment´arios sobre os m´etodos de avalia¸c˜ao das HRTFs me-didas na Se¸c˜ao 2.3–Avalia¸c˜ao das HRTFs; e mostra-se como utilizar as HRTFs para gera¸c˜ao do som tridimensional na Se¸c˜ao 2.4–Utiliza¸c˜ao das HRTFs para Gera¸c˜ao de Som Tridimensional.

(18)

2.1

Aquisi¸c˜

ao das HRTFs

Um dos pontos principais na gera¸c˜ao de som tridimensional em fones de ou-vido ´e a obten¸c˜ao das HRTFs para v´arias dire¸c˜oes. Como nesta tese foram utilizadas HRTFs medidas em [4], ser´a feita nesta se¸c˜ao uma breve explana¸c˜ao de como se de-vem realizar as medi¸c˜oes, mencionando-se o sistema utilizado e como ´e a estrutura da cabe¸ca artificial com as quais foram medidas as HRTFs.

Al´em disso, ser˜ao vistas tamb´em quais as fun¸c˜oes de transferˆencia auxiliares que devem ser medidas al´em das HRTFs para que se possa ter um conjunto de HRTFs que s´o digam respeito `a fun¸c˜ao de transferˆencia entre o ponto onde est´a a fonte e os ouvidos. Afinal, a resposta em freq¨uˆencia do sistema de reprodu¸c˜ao utilizado na medi¸c˜ao n˜ao deve interferir na obten¸c˜ao das HRTFs.

2.1.1

Configura¸c˜

ao do Sistema de Medi¸c˜

ao

O sistema de medi¸c˜ao utilizado por Gardner e Martin ´e baseado em um computador equipado com uma placa de aquisi¸c˜ao/reprodu¸c˜ao de ´audio que, em conjunto com um sistema de caixas ac´usticas e uma cabe¸ca artificial dentro de uma sala anec´oica, obt´em a fun¸c˜ao de transferˆencia na forma da resposta impulsiva para cada dire¸c˜ao.

Para se poder medir as HRTFs em v´arias dire¸c˜oes diferentes, a cabe¸ca arti-ficial ´e montada sobre uma base girat´oria, controlada pelo computador, que pode posicionar a frente da cabe¸ca, com bastante precis˜ao (cent´esimo de grau), em um ˆangulo de azimute θ relativo ao azimute da caixa ac´ustica (referˆencia zero). A caixa, por sua vez, ´e fixada a um trilho que a deixa a uma distˆancia fixa de 1,4m do centro da cabe¸ca, deixando mudar somente sua posi¸c˜ao angular de eleva¸c˜ao φ. Na Figura 2.1, pode-se ver um esquema do sistema que deve ser montado na sala anec´oica.

Nota-se, nessa figura, que o trilho onde ´e afixada a caixa n˜ao est´a sendo mostrado. Somente suas poss´ıveis posi¸c˜oes ´e que est˜ao representadas. O trilho n˜ao s´o mant´em fixa a distˆancia da caixa ao centro da cabe¸ca como tamb´em mant´em o azimute da caixa igual a zero. Outro detalhe s˜ao os ˆangulos m´ınimo e m´aximo de eleva¸c˜ao: s´o s˜ao medidas as HRTFs com eleva¸c˜ao entre −40o e 90o.

(19)

motor (ao computador) 1,40 m caixa ac´ustica m´ovel da caixa posi¸c˜oes dire¸c˜ao associada `a HRTF de eleva¸c˜ao (−40o) menor ˆangulo x y z θ φ . . dire¸c˜ao de referˆencia

Figura 2.1: Esquema do sistema de medi¸c˜ao das HRTFs utilizado por Gardner e Martin em [4]: θ ´e o ˆangulo de azimute e φ ´e o ˆangulo de eleva¸c˜ao.

Com a configura¸c˜ao mostrada, efetuam-se as medidas1 reproduzindo-se uma

seq¨uˆencia pseudo-aleat´oria chamada de ML (Maximum Length) [8] e, simultanea-mente, gravando-se o sinal captado pelos microfones da cabe¸ca artificial. O sinal de medida ´e formado por 2N amostras resultantes da duplica¸c˜ao das N amostras da seq¨uˆencia ML. Das 2N amostras medidas em cada canal, as N primeiras amostras s˜ao descartadas e as N restantes s˜ao novamente duplicadas. Com essas 2N amostras, calcula-se a correla¸c˜ao cruzada com a seq¨uˆencia original de N amostras, gerando um resultado de 3N − 1 amostras. A resposta impulsiva de N amostras, chamada de HRIR (Head-Related Impulse Response), relativa `a HRTF que est´a sendo medida pode ser obtida extraindo-se as amostras do resultado anterior a partir da amostra N−1. Nessas medidas, Martin e Gardner utilizaram N = 16383. Esse procedimento de medida ´e repetido para cada uma das posi¸c˜oes desejadas. Em [4], foram medidas

(20)

Tabela 2.1: N´umero de HRTFs medidas e passo em azimute para cada eleva¸c˜ao. Eleva¸c˜ao (φ) N´umero de medidas Passo em azimute (∆θ)

-40 56 6,43 -30 60 6,00 -20 72 5,00 -10 72 5,00 0 72 5,00 10 72 5,00 20 72 5,00 30 60 6,00 40 56 6,43 50 45 8,00 60 36 10,00 70 24 15,00 80 12 30,00 90 1 –

respostas com eleva¸c˜oes entre −40o e 90o, com passo de 10o, e, nos azimutes de 0o

a 360o, com passo dependente da eleva¸c˜ao (veja Tabela 2.1).

Cada uma das medidas gera, para cada pina, uma resposta impulsiva com 16383 amostras a uma taxa de 44100 Hz. Delas, observou-se que as primeiras 230 amostras eram relativas ao atraso causado pela propaga¸c˜ao no ar no percurso entre a caixa e a cabe¸ca em conjunto com o atraso entre as opera¸c˜oes play/record. Al´em disso, Martin e Gardner notaram que ap´os algumas centenas de amostras, al´em do efeito da resposta `a cabe¸ca artificial ser muito pequeno, aparecem reflex˜oes causadas pelo equipamento montado na cˆamara anec´oica, como, por exemplo, da mesa onde est´a montada a cabe¸ca artificial. De forma a reduzir a base de dados relativos `as HRTFs sem que nada de interesse fosse perdido, das 16383 amostras da resposta impulsiva eliminaram-se as 200 amostras iniciais (atrasos relativos `a propaga¸c˜ao no ar e o atraso entre a opera¸c˜ao play/record ) e extra´ıram-se como HRIR as 512 amostras seguintes (pois ap´os essas amostras a resposta da cabe¸ca atingia valores muito pequenos).

(21)

A essas HRIRs de 512 amostras, foram incorporadas as respostas em fre-q¨uˆencia do sistema amplificador/caixa ac´ustica utilizado na medi¸c˜ao (a discuss˜ao de fun¸c˜oes de transferˆencias que interferem nas medidas ser´a feita na Subse¸c˜ao 2.1.3). Ao incorporar a resposta do sistema de medi¸c˜ao, a amplitude das HRIRs atingem valores baixos em um tempo mais curto, ent˜ao, pode-se reduzir o n´umero de amostras de cada HRIR para 128. Sendo assim, criou-se um conjunto de HRIRs com 128 amostras que j´a levam em considera¸c˜ao (compensam) a resposta em freq¨uˆencia do sistema da medi¸c˜ao . Essas foram as fun¸c˜oes de transferˆencia utilizadas nesta tese.

2.1.2

Cabe¸ca Artificial

A cabe¸ca artificial consiste de um par de microfones de precis˜ao montados na parte interna da cabe¸ca de um manequim. Nesse manequim mostrado na Figura 2.1, com tronco superior (torso), pesco¸co e cabe¸ca, existem dois orif´ıcios no lugar dos ou-vidos, onde os microfones s˜ao colocados para captar o que possivelmente os t´ımpanos de uma pessoa receberiam.

A cabe¸ca artificial utilizada por Martin e Gardner ´e uma KEMAR–Knowles Electronics Mannequin for Acoustic Research (modelo DB-4004) equipada com dois modelos diferentes de pina: uma de tamanho m´edio para o ouvido esquerdo (modelo 061) e uma de tamanho um pouco maior para o ouvido direito (modelo DB-065). O conjunto microfone/preamplificador ´e do modelo Etymotic ER-11. As sa´ıdas do pr´e-amplificador s˜ao ligadas `as entradas do conversor A/D de uma placa Audiomedia, que equipa o computador que controla as medi¸c˜oes.

Com a cabe¸ca artificial montada dessa forma, obtˆem-se para os dois tipos de pina respostas impulsivas diferentes em uma mesma eleva¸c˜ao e em azimutes sim´etricos, com isso, em uma mesma eleva¸c˜ao, a resposta ao ouvido direito no azi-mute θ ´e diferente da resposta ao ouvido esquerdo no aziazi-mute −θ. Assim, com as medidas realizadas para os ouvidos direito e esquerdo, geram-se os pares de HRIRs que representam a resposta de uma cabe¸ca artificial sim´etrica com pina de tamanho m´edio e pouco acima da m´edia, respectivamente.

Ao final, um par de HRIRs relativo a uma determinada posi¸c˜ao (azimute θ e eleva¸c˜ao φ) ´e formado por duas respostas do mesmo ouvido: uma no azimute θ e ou-tra de azimute−θ como ilustrado na Figura 2.2. O par referente `a pina de tamanho

(22)

m´edio ´e obtido agrupando as HRTFs HDB−061(θ) e HDB−061(−θ) para representar

os ouvidos esquerdo e direito, respectivamente. J´a o outro par, HDB−065(−θ) e

HDB−065(θ), deve representar os ouvidos esquerdo e direito, respectivamente, para a

pina de tamanho acima da m´edia. Por exemplo, na eleva¸c˜ao de 20o o par de HRIRs

relativo ao azimute 30o com o tamanho de orelha m´edio ´e formado pelas HRIRs

medidas pelo microfone montado no ouvido esquerdo (lado da pina m´edia) que tem eleva¸c˜ao 20o com azimutes 30o e −30o para representar as respostas dos ouvidos

esquerdo e direito, respectivamente. No caso da resposta da cabe¸ca artificial com a pina de tamanho um pouco maior, as HRIRs s˜ao as medidas com o microfone direito, na mesma eleva¸c˜ao mas com os azimutes trocados: −30o para representar o

ouvido esquerdo e 30o para o direito.

. x y dire¸c˜ao de referˆencia Fonte Ouvinte θ HDB−065(θ) HDB−061(θ) (a) . x y Fonte Ouvinte dire¸c˜ao de referˆencia . −θ HDB−065(−θ) HDB−061(−θ) (b)

Figura 2.2: Obten¸c˜ao do par de HRIRs para cada posi¸c˜ao. Em (a), com a fonte localizada no azimute de θ e em (b) com a fonte localizada no azimute de−θ.

2.1.3

Compensa¸c˜

ao de Fun¸c˜

oes de Transferˆ

encia Externas `

a

Cabe¸ca Artificial

Como em qualquer procedimento de medida de fun¸c˜ao de transferˆencia, ´e necess´ario ter o cuidado de isolar completamente a fun¸c˜ao de transferˆencia que se quer medir da influˆencia dos instrumentos utilizados em tal medida.

(23)

influir no resultado da medida. As respostas do amplificador, da caixa ac´ustica, da sala onde ´e feita a medida e do microfone devem ser devidamente compensadas para que nenhuma dessas partes do sistema de medida venha interferir na medi¸c˜ao da fun¸c˜ao de transferˆencia desejada.

O esquema da Figura 2.3 mostra as fun¸c˜oes de transferˆencia envolvidas na medi¸c˜ao das HRTFs. Nessa figura, vˆe-se o caminho percorrido pelo sinal de medi¸c˜ao

microfone HRTF

amplificador

.

anec´oicacˆamara ac´caixaustica

pr´e-amplificador para o microfone anti-alias filtro conversor A/D conversor D/A sinal medido sinal de teste .

Sa´ıda de ´audio da placa Audiomedia II DSP

Figura 2.3: Diagrama em blocos do sistema de medi¸c˜ao. Fun¸c˜oes de transferˆencia envolvidas na medi¸c˜ao.

das HRIRs. Se o amplificador for considerado de alta qualidade (com resposta em freq¨uˆencia praticamente plana na regi˜ao de interesse–20Hz a 20kHz) e que o par microfone/pr´e-amplificador tem tamb´em resposta bastante plana, as fun¸c˜oes de transferˆencia que devem ser compensadas s˜ao as da cˆamara anec´oica e da caixa ac´ustica.

A resposta da cˆamara anec´oica ´e formada pelas reflex˜oes provenientes dos equipamentos montados no interior da mesma, bem como pelo eco residual das pr´oprias paredes. Esses dois efeitos ocorrem normalmente bem depois da resposta da cabe¸ca ao sinal direto. Por isso, n˜ao ´e necess´aria uma compensa¸c˜ao para essas fun¸c˜oes de transferˆencia.

J´a a resposta da caixa ac´ustica, que quase sempre n˜ao ´e nada plana, deve ser compensada. Para isso, faz-se a medida da sua resposta impulsiva separada-mente utilizando-se a mesma t´ecnica de medida das HRIRs, mas com um microfone colocado no lugar da cabe¸ca, e implementa-se o filtro inverso correspondente. Gard-ner e Martin fizeram tal medi¸c˜ao e, como j´a foi mencionado, inclu´ıram nas HRIRs utilizadas nesta tese a compensa¸c˜ao da caixa ac´ustica.

(24)

Al´em da resposta `a caixa ac´ustica, uma outra fun¸c˜ao de transferˆencia en-volvida, presente no momento da reprodu¸c˜ao do sinal tridimensional, ´e a relativa ao fone de ouvido. Essa deve ser tamb´em compensada. Gardner e Martin fizeram algumas medidas de respostas para alguns tipos de fones de ouvido. No entanto, neste trabalho n˜ao foram utilizadas, porque os fones utilizados nos testes n˜ao eram do mesmo modelo dos que foram medidos. Al´em disso, h´a normalmente uma dis-crepˆancia muito grande entre as fun¸c˜oes de transferˆencia de unidades diferentes de um mesmo tipo de fone ou at´e mesmo entre as de um mesmo fone simplesmente ao tirar e colocar o fone na cabe¸ca artificial no momento da medi¸c˜ao de sua resposta.

2.2

Caracter´ısticas das HRTFs

As HRTFs variam muito de indiv´ıduo para indiv´ıduo. Essas varia¸c˜oes se devem `as diferen¸cas da geometria do conjunto cabe¸ca-tronco-pina de cada um. Isso torna tamb´em vari´avel a percep¸c˜ao pelos indiv´ıduos dos efeitos gerados com as HRTFs medidas com a cabe¸ca artificial, a qual representa um indiv´ıduo m´edio. Assim sendo, a adequa¸c˜ao individual `as sensa¸c˜oes transmitidas pelo som gerado artificialmente se faz necess´aria.

Podem-se, no entanto, destacar caracter´ısticas importantes, do ponto de vista da percep¸c˜ao da correta localiza¸c˜ao do som, verificando-se a diferen¸ca existente entre HRTFs adjacentes. Dois tipos de caracter´ısticas podem ser obtidos: os fatores res-pons´aveis pelas diferen¸cas na percep¸c˜ao da localiza¸c˜ao e em quais regi˜oes a varia¸c˜ao da posi¸c˜ao afeta mais um determinado fator. ´E o que ser´a discutido a seguir.

2.2.1

Fatores Envolvidos na Percep¸c˜

ao

A resposta da cabe¸ca artificial, por sua geometria, sugere alguns pontos im-portantes na percep¸c˜ao da localiza¸c˜ao do som. Como j´a foi dito, as diferen¸cas entre as respostas dos ouvidos s˜ao as respons´aveis pela localiza¸c˜ao da fonte sonora. Alguns fatores, que podem ser observados pela compara¸c˜ao de HRIRs, mostram-se impor-tantes na percep¸c˜ao dessas diferen¸cas. S˜ao eles a diferen¸ca de tempo interaural (ITD–Interaural Time Difference), a diferen¸ca de n´ıvel interaural (ILD–Interaural Level Difference) e as reflex˜oes no tronco e na pina. Cada um desses fatores atua

(25)

diferentemente em cada regi˜ao e, ainda, ´e respons´avel pela percep¸c˜ao das varia¸c˜oes de posi¸c˜ao.

A ITD ´e o resultado do atraso relativo entre as respostas de cada ouvido. Esse atraso resulta da diferen¸ca de caminho entre a fonte e cada um dos ouvidos. Essa di-feren¸ca de caminho ´e causada pela distˆancia entre os ouvidos e pela difra¸c˜ao causada pela cabe¸ca. Na Figura 2.4, pode-se perceber que a diferen¸ca de atrasos existente

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=5o, φ=0o h (k ) amostras, (k) ouvido esquerdo ouvido direito 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=45o, φ=0o h (k ) amostras, (k) ouvido esquerdo ouvido direito

Figura 2.4: Verifica¸c˜ao da diferen¸ca de tempo interaural (ITD). HRIRs do canal direito e esquerdo na eleva¸c˜ao de zero grau e azimutes de 5o (a) e 45o (b).

entre as HRIRs do ouvido direito e esquerdo para o azimute de 5o (Figura 2.4a)

´e bem menor que a diferen¸ca para o azimute de 45o (Figura 2.4b). Os dois casos

mostrados est˜ao na eleva¸c˜ao de zero grau. Note que a ITD est´a muito associada a varia¸c˜oes de azimute, j´a que para uma mesma eleva¸c˜ao e azimutes diferentes, a diferen¸ca de atraso muda muito.

A ILD se caracteriza pela diferen¸ca de amplitude do som percebido por cada um dos ouvidos. Essa diferen¸ca ´e coerente com a ITD, sendo as duas em conjunto um indicativo do ˆangulo de azimute onde se encontra a fonte sonora. Na Figura 2.4b, mostrada anteriormente, pode-se notar a existˆencia da ILD. Comparando-a com a Figura 2.4a, pode-se perceber que, `a medida que a fonte vai se deslocando para um

(26)

dos lados da cabe¸ca, a amplitude percebida pelo ouvido do lado oposto diminui. Esse ´e o efeito chamado de “sombra da cabe¸ca”.

Como se pˆode perceber, a ITD e ILD carregam bastante informa¸c˜ao sobre o azimute em que se encontra a fonte sonora. No entanto, ao se variar a eleva¸c˜ao, essas diferen¸cas n˜ao mudam muito. Isso pode ser notado ao se compararem duas HRIRs referentes ao azimute zero com eleva¸c˜oes diferentes. Nesse azimute, as HRIRs medidas para o ouvido direito e esquerdo s˜ao iguais, por causa da simetria adotada e, assim, fica f´acil comparar as varia¸c˜oes devido somente `a eleva¸c˜ao. Sendo assim, na Figura 2.5a, onde se vˆeem duas das HRIRs relativas ao azimute zero em eleva¸c˜oes

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a)

ouvido direito = ouvido esquerdo, θ=0o

h (k ) amostras, (k) φ=0o φ=10o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 40 50 60 70 80 90 100 110 (b)

ouvido direito = ouvido esquerdo, θ=0o

|HRTF

|, dB

freqüência normalizada, (ω/π)

φ=0o

φ=10o

Figura 2.5: ITD e ILD ao se variar a eleva¸c˜ao da fonte. Respostas impulsivas relativas ao azimute zero grau (a) e suas respectivas respostas em freq¨uˆencia (b). Essas HRTFs s˜ao iguais para o ouvido direito e esquerdo em uma mesma eleva¸c˜ao.

diferentes, a diferen¸ca entre as posi¸c˜oes das duas fun¸c˜oes n˜ao se mostra atrav´es da ITD e da ILD, j´a que elas n˜ao existem nesse caso. Como se pode notar na Figura 2.5b, as diferen¸cas s˜ao muito mais evidentes no m´odulo da resposta em freq¨uˆencia. Isso indica que as mudan¸cas das caracter´ısticas das HRTFs relacionadas com mudan¸cas de eleva¸c˜ao s˜ao mais vis´ıveis na resposta `a geometria da cabe¸ca artificial, e assim, n˜ao s´o a distˆancia entre os ouvidos (que gera a ITD) e a sombra

(27)

da cabe¸ca (que gera a ILD e modifica um pouco a ITD), mas tamb´em as reflex˜oes no tronco e na pina alteram significantemente a HRTF. ´E poss´ıvel notar tamb´em a importˆancia dos vales e picos para se distinguir em qual eleva¸c˜ao se encontra a fonte sonora.

2.2.2

Importˆ

ancia dos Fatores na Percep¸c˜

ao

Como foi visto na subse¸c˜ao anterior, existem alguns fatores, observados na compara¸c˜ao de HRIRs, que podem ser utilizados na distin¸c˜ao da posi¸c˜ao de uma fonte sonora.

Cada um desses fatores cont´em um tipo de informa¸c˜ao respons´avel pela dis-tin¸c˜ao e, como conseq¨uˆencia dessa diferencia¸c˜ao, certos fatores s˜ao mais importantes do que outros em determinadas regi˜oes do espa¸co, como pode ser visto a seguir.

A ITD e a ILD s˜ao fatores influenciados pela distˆancia entre os ouvidos (incluindo a difra¸c˜ao causada pela cabe¸ca) e pelo efeito da sombra da cabe¸ca, res-pectivamente. Intuitivamente, pode-se perceber que as varia¸c˜oes desses fatores s˜ao maiores `a medida que a fonte sonora tem seu ˆangulo de azimute alterado e, mais ainda, quando o ˆangulo de azimute est´a mais pr´oximo dos azimutes zero grau e 180o.

Ent˜ao, se variarmos o ˆangulo de azimute no entorno do ˆangulo de 90o, a ITD e a

ILD quase n˜ao se alteram, diferentemente do caso em que se altera o azimute no entorno dos ˆangulos de zero grau e 180o (veja Figuras 2.6, 2.7 e 2.8).

Nas Figuras 2.6, 2.7 e 2.8 pode-se notar que a ITD e a ILD s˜ao mais sens´ıveis `a varia¸c˜ao de azimute pr´oximo dos ˆangulos de zero grau (Figuras 2.6a e 2.6b) e 180o (Figuras 2.8a e 2.8b) do que pr´oximo de 90o (Figuras 2.7a e 2.7b). Nessas figuras,

para efeito de verifica¸c˜ao, tem-se tamb´em a compara¸c˜ao das respostas em freq¨uˆencia de cada ouvido (Figuras 2.6c, 2.6d, 2.7c, 2.7d, 2.8c, 2.8d). Na compara¸c˜ao, pode-se perceber tamb´em que n˜ao h´a varia¸c˜oes muito bruscas entre as respostas de um azimute e de outro, tanto pr´oximo aos ˆangulos de zero grau e 180oquanto do ˆangulo

de 90o.

A pequena e gradativa varia¸c˜ao das respostas em freq¨uˆencia para cada ouvido ao se variar o ˆangulo de azimute da fonte sonora n˜ao se mant´em quando, ao inv´es de se mudar o ˆangulo de azimute, se muda o ˆangulo de eleva¸c˜ao (veja nas Figu-ras 2.9, 2.10 e 2.11). Nessas figuras, pode-se notar que o m´odulo da resposta em

(28)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=0o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=5o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (c) ouvido direito, φ=0o |HRTF |, dB freqüência normalizada, (ω/π) θ=0o θ=5o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (d) ouvido esquerdo, φ=0o |HRTF |, dB freqüência normalizada, (ω/π) θ=0o θ=5o

Figura 2.6: Regi˜ao de importˆancia dos fatores ITD e ILD (I). Compara¸c˜ao das respostas impulsivas (a, b) e dos m´odulo das respostas em freq¨uˆencia (c, d) das HRTFs com as das Figuras 2.7 e 2.8.

(29)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=90o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=95o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (c) ouvido direito, φ=0o |HRTF |, dB freqüência normalizada, (ω/π) θ=90o θ=95o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (d) ouvido esquerdo, φ=0o |HRTF |, dB freqüência normalizada, (ω/π) θ=90o θ=95o

Figura 2.7: Regi˜ao de importˆancia dos fatores ITD e ILD (II). Compara¸c˜ao das respostas impulsivas (a, b) e dos m´odulo das respostas em freq¨uˆencia (c, d) das HRTFs com as das Figuras 2.6 e 2.8.

(30)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=180o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=175o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (c) ouvido direito, φ=0o |HRTF |, dB freqüência normalizada, (ω/π) θ=180o θ=175o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (d) ouvido esquerdo, φ=0o |HRTF |, dB freqüência normalizada, (ω/π) θ=180o θ=175o

Figura 2.8: Regi˜ao de importˆancia dos fatores ITD e ILD (III). Compara¸c˜ao das respostas impulsivas (a, b) e dos m´odulo das respostas em freq¨uˆencia (c, d) das HRTFs com as das Figuras 2.6 e 2.7.

(31)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=0o, φ=0o h (k ) amostras, (k) ouvido direito oucido esquerdo 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=0o, φ=10o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (c) ouvido direito, θ=0o |HRTF |, dB freqüência normalizada, (ω/π) elevação 0o elevação 10o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (d) ouvido esquerdo, θ=0o |HRTF |, dB freqüência normalizada, (ω/π) elevação 0o elevação 10o

Figura 2.9: Regi˜ao de importˆancia dos fatores relacionados com as reflex˜oes na pina e no tronco (I). Compara¸c˜ao das HRIRs (a, b) e seus respectivos m´odulos das respostas em freq¨uˆencia (c, d) com as das Figuras 2.10 e 2.11.

(32)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=90o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=90o, φ=10o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (c) ouvido direito, θ=90o |HRTF |, dB freqüência normalizada, (ω/π) elevação 0o elevação 10o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (d) ouvido esquerdo, θ=90o |HRTF |, dB freqüência normalizada, (ω/π) elevação 0o elevação 10o

Figura 2.10: Regi˜ao de importˆancia dos fatores relacionados com as reflex˜oes na pina e no tronco (II). Compara¸c˜ao das HRIRs (a, b) e seus respectivos m´odulos das respostas em freq¨uˆencia (c, d) com as das Figuras 2.9 e 2.11.

(33)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=180o, φ=0o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=180o, φ=10o h (k ) amostras, (k) ouvido direito ouvido esquerdo 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (c) ouvido direito, θ=180o |HRTF |, dB freqüência normalizada, (ω/π) elevação 0o elevação 10o 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 50 60 70 80 90 100 110 (d) ouvido esquerdo, θ=180o |HRTF |, dB freqüência normalizada, (ω/π) elevação 0o elevação 10o

Figura 2.11: Regi˜ao de importˆancia dos fatores relacionados com as reflex˜oes na pina e no tronco (III). Compara¸c˜ao das HRIRs (a, b) e seus respectivos m´odulos das respostas em freq¨uˆencia (c, d) com as das Figuras 2.9 e 2.10.

(34)

freq¨uˆencia varia mais para mudan¸cas de eleva¸c˜ao pr´oximas do azimute de 90o

(Figu-ras 2.10c e 2.10d) do que para mudan¸cas de eleva¸c˜ao pr´oximas dos azimutes de zero grau (Figuras 2.9c e 2.9d) e 180o (Figuras 2.11c e 2.11d). Pode-se notar, tamb´em,

que os fatores ITD e ILD s˜ao pouco sens´ıveis `a varia¸c˜ao de eleva¸c˜ao (Figuras 2.9a, 2.9b, 2.10a, 2.10b e 2.11a, 2.11b).

Dessa forma, pode-se concluir que nas regi˜oes frontal e traseira podem-se perceber melhor varia¸c˜oes em azimute, j´a que nessas regi˜oes os fatores ITD e ILD mudam muito com pequenas varia¸c˜oes de azimute. Por outro lado, nas regi˜oes laterais, tem-se maior sensibilidade `as varia¸c˜oes de eleva¸c˜ao, pois, nessas regi˜oes, as varia¸c˜oes na resposta em freq¨uˆencia (causadas pelas diferentes formas de reflex˜ao na pina) s˜ao mais evidentes do que varia¸c˜oes na ITD e/ou na ILD.

2.3

Avalia¸c˜

ao das HRTFs

A avalia¸c˜ao das HRTFs ou de filtros que as representam normalmente ´e feita segundo crit´erios subjetivos [9, 10, 11, 12, 13, 14], mas recentemente tem-se tentado criar m´etodos objetivos que consigam avaliar corretamente se as respostas impulsivas d˜ao a impress˜ao correta da posi¸c˜ao desejada para a fonte.

Nesta tese, n˜ao foi utilizado nenhum crit´erio subjetivo formal para a avalia¸c˜ao dos resultados. Apenas testes auditivos informais foram utilizados para se definir se a fun¸c˜ao em quest˜ao est´a bem representada ou n˜ao. Apesar disso, considerou-se interessante tecer alguns coment´arios sobre esses m´etodos de avalia¸c˜ao encontrados na literatura.

A maioria dos testes subjetivos encontrados na literatura s˜ao feitos reprodu-zindo-se o sinal de teste com fones de ouvido, posicionando-se a fonte virtual alea-toriamente. As pessoas submetidas ao teste indicam em qual dire¸c˜ao est´a a fonte virtual para cada sinal ouvido e, assim, gera-se uma estat´ıstica de qu˜ao boas s˜ao as HRIRs medidas ou modeladas, no caso de se tratar de HRTFs obtidas de uma outra forma que n˜ao por medidas diretas.

Em alguns casos, certos procedimentos s˜ao utilizados para melhor avaliar as HRIRs ou seus modelos. Em [12], por exemplo, onde se prop˜oe um realce `a resposta da pina, menciona-se o fato de que o treinamento do ouvinte melhora

(35)

a percep¸c˜ao da localiza¸c˜ao da fonte. Esse treinamento consiste em apresentar ao ouvinte, primeiramente, os sinais de teste em todas as dire¸c˜oes (no caso, o ˆangulo de eleva¸c˜ao ´e igual a zero e reproduzem-se os sinais variando-se o azimute para a direita come¸cando do azimute zero) com o pr´evio conhecimento por parte do ouvinte. Isso faz com que o ouvinte se prepare psicologicamente para ouvir os sinais de teste e, assim, conseguir se transportar melhor para a situa¸c˜ao virtual do teste em quest˜ao. A influˆencia visual tamb´em deve ser eliminada, instruindo-se os ouvintes a fecharem os olhos durante o teste.

Os m´etodos objetivos tˆem como base a estima¸c˜ao dos fatores, como por exem-plo a ITD e a ILD, para com eles se conseguir avaliar as fun¸c˜oes de transferˆencia modeladas ou medidas. Em [14], fez-se uma investiga¸c˜ao sobre v´arios m´etodos de modelagem das HRTFs comparando-se os resultados com sistemas objetivos de ava-lia¸c˜ao, obtendo coerˆencia com as avalia¸c˜oes subjetivas. Nesse sistema de avalia¸c˜ao objetiva, desenvolvido por Pulkki et al. em [15], estimam-se os fatores ITD e ILD atrav´es da correla¸c˜ao cruzada interaural e da estima¸c˜ao do espectro do n´ıvel de audibilidade (loudness) dos canais direito e esquerdo, respectivamente.

2.4

Utiliza¸c˜

ao das HRTFs para Gera¸c˜

ao de Som

Tridimensional

No contexto de som tridimensional, as HRTFs s˜ao utilizadas, atrav´es das suas respostas impulsivas (HRIRs), como filtros que acrescentam a informa¸c˜ao de localiza¸c˜ao a sinais originalmente provenientes de um canal. Cada um desses sinais d´a origem a outros dois alterados por filtros relativos `as respostas para os ouvidos es-querdo e direito, respectivamente. Ap´os a filtragem, esse sinal est´ereo ´e reproduzido com fones de ouvido.

O procedimento acima indica a utiliza¸c˜ao de um ´unico par de HRIRs que tenha sido medido. Assim, para um ponto cujo par de HRIRs seja conhecido, gera-se um som como gera-se a fonte virtual estivesgera-se parada na posi¸c˜ao relacionada `aquele par.

Para que se pudesse gerar o som em todas as dire¸c˜oes poss´ıveis, dever-se-iam medir todos os pares de HRIRs existentes. Mas como isso ´e impratic´avel,

(36)

adota-se, na medi¸c˜ao, um determinado espa¸camento (grade) entre as HRIRs medidas. Assim, para se posicionar a fonte virtual em qualquer posi¸c˜ao que n˜ao tenha a respectiva HRIR medida, j´a que existe esse espa¸camento entre os pontos em cujas posi¸c˜oes foram medidas as HRIRs, vˆe-se necess´aria a utiliza¸c˜ao de alguma forma de interpola¸c˜ao.

O m´etodo de interpola¸c˜ao mais simples, mencionado em [5], ´e o bilinear. Esse m´etodo se utiliza dos quatro pares de HRTFs mais pr´oximos do ponto em que se deseja posicionar a fonte virtual para obter uma estima¸c˜ao do par relativo a tal posi¸c˜ao. Isso pode ser descrito da seguinte forma:

ˆh(k) = (1 − cθ)(1− cφ)ha(k) + cθ(1− cφ)hb(k) + cθcφhc(k) + (1− cθ)cφhd(k), (2.1)

onde ha(k), hb(k), hc(k) e hd(k) s˜ao os pares de respostas impulsivas mais pr´oximas

da posi¸c˜ao (θ, φ) (veja Figura 2.12) e cθ e cφs˜ao os coeficientes da interpola¸c˜ao, que

s˜ao dados por:

           cθ = (θ mod θgrid) θgrid = Cθ θgrid cφ = (φ mod φgrid) φgrid = Cφ φgrid , (2.2)

onde θgrid e φgrid s˜ao as precis˜oes de azimute e eleva¸c˜ao da medi¸c˜ao das HRTFs e,

ainda, Cθ e Cφ d˜ao a posi¸c˜ao em graus referente `a ha(k).

Outros m´etodos de interpola¸c˜ao s˜ao utilizados e, com isso, a compara¸c˜ao entre eles se torna necess´aria. Geralmente, toma-se como base a interpola¸c˜ao bili-near. Em [13], faz-se a compara¸c˜ao entre o m´etodo bilinear (nesse artigo chamado de m´etodo de pondera¸c˜ao com o inverso da distˆancia–method of inverse-distance weighting) e o m´etodo de interpola¸c˜ao esf´erica (spherical splines), cada um deles implementado no dom´ınio do tempo e da freq¨uˆencia.

No dom´ınio do tempo, a interpola¸c˜ao bilinear ´e implementada segundo a equa¸c˜ao (2.1), ponderando-se as HRIRs mais pr´oximas. J´a no caso da interpola¸c˜ao esf´erica, todas as HRIRs medidas s˜ao consideradas no c´alculo da resposta para qualquer ponto para o qual n˜ao foi medido um par de HRIRs.

No dom´ınio da freq¨uˆencia, as pondera¸c˜oes s˜ao feitas sobre o m´odulo, em dB, e sobre a fase da resposta em freq¨uˆencia das HRIRs, obtidas pela transformada discreta de Fourier.

(37)

ha hd hb hc . . θ φ ˆh φgrid θgrid Cφ Cθ

Figura 2.12: M´etodo de interpola¸c˜ao bilinear.

A cria¸c˜ao da sensa¸c˜ao de movimento utiliza essas formas de interpola¸c˜ao para que, com a evolu¸c˜ao do tempo, tenha-se a fonte virtual em pontos diferentes de um determinado caminho.

Muitos trabalhos [7, 9, 10, 14], ent˜ao, vˆem sendo desenvolvidos no intuito de obter a redu¸c˜ao da complexidade computacional pela redu¸c˜ao da ordem dos filtros envolvidos na gera¸c˜ao do som tridimensional. No Cap´ıtulo 3, uma nova fun¸c˜ao de transferˆencia auxiliar ser´a definida e a forma de utiliz´a-la em uma nova t´ecnica de interpola¸c˜ao ser´a discutida. J´a a quest˜ao da redu¸c˜ao de ordem dos filtros ser´a discu-tida mais adiante, no Cap´ıtulo 4, onde se abordar´a a complexidade computacional.

(38)

Cap´ıtulo 3

Fun¸c˜

oes de Transferˆ

encia

Interposicionais (IPTFs)

Como foi visto no Cap´ıtulo 2, para se posicionar a fonte virtual em qualquer eleva¸c˜ao e azimute, ´e necess´aria a obten¸c˜ao da HRTF relativa ao ponto desejado atrav´es de algum tipo de interpola¸c˜ao. Naquele cap´ıtulo, foram tamb´em menciona-das algumas formas de interpola¸c˜ao que, utilizando as HRTFs medimenciona-das, conseguem aproximar as HRTFs relativas a outros pontos para os quais as medidas n˜ao est˜ao dispon´ıveis.

Este cap´ıtulo trata da defini¸c˜ao e da interpreta¸c˜ao de uma nova fun¸c˜ao de transferˆencia: a fun¸c˜ao de transferˆencia interposicional (IPTF–Interpositional Transfer Function), que ´e a base para uma nova t´ecnica de interpola¸c˜ao que tamb´em ser´a descrita neste cap´ıtulo. Essa forma de interpola¸c˜ao ´e utilizada, no Cap´ıtulo 5, no algoritmo que d´a movimento ao som.

Neste cap´ıtulo ser´a mostrada a id´eia de onde se partiu para chegar at´e a IPTF na Se¸c˜ao 3.1–Id´eia Principal. Em seguida, na Se¸c˜ao 3.2–Fun¸c˜oes de Trans-ferˆencia Interposicionais, apresenta-se o que ´e a IPTF e como ela ´e gerada a partir das HRTFs. A forma de interpola¸c˜ao que utiliza as IPTFs est´a descrita na Se¸c˜ao 3.3–Interpola¸c˜ao Utilizando as IPTFs e na Se¸c˜ao 3.4–Coment´arios, tecem-se algumas observa¸c˜oes sobre a complexidade computacional dessa nova t´ec-nica de interpola¸c˜ao.

(39)

3.1

Id´

eia Principal

A id´eia inicial para cria¸c˜ao dessa nova fun¸c˜ao de transferˆencia surgiu ao se encontrar em [9] uma proposta de redu¸c˜ao dos modelos das HRTFs.

A proposi¸c˜ao daquele artigo objetivava reduzir a dificuldade encontrada no modelamento das fun¸c˜oes de transferˆencia relativas ao ouvido localizado no lado oposto ao da fonte sonora (chamadas de fun¸c˜oes contralaterais—veja na Figura 3.1). Essa dificuldade est´a no fato de o efeito da “sombra da cabe¸ca” atenuar muito as freq¨uˆencias mais altas e, com isso, tornar mais dif´ıcil a identifica¸c˜ao dos modos dessas freq¨uˆencias, podendo criar a necessidade de modelos de ordem mais elevada.

. Ouvinte H1 ips Fonte 2 Fonte 1 H2 ips H1 contra H2 contra

Figura 3.1: Fun¸c˜ao de transferˆencia interaural (ITFs). Hm

ips e Hcontram s˜ao as fun¸c˜oes

ipsi- e contralateral relativas `a m-´esima fonte.

Ent˜ao, tendo em vista que as fun¸c˜oes relativas ao ouvido do mesmo lado em que se encontra a fonte sonora (chamadas de fun¸c˜oes ipsilaterais) n˜ao sofrem este tipo de atenua¸c˜ao, foi sugerida, naquele trabalho, uma pequena modifica¸c˜ao na estrutura de implementa¸c˜ao, que pode ser vista na Figura 3.2. Essa modifica¸c˜ao leva a um diagrama equivalente ao anterior, s´o que os blocos que representam as fun¸c˜oes de transferˆencia a serem modeladas passam a ser a fun¸c˜ao ipsilateral e a raz˜ao entre as fun¸c˜oes contra- e ipsilateral. Essa fun¸c˜ao-raz˜ao ´e denominada por aqueles autores de Fun¸c˜ao de Transferˆencia Interaural (ITF–Interaural Transfer Function), pelo fato de representar a transferˆencia entre o ouvido do lado oposto e o do mesmo lado da

(40)

fonte. sinal monoaural canal ips-lateral canal contra-lateral Hcontra Hips (a) canal ips-lateral canal contra-lateral sinal monoaural Hips Hcontra Hips (b)

Figura 3.2: Modelo das HRTFs atrav´es das ITFs. Hips e Hcontra s˜ao as fun¸c˜oes

ipsi-e contralatipsi-eral: (a) ipsi-estrutura quipsi-e ipsi-empripsi-ega as fun¸c˜oipsi-es ipsi- ipsi-e contralatipsi-eral sipsi-eparada- separada-mente e (b) estrutura que emprega a fun¸c˜ao ipsilateral e a ITF.

A quest˜ao da dinˆamica das respostas em freq¨uˆencia tamb´em pode ser impor-tante sob o ponto de vista de simplifica¸c˜ao do modelo. Na Figura 3.3a, tem-se a resposta em freq¨uˆencia da ITF relativa `as HRTFs vistas na Figura 3.3b. Nota-se que a resposta em freq¨uˆencia da ITF tende a ser mais plana que as respostas das HRTFs que a originaram.

Essa id´eia de redu¸c˜ao do modelo atrav´es da raz˜ao entre duas fun¸c˜oes de transferˆencia foi utilizada no presente trabalho na cria¸c˜ao da IPTF, que tem como objetivo fazer com que a interpola¸c˜ao seja mais simples, como ser´a melhor explicado na Se¸c˜ao 3.2.

3.2

Fun¸c˜

oes de Transferˆ

encia Interposicionais

A id´eia mostrada na Se¸c˜ao 3.1 atinge maior simplicidade com o modelo cri-ado a partir da ITF (raz˜ao de duas HRTFs). Apesar disso, percebe-se que as ITFs tendem a ficar mais dif´ıceis de serem modeladas pr´oximo ao azimute de 90o,

(41)

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −50 0 50 100 (a) |HRTF |, dB freqüência normalizada, (ω/π) 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 −50 0 50 100 (b) θ=45o, φ=0o freqüência normalizada, (ω/π) |HRTF |, dB ipsilateral contralateral

Figura 3.3: Compara¸c˜ao das dinˆamicas das fun¸c˜oes ipsi- e contralateral com a ITF. M´odulo da resposta em freq¨uˆencia da ITF (a) e das fun¸c˜oes ipsi- e contralateral (b) que a originaram.

entanto, n˜ao parece f´acil de ser eliminado representando-se a transferˆencia relativa a um ´unico ponto sem considerar a sua dependˆencia das transferˆencias relativas a pontos vizinhos, como ´e com a ITF.

Como o principal objetivo deste trabalho ´e reduzir a complexidade da inter-pola¸c˜ao, pensou-se em formar uma fun¸c˜ao-raz˜ao que fosse gerada a partir de duas fun¸c˜oes o mais poss´ıvel parecidas; especificamente, utilizar duas HRTFs relativas a um mesmo lado da cabe¸ca e a pontos pr´oximos entre si (veja a Figura 3.4). Nessa figura, pode-se notar que a IP T Fi,f ´e a fun¸c˜ao de transferˆencia que representa a

passagem de um ponto i a outro ponto adjacente f , e pode ser descrita da seguinte forma:

IP T Fi,f =

HRT Ff

HRT Fi

, (3.1)

onde HRT Fi e HRT Ff s˜ao as HRTFs relativas aos pontos inicial e final,

respecti-vamente.

Algumas considera¸c˜oes importantes devem ser feitas para que a Equa¸c˜ao (3.1) seja v´alida. Por exemplo, a fun¸c˜ao HRT Fi deve ser de fase m´ınima e os atrasos

(42)

. Ouvinte HRT Ff posi¸c˜ao inicial posi¸c˜ao final HRT Fi IP T Fi,f

Figura 3.4: Fun¸c˜ao de Transferˆencia Interposicional.

inerentes `a fun¸c˜ao HRT Ff devem ser iguais aos da IPTF gerada somados aos da

HRT Fi, para que a ITD (ver Se¸c˜ao 2.2.1) n˜ao seja alterada. Outro fato bastante

importante ´e que as IPTFs pressup˜oem uma fun¸c˜ao para cada ouvido, isto ´e, cada ouvido tem uma IPTF para cada par de pontos inicial e final. Todas essas consi-dera¸c˜oes e detalhes de cria¸c˜ao das IPTFs ser˜ao discutidos na Subse¸c˜ao 3.2.1.

3.2.1

Gera¸c˜

ao das IPTFs

Como foi visto na primeira parte dessa se¸c˜ao, as IPTFs s˜ao fun¸c˜oes cuja resposta em freq¨uˆencia ´e o resultado da raz˜ao de duas HRTFs adjacentes. Para cada dois pares de HRTFs, relativas aos dois ouvidos e a duas posi¸c˜oes adjacentes, existe um par de IPTFs, cada uma relativa a um dos ouvidos. Isso significa que a Equa¸c˜ao (3.1) pode ser reescrita da seguinte forma:

IP T Fi,fd = HRT F d f HRT Fd i (3.2) ou IP T Fi,fe = HRT F e f HRT Fe i , (3.3) onde IP T Fd

i,f e IP T Fi,fe s˜ao as IPTFs relativas aos ouvidos direito e esquerdo,

respectivamente; HRT Fd

i e HRT Ffd s˜ao as HRTFs para o ouvido direito relativas

aos pontos inicial e final, respectivamente; e HRT Fe

i e HRT Ffe s˜ao as HRTFs para

(43)

H´a, no entanto, um problema que deve ser solucionado antes de se imple-mentarem tais raz˜oes: a estabilidade da IPTF deve ser garantida. Em [7, 9, 14], utilizam-se aproxima¸c˜oes de fase m´ınima para facilitar o processo de redu¸c˜ao de ordem do modelo para as HRTFs. A utiliza¸c˜ao de tal recurso se baseia em tra-balhos [16, 17, 18] que mostram a insensibilidade `a fase das representa¸c˜oes se o atraso inicial relativo `a ITD for modelado por uma linha de atrasos z−D, onde D ´e

o n´umero inteiro de atrasos. E, mesmo que no dom´ınio do tempo esse recurso mude muito a resposta impulsiva (veja Figura 3.5), n˜ao se percebe diferen¸ca auditiva en-tre os sinais modificados pelas fun¸c˜oes sem ou com fase m´ınima ao se gerar o som tridimensional.

Ent˜ao, sabendo-se que se pode utilizar a vers˜ao de fase m´ınima das HRTFs (tomando apenas o cuidado com os atrasos), antes de se implementar a raz˜ao, calculou-se para cada HRTF sua vers˜ao de fase m´ınima. Para calcular as vers˜oes de fase m´ınima, para cada uma das HRTFs estimou-se o n´umero de atrasos existentes por inspe¸c˜ao visual, examinando-se a forma de onda de cada HRTF (pelo n´umero de amostras com valores bem baixos de amplitude que precediam a subida at´e o pri-meiro pico). Assim, foram eliminados da i-´esima HRTF as primeiras Di amostras e,

com o restante das 128 amostras, calculou-se a vers˜ao de fase m´ınima. Um exemplo da estima¸c˜ao do n´umero de atrasos de uma HRTF e da fun¸c˜ao de fase m´ınima obtida com os atrasos retirados j´a reincorporados podem ser vistos nas Figuras 3.5a e 3.5b, respectivamente.

Outro ponto importante na implementa¸c˜ao da IPTF ´e o fato de elas poderem ser n˜ao-causais. A n˜ao-causalidade ocorre naturalmente, pois, a n˜ao ser que os n´umeros de atrasos das HRTFs utilizadas na raz˜ao sejam iguais, o n´umero de atrasos relativo entre essas HRTFs pode ser negativo (HRT Ff ter menos atrasos que a

HRT Fi). Isso fica mais claro se a Equa¸c˜ao (3.1) for reescrita na forma da sua

transformadaZ: IP T Fi,f(z) = HRT Ff(z) HRT Fi(z) = b0+ b1z −1+ b 2z−2+· · · + bNz−N a0+ a1z−1+ a2z−2+· · · + aNz−N , (3.4) onde bn e an s˜ao os valores das HRIRs em cada instante. Nessa equa¸c˜ao, pode-se

notar que, se os coeficientes da IPTF de b0a bke de a0a alforem iguais a zero (atrasos

de cada uma das HRTFs), com l > k, a fun¸c˜ao de transferˆencia interposicional ir´a necessitar de amostras anteriores a partir da amostra n = k− l + 1 da entrada,

(44)

0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (a) θ=45o, φ=0o HRTF medida

número de atrasos estimados

h (k ) amostras, (k) 0 20 40 60 80 100 120 −3 −2 −1 0 1 2 3 x 104 (b) θ=45o, φ=0o HRTF de fase mínima

número de atrasos estimados

h

(k

)

amostras, (k)

Figura 3.5: Aproxima¸c˜oes de fase m´ınima. Estima¸c˜ao do n´umero de atrasos por inspe¸c˜ao (a) e HRIR de fase m´ınima calculada.

tornando-se n˜ao-causal. Como a IPTF pressup˜oe que a HRT Fi seja utilizada em

cascata com ela (veja na Se¸c˜ao 3.3), esse problema da n˜ao-causalidade pode ser solucionado acrescentando-se `as IPTFs o atraso relativo `a HRTF. Isso torna as IPTFs sempre causais e como o “avan¸co” (nos casos n˜ao-causais) relativo `a IPTF ´e sempre menor do que o atraso inerente `a HRTF cascateada, o sistema resultante se torna causal.

3.3

Interpola¸c˜

ao Utilizando as IPTFs

No Cap´ıtulo 1, onde se discutiram as v´arias formas de cria¸c˜ao do som tridi-mensional, mencionou-se o m´etodo VBAP [1] que, utilizando um sistema multica-nal, faz a localiza¸c˜ao da fonte virtual depender da dire¸c˜ao de um vetor resultante da soma ponderada de cada um dos vetores associados a cada caixa ac´ustica—veja no Cap´ıtulo 1 a Figura 1.1. Redesenhando-se aquela figura associando a cada vetor ouvinte-caixa uma HRTF caixa-ouvinte para cada ouvido, ter-se-ia uma pondera¸c˜ao das HRTFs de cada posi¸c˜ao formando a transferˆencia global da fonte virtual para o

(45)

ouvinte (veja a Figura 3.6). Ouvinte Caixa Z Caixa Y Caixa X Fonte Virtual αHRT FX γHRT FZ HRT F R βHRT FY

Figura 3.6: VBAP[1] interpretado com as HRTFs. HRTFs X, Y e Z ponderadas, respectivamente, pelos parˆametros α, β e γ, que, compostas, geram a HRT FR

(resultante).

Essa forma de interpreta¸c˜ao do sistema VBAP utilizando as HRTFs d´a uma id´eia da validade do m´etodo de interpola¸c˜ao bilinear [5], que gera a transferˆencia de um determinado ponto a partir das HRTFs de pontos adjacentes.

Pode-se interpretar de uma forma similar a interpola¸c˜ao utilizando as IPTFs. Primeiramente, considere a HRT FI, relativa a um determinado ponto I, e as HRTFs

interpoladas com as IPTFs para dois de seus pontos vizinhos 1 e 2 (veja Figura 3.7). Essas fun¸c˜oes de trasferˆencia podem ser combinadas, como na interpola¸c˜ao bilinear, para gerar a transferˆencia de um determinado ponto F , HRT FF, pertencente `a

regi˜ao triangular compreendida pelos trˆes pontos, considerando que o ponto mais pr´oximo de F seja o I. Para isso, faz-se com que os ponderadores para cada uma das transferˆencias dependam do inverso da distˆancia angular do ponto F aos pontos a elas relacionados.

Assim, como pode ser visto na Figura 3.8, utilizou-se essa forma de inter-pola¸c˜ao e, para um dado um ponto F que se quer interpolar:

(46)

.

1

I

2

F

. . . .

Figura 3.7: Limita¸c˜ao da regi˜ao de interpola¸c˜ao para o conjunto de fun¸c˜oes escolhido. 2. caso dois ou mais pontos sejam eq¨uidistantes do ponto F , o ponto escolhido

como ponto I ´e o de menores azimute e eleva¸c˜ao;

3. determinam-se quais duas IPTFs, das quatro que tˆem como HRT Fi a HRTF

do ponto I, compreendem a regi˜ao que cont´em o ponto F ;

4. e gera-se a transferˆencia do ponto F ao ouvinte atrav´es da equa¸c˜ao: HRT FF =

HRT FI(α + βIP T FI,1+ γIP T FI,2)

α + β + γ , (3.5)

onde α, β e γ s˜ao dados por

α = (1− cθI)(1− cφ), (3.6)

β = cθI(1− cφ) (3.7)

e

γ = (1− cθ2)cφ, (3.8)

sendo cθI, cφe cθ2, respectivamente, as distˆancias angulares relativas de azimute

do ponto I ao ponto F , de eleva¸c˜ao do ponto I ao ponto F e de azimute do ponto 2 ao ponto F , que podem ser descritas por

cθI = |θF − θI| θgridI = CθI θIgrid, (3.9) cθ2 = |θF − θ2| θ2grid = Cθ2 θgrid2 (3.10)

Referências

Documentos relacionados

A Figura 7.5 mostra o gráfico de validação cruzada para os casos por varredura e por produtores fixos. Tanto a análise visual dos mapas de qualidade quanto a

Com o intuito de determinar quais as medidas acústicas baseadas na análise de quantificação de recorrência são relevantes para discriminar a presença do

As pontas de contato retas e retificadas em paralelo ajustam o micrômetro mais rápida e precisamente do que as pontas de contato esféricas encontradas em micrômetros disponíveis

A principal contribuição desse trabalho é a apresentação de uma solução de localização que, quando implantada em uma rede social móvel, o usuário e seus amigos possam ser

Para ter acesso à indenização do Seguro de Vida, entre em contato com o corretor ou diretamente com a Icatu Seguros.. Com todos os documentos em mãos, você receberá os benefícios

[r]

A revisão realizada por ERDMAN (1988a) mostrou que, nos dezessete experimentos em que a silagem de milho foi a única fonte de volumoso oferecida a vacas leiteiras no início

“As contas Públicas, da maneira que estão hoje, não trazem para a sociedade uma informação que permita que ela compreenda onde se gastam os recursos” 2- Raul