• Nenhum resultado encontrado

2 CIÊNCIA DA INFORMAÇÃO E MÚSICA

2.5 Recuperação da informação musical

2.5.3 Estratégias da comunidade para melhorar a recuperação musical

É sabido que a música tem sido investigada por pesquisadores de distintas á- reas do conhecimento, produzindo avanços tecnológicos significativos, muitos dos quais relacionados aos sistemas citados na seção 2.5.2. Um dos problemas percebi- dos pela comunidade de interessados é que essa diversidade de visões e abordagens acaba impedindo comparações científicas e dificultando a evolução das pesquisas.

Há mais de uma década, a comunidade de pesquisadores envolvidos com re- cuperação textual passou por problemas similares e resolveu se organizar estabele- cendo parâmetros de comparação das técnicas aplicadas a textos. Na oportunidade, o NIST55 desenvolveu um paradigma de avaliação e testes, chamado TREC (Text REtrieval Conference)56 que disponibilizaria para a comunidade científica o seguinte conjunto (DOWNIE, 2003-b):

(i) Uma coleção de textos padronizada, de porte largo e apropriada para testes;

(ii) Um conjunto padronizado de consultas de teste (ou seja, variações de consul- tas possíveis a uma base textual); e,

55 NIST – National Institute of Standards and Technology – é uma organização que financia projetos na área de tecnologia e possui forte ligação com instituições educacionais e indústriais. Mais detalhes podem ser encon- trados em http://www.nist.gov.

56 TREC – Text Retrieval Conference – é um projeto apoiado pelo Departamento de Defesa americano e pelo NIST e possui toda a infra-estrutura necessária para avançar as pesquisas na área de recuperação textual. Mais detalhes podem ser encontrados em http://trec.nist.gov.

copyright e royalties plágio recomendação se parece com ... humor emoção estilo identificação intérprete características intertextualidade compositor fonte artista nté rpre te /c ompo sitor i consu m idor indústria Shazam Audentify Musipedia, Themefinder, Orpheus, PROMS, Notify, QBH, Meldex, GUIDO/MIR, C-Brahms CubyHum, SoundCompass, SuperMBox Cuidado SOMeJB

(iii) Uma avaliação de resultados que cada grupo de pesquisa gerou, segundo mé- tricas reconhecidas pela comunidade envolvida.

No início da década de 2000, emergiu uma nova área denominada Music In-

formation Retrieval/Music Digital Libraries (MIR/MDL) (DOWNIE, 2002, p. 1-6), de na-

tureza multidisciplinar contemplando várias áreas do conhecimento como Musicologia, Ciência da Computação, Ciência da Informação e Engenharia, além de outras rela- cionadas (DOWNIE e CUNNINGHAM, 2002). Em 2005, seguindo os mesmos princí- pios aplicados à área textual, foi organizada uma iniciativa conhecida como Music In-

formation Retrieval Evaluation Exchange (MIREX) que envolve a avaliação científica

de técnicas aplicadas à recuperação musical. As avaliações são anuais e os experi- mentos são realizados no IMIRSEL57, um laboratório com infra-estrutura necessária para comportar a base de músicas, um conjunto válido de consultas e uma avaliação padronizada (nos moldes do TREC).

Devido aos problemas dos direitos autorais, a submissão de testes de recupe- ração musical segue uma lógica de testes um pouco diferente do que acontece no caso textual. A diferença está no fato de que textos podem trafegar da base TREC para os usuários via Internet sem problemas, e no caso de músicas isso não é autori- zado. Por esse motivo, o IMIRSEL recebe os algoritmos de recuperação, testa-os nas bases de músicas e consultas e, após uma avaliação, considerando as métricas esta- belecidas, devolve apenas os resultados58.

Ainda com relação aos problemas de direitos autorais, a base de músicas foi criada com poucos registros, mas ela vem crescendo significativamente com a inser- ção de músicas em vários formatos e representações, cedidas pela comunidade inte- ressada no projeto. Byrd (2007-a) tem divulgado informações sobre algumas coleções que já entraram ou que são candidatas para composição da base de testes MIREX (vide Tabela 2.3) para que a comunidade concernente tome conhecimento e para mo- tivar novos adeptos a contribuirem com mais pieces musicais.

57

IMIRSEL – International Music Information Retrieval Systems Evaluation Laboratory – é um projeto apoiado pelo curso de Ciência da Informação (Graduate School of Library and Information Science) da Universidade de Illinois at Urbana-Champaign (UIUC). Mais detalhes podem ser encontrados em http://www.music- ir.org/evaluation/.

58 Os coordenadores do IMIRSEL têm investido na elaboração de soluções para facilitar esse processo como, por exemplo, a disponibilização da plataforma DIY (Do It Yourself – faça você mesmo), na qual o próprio pesquisa- dor pode submeter suas consultas sem violar direitos autorais (DOWNIE, 2006).

Tabela 2.3: Algumas bases de dados candidatas para compor a coleção de testes MIREX

Nome Representação Formato Complexidade Quantidade de registros

Corais de Bach baseada em evento MIDI (SMF) polifônica 400 Barlow & Morgenstern instrumental CMN ?? monofônica 10,000 Barlow & Morgenstern vocal CMN ?? monofônica 8,000

CCARH MuseData CMN kern polifônica 3000

CD Sheet Music "CMN" imagem polifônica 7500

IRCAM áudio CD polifônica 5000

Meldex (NZDML) Folksongs CMN Meldex monofônica 10.000

Musicnotes CMN proprietário polifônica 45.000

Mutopia CMN LilyPond polifônica 500

Nightingale baseada em evento Nightingale polifônica 600

Nightingale CMN MEF polifônica 600

Parsons pitch contour pitch contour monofônica 11.000 Pickens baseada em evento MIDI (SMF) polifônica 1.200

RISM CMN Plaine&Easie monofônica 730.000

RWC áudio CD polifônica 300

Themefinder CMN kern monofônica 37.000

Uitdenbogerd & Zobel Baseada em even-to MIDI (SMF) polifônica 10.500

Fonte: adaptado de Byrd (2007-a)

Com relação às consultas musicais padronizadas para aplicação em sistemas musicais, a comunidade MIR/MDL definiu algumas premissas: (i) devem ser fortemen- te ligadas às necessidades e usos dos vários tipos de usuários; (ii) devem representar a complexidade envolvida nas diversas formas de expressão de consultas dos usuá- rios; (iii) devem ser neutras com relação ao método de recuperação empregado; (iv) devem ser ricas em dados tão realísticos e significantes para que julgamentos de re- levância possam ser feitos sem problemas (DOWNIE, 2003-b).

Até o momento as consultas disponibilizadas são suposições que consideram os sistemas apresentados na seção anterior, mas essa estratégia não tem atendido porque muitos deles não são apropriados para qualquer tipo de usuário, em particular para aqueles que têm pouco conhecimento musical. Para usuários especializados já existem alguns mapeamentos relevantes, mas o público de usuários sem domínio

musical é ainda uma incógnita porque não existem muitos estudos à respeito59. Por esse motivo (e dada a vasta gama de possibilidades e interesses), estudos de usuá- rios em larga escala têm sido motivados visando uma melhor compreensão das de- mandas reais do público como um todo.

Desde os experimentos do projeto de Cranfield na década de 1960 (BYRD e CRAWFORD, 2002, p. 1), duas métricas têm predominado na comunidade textual. A primeira delas é conhecida como precisão (ou precision), que é a taxa de documentos relevantes recuperados em relação ao total de documentos recuperados. A outra téc- nica é conhecida como revocação (ou recall), que é a taxa de documentos relevantes recuperados em relação ao total de documentos relevantes apresentados ao usuário. Tais métricas presumem a identificação de documentos julgados relevantes para uma dada consulta.

Essas métricas também têm sido consideradas para a música com alguma difi- culdade diante das discussões sobre a natureza da relevância e do significado de pie-

ces musicais. Apesar dos poucos estudos que empregam a medida de relevância,

técnicas de percepção de similaridade têm sido aplicadas com um razoável sucesso e ajudam no cálculo das métricas precision e recall. Mais recentemente Downie (2006) relatou a incorporação do Teste de Friedman – um teste de significância que ajuda nas comparações entre técnicas de recuperação musical – como mais uma métrica padronizada.

Uma outra iniciativa de melhoria no processo de recuperação musical é a pro- posição do MPEG7 – criada pelo MPEG (Moving Picture Experts Group) da ISO/IEC (MARTINEZ, 2004), o mesmo comitê que desenvolveu o MP3 e o MP460 – como um padrão para descrever músicas, incluindo o seu conteúdo interno. Esse padrão não se prende a nenhum tipo de recurso específico, atende diversos níveis de abstração e pode ser usado para descrição de qualquer objeto multimídia. Em outras palavras, as descrições possíveis não são dependentes de como o conteúdo está codificado ou armazenado, mas são significativas de acordo com o contexto da aplicação. Por e-

59 Os poucos estudos relacionados a usuários não especializados estão descritos na sessão 3.4.

60 O MP4 padroniza os recursos tecnológicos que habilitam a integração da produção, distribuição e acesso ao conteúdo no âmbito de multimídia interativa, multimídia em equipamentos móveis, gráficos interativos e televi- são digital.

xemplo, no caso da música em formato de áudio, seria possível descrever o seu con- teúdo com informações como a posição do som no espaço, o timbre e as pausas exis- tentes.

O nível de abstração está relacionado ao modo como as características são ex- traídas. Características com baixo nível de abstração são extraídas de forma automá- tica por meio de processamento computacional, mas as que apresentam alto nível de abstração utilizam interação humana. Como o propósito do padrão MPEG-7 é definir um conjunto de métodos e ferramentas que permita o acesso pelas mais variadas aplicações nos mais diversos ambientes, foi utilizada a linguagem XML, que é flexível e admite as possibilidades de extensão exigidas.

A comunidade MIR/MDL tem se dividido quanto à aceitação do MPEG7 como um padrão para descrições musicais. De fato, a aceitação desse padrão é ainda tími- da e há críticas que sugerem que ele é muito mais para auxiliar engenheiros a des- crever o áudio do que para a descrição de metadados musicais. Por sua vez, Baum- mann e Klueter (2002) criticam a sua funcionalidade alegando que o MPEG7 não a- tende a todas as demandas para a descrição de músicas.