• Nenhum resultado encontrado

154 IX. Classification hi´erarchique des instruments de musique, cas mono-instrumental

Signalons que Peeters a entrepris une analyse MDS (Multi Dimensional Scaling [Duda et al., 2001]) se basant sur les descripteurs utilis´es afin de v´erifier la pertinence de la taxonomie propos´ee. Cela a permis de justifier certains choix effectu´es mais n’a pas ´et´e utilis´e pour inf´erer une taxonomie automatique.

Fig. IX.3 Taxonomie hi´erarchique utilis´ee par Peeters pour la reconnaissance des instruments `a partir de notes de musique isol´ees [Peeters, 2003].

IX-3. Taxonomies hi´erarchiques des instruments de musique 155

standard (non-binaire). Son utilisation pour le clustering se justifie par le fait que celle-ci est sens´ee ˆetre globalement efficace pour la discrimination de tous les instruments consid´er´es. Elle participe donc de l’adaptation de la taxonomie au sch´ema de classification utilis´e. En effet, si l’on veut que la taxonomie soit optimale pour le sch´ema de classification, celle-ci doit organiser les instruments dans l’espace des attributs sur lequel agissent les classificateurs. Par cons´equent, elle doit d´ependre fortement de la s´election d’attributs utilis´ee.

Comme nous l’avons pr´ec´edemment signal´e, le choix du crit`ere de proximit´e des classes est aussi important. Il est n´ecessaire de recourir `a des distances robustes qui permettent de limiter l’effet des observations aberrantes sur les performances de clustering. De plus, ces distances doivent ˆetre en coh´erence avec l’approche de classification utilis´ee. Nous exploitons pour le clustering des distances probabilistes en examinant deux alternatives : la distance de Bhattacharryya et la divergence, pour retenir la distance qui produit le meilleur clustering. Cela peut ˆetre vu comme une op´eration de clustering des densit´es de probabilit´es des observations relatives aux diff´erentes classes. Les donn´ees que nous traitons sont connues pour ˆetre mal approxim´ees par des mod`eles mono-gaussiens, d’o`u le recours `a une approche par noyau pour le calcul de ces distances (cf.

section V-3-B).

Dans ce processus de calcul, il est n´ecessaire d’effectuer une d´ecomposition en valeurs propres de matrices de Gram (cf. section V-2-D.2) de tailles lq ×lq, o`u lq est le nombre d’exemples d’apprentissage de la classe Ωq. Cette op´eration est coˆuteuse (O(l3q)) car lq est assez grand (il peut d´epasser 40,000 pour certaines classes). Par cons´equent, les ensembles d’apprentissage sont divis´es en sous-ensembles de 2000 observations et les distances requises sont approxim´ees par la moyenne des distances calcul´ees entre ces sous-ensembles. Le nombre de valeurs propres `a pr´eserver a ´et´e ´etudi´e dans des exp´eriences pr´eliminaires, et nous sommes rest´es sur deux valeurs int´eressantes, `a tester : ri=rj = 10 et ri =rj = 20.

Le noyau exploit´e est le noyau RBF gaussien. Nous utilisons la mise `a l’´echelle d´ecrite dans la section VII-4 et deux valeurs de σ2 sont test´ees :σ2=0.5 et σ2=1.

Ainsi, nous calculons les distances entre toutes les paires de classes d’instruments consid´er´ees et nous les utilisons dans le d´eroulement de l’algorithme de clustering agglom´eratif.

Il s’agit dans un premier temps de s´electionner le meilleur clustering parmi les diff´erentes possibilit´es r´esultant de l’exp´erimentation de la distance de Bhattacharryyaa et de la divergence, mais aussi des diff´erentes valeurs deσ etri. Nous effectuons notre choix en nous basant sur les

156 IX. Classification hi´erarchique des instruments de musique, cas mono-instrumental

valeurs des coefficients coph´en´etiques, `a maximiser, (cf. section V-3-A) associ´es `a chacun des clusterings obtenus. Le tableau IX.1 r´esume les mesures de ces coefficients.

ri=rj = 10 20

σ2 0.5 0.5 1

Bhattacharryya 0.47 0.56 0.54 Divergence 0.71 0.73 0.69

Tab. IX.1 Coefficients coph´en´etiques des clusterings effectu´es en fonction des distances utilis´ees et des param`etresσdu noyau et ri, rj.

L’utilisation de la divergence avec ri = rj = 20 et σ2 = 0.5 r´ealise le clustering le plus pertinent au regard du coefficient coph´en´etique (maximum dans ce cas). Nous repr´esentons dans la figure IX.4 le dendrogramme associ´e `a cette solution. Cette repr´esentation sous forme d’arbre peut d´ej`a ˆetre consid´er´ee comme une taxonomie des instruments. N´eanmoins, il est plus judicieux d’´elaguer l’arbre pour une meilleure efficacit´e de la classification. D’une part, nous avons int´erˆet

`

a ne garder que les regroupements les plus pertinents (dans lesquels les classes restent “proches”

les unes des autres), d’autre part, il est plus int´eressant de limiter le nombre de niveaux de la taxonomie essentiellement pour limiter la complexit´e de la classification, mais ´egalement pour obtenir des taxonomies plus lisibles, qui soient faciles `a manipuler par un utilisateur.

Nous choisissons de limiter la taxonomie `a quatre niveaux (racine de l’arbre non comprise), ce qui demande trois coupes du dendrogramme puisque le dernier niveau est d´eduit automati- quement en d´eveloppant les nœuds du niveau 3 jusqu’aux feuilles (ce qui revient `a une coupe par la droite y = 0). Ces coupes sont visibles sur la figure IX.4. Elles donnent naissance `a la taxonomie repr´esent´ee dans la figure IX.5.

La taxonomie trouv´ee est significativement diff´erente de celle des familles d’instruments. A l’exception de quelques regroupements habituels, par exemple l’association, au sein d’un mˆeme cluster, du piano et de la guitare, ou encore de l’alto et du violon, la plupart des autres regroupements ne correspondent pas `a l’organisation en familles d’instruments.

Au premier niveau, la contrebasse jou´ee con arco3 et la contrebasse jou´ee en pizzicato sont associ´ees dans un mˆeme cluster avec le tuba, et le piano et la guitare sont regroup´es avec

3avec l’archet

IX-3. Taxonomies hi´erarchiques des instruments de musique 157

Pn Gt Co Cb Ts Cl Vl As Ss Va Fl Bo Fh Tb Ob Tr Ba Bs Ta Dr 0.04

0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22

N0.1.1 N0.1.2 N0.2.1 N0.2.2

N0.1.1.1 N0.1.1.2

Niveau 1 Niveau 2

Niveau 3

Niveau 4 Niveau 0

N0.1.2.1

N0.1 N0.2 N0.3 N0.4

Fig. IX.4 Dendrogramme obtenu avec la divergence,σ2=0.5 etri=rj= 20.

la majorit´e des bois et des cordes frott´ees. Ainsi, la distinction “instruments entretenus/non- entretenus” n’a pas ´et´e consid´er´ee comme pertinente. En effet, comme cette propri´et´e n’est pas captur´ee par les attributs s´electionn´es, elle ne peut ˆetre “vue” par le sch´ema de classification, et ce n’est donc pas optimal de la prendre en compte dans la taxonomie.

La plupart des bois se retrouvent `a ce niveau au sein du mˆeme cluster (noeud N0.1). Ce n’est pas le cas des cuivres qui sont dispers´es dans des groupes diff´erents. Le tuba est associ´e `a la contrebasse, la trompette au hautbois et le cor et le trombone associ´es au basson.

Aux niveaux inf´erieurs, nous observons que le trombone se d´etache de la paire (basson, cor), la flˆute se d´etache du regroupement (violon, alto, saxophone alto et saxophone soprano), et la clarinette se d´etache des clusters (piano, guitare) et (violoncelle, clarinette basse, saxophone t´enor).

Ainsi, il apparaˆıt, `a partir des descripteurs s´electionn´es, que l’information de tessiture soit dominante dans le regroupement des classes, puisque les instruments dont les tessitures se recouvrent fortement (dans la partie centrale cf.figure IX.6) sont assign´es aux mˆemes clusters.

Ces regroupements ne nous surprennent pas car ils traduisent les confusions que nous observons dans les exp´eriences de classification (nous les retrouverons dans la section IX-4) : les instruments qui sont fr´equemment confondus par le syst`eme de classification se retrouvent souvent au sein

158 IX. Classification hi´erarchique des instruments de musique, cas mono-instrumental

N0.3 N0.4 N0.2

N0.1

Vl As Ss Va Co Cb Ts

Pn Gt

Vl−As−Ss−Va−Fl Bo−Fh

Niveau 0

Niveau 1

Niveau 2

Niveau 3

Niveau 4 N0

Dr Pn−Gt−Co−Cb−Ts−Cl−Vl−As−Ss−Va−Fl Bo−Fh−Tb Ob−Tr Ba−Bs−Ta

Musique mono−instumentale

Tr Ta

Pn−Gt−Co−Cb−Ts−Cl Tb

N0.1.1 N0.1.2

Ba−Bs Ob

N0.1.1.1 N.0.1.1.2

Fh Fl

Co−Cb−Ts Vl−As−Ss−Va

Pn−Gt Cl

N.01.2.1

Bo N0.2.1

Fig. IX.5 Taxonomie g´en´er´ee automatiquement.

des mˆemes groupes de la taxonomie.

IX-4. Syst` eme de classification non-hi´ erarchique de r´ ef´ erence

Nous ´etudions dans un premier temps les performances d’un syst`eme de classification de r´ef´erence, non-hi´erarchique. Ce syst`eme exploite des mod`eles GMM dans une configuration standard (non binaire)4. Le nombre de composantes du m´elange gaussien a ´et´e fix´e `a M = 8, nos tests ont en effet montr´e que des valeurs plus grandes deM ne permettaient pas d’am´eliorer les performances, au contraire celles-ci ont tendance `a s’alt´erer.

La matrice de confusions `a l’issue du test effectu´e sur l’ensemble INS-T en utilisant des fenˆetres de d´ecision de longueur 4s (Nt = 249) est pr´esent´ee dans le tableau IX.3. Le taux de reconnaissance moyen est de 61.3%5. Ces taux varient de fa¸con significative d’un instrument

4Un sch´ema de classification bi-classe ciblant les 20 classes d’instruments consid´er´ees implique l’apprentissage

de 190 classificateurs binaires et l’utilisation d’autant de classificateurs dans la phase de test (sur chaque fenˆetre d’observation de 32ms), ce qui repr´esente une charge de calcul importante que nous cherchons `a ´eviter.

5Les confusions entre contrebassecon arcoetpizzicatone sont pas consid´er´ees comme telles : l’instrument ´etant le mˆeme, nous calculons son taux de reconnaissance `a partir de ceux obtenus pour Ba et Bs.

IX-4. Syst`eme de classification non-hi´erarchique de r´ef´erence 159

Fig. IX.6 Tessitures des instruments.

160 IX. Classification hi´erarchique des instruments de musique, cas mono-instrumental

`

a l’autre : si des performances acceptables sont atteintes pour certains instruments (batterie : 100.0%, piano : 88.5%, cor : 88.8%), les r´esultats ne sont pas satisfaisants pour d’autres, par exemple les saxophones t´enor et soprano (22.1% et 1.3%), la flˆute (55.8%), l’alto (49.6%) et la clarinette (23.8%). Nous relevons deux types de confusions :

– des confusions au sein d’une mˆeme famille d’instruments, par exemple la clarinette est confondue avec le saxophone alto dans 29.4% des cas, l’alto avec le violon dans 38.9% des cas, le tuba avec le trombone dans 22.1% cas. De telles confusions sont pr´evisibles eu ´egard au mode de production des sons ; elles ont ´et´e rapport´ees dans les ´etudes pr´ec´edentes sur la reconnaissance des instruments `a partir de notes musicales isol´ees (voir [Eronen, 2001a]

par exemple) ;

– des confusions entre instruments qui semblent intuitivement “´eloign´es” et qui n’ont pas ´et´e not´ees dans les ´etudes sur les notes isol´ees. Nous relevons par exemple que le basson est confondu avec le cor dans 24.3% des cas, le hautbois avec la trompette dans 11.2% des cas et le saxophone t´enor avec le violon dans 24.9% des cas. Il est raisonnable de penser que ces confusions ont lieu du fait que ces instruments ont des tessitures qui se recouvrent fortement dans leur partie centrale.

Nous obtenons donc la confirmation que la taxonomie g´en´er´ee automatiquement a tendance `a regrouper au sein d’une mˆeme super-classe les instruments qui sont fr´equemment confondus les uns avec les autres.

IX-5. Syst` emes de classification hi´ erarchique