4.2 Construction de l’ensemble des sessions
4.2.1 Fenˆetre glissante
La m´ethode de “fenˆetre glissante” utilise un seuil de densit´e minimal pour effec- tuer une classification des ´el´ements. Afin d’expliquer le seuil de densit´e minimal, nous allons faire une analogie avec les images que nous visualisons tous les jours. Sans forc´ement s’en rendre compte, les posters, affiches et prospectus, que nous pouvons rencontrer au cin´ema ou dans la rue, sont du type “pointilliste”. Cette caract´eristique est principalement due aux m´ethodes d’impression employ´ees. La plupart des impri- mantes utilis´ees aujourd’hui sont quadri-chromatiques. Elles fonctionnent avec quatre couleurs primaires. Pour restituer une couleur, elles d´eposent, sur le support d’im- pression, quatre points de couleurs primaires. La taille de chacun de ces points est proportionnelle `a la quantit´e de la couleur primaire correspondante dans la couleur `a restituer. Il en r´esulte que les images sont “tram´ees”. A distance, l’oeil ne per¸coit pas ce caract`ere pointilliste, la trame.
La figure 4.6 illustre cet effet d’optique. Elle repr´esente une feuille sur laquelle ont ´et´e d´epos´es des points de couleur noire. En la regardant de pr`es, on observe des points dispos´es chaotiquement, al´eatoirement : la trame. A distance, l’oeil va masquer la localisation de ces points par un effet de moyennage. Il identifie alors trois formes ayant des densit´es homog`enes de points.
La m´ethode de fenˆetre glissante s’appuie sur la notion de seuil de densit´e minimal pour constituer des groupes, `a partir d’un seuil donn´e et d’un ensemble d’´el´ements ordonn´es. Le seuil repr´esente la limite `a ne pas franchir pour que deux ´el´ements cons´ecutifs appartiennent au mˆeme groupe. Par cette m´ethode, nous devons obtenir un ensemble de groupes tel que chaque ´el´ement appartient `a un groupe et un seul, tel que le temps qui s’´ecoule entre deux ´el´ements cons´ecutifs d’un mˆeme groupe est inf´erieur au seuil donn´e et tel que le temps qui s’´ecoule entre deux ´el´ements appartenant `a des groupes diff´erents est sup´erieur au seuil donn´e.
Afin de formaliser la m´ethode de fenˆetre glissante, consid´erons un ensemble d’´el´e- ments E. Chaque ´el´ement e de cet ensemble est dat´e : date(e). Les ´el´ements de l’en- sembleE sont donc ordonn´es par date. Le seuil donn´e ests. SoiteiR(E,s)ej la relation r´eflexive et sym´etrique de proximit´e conditionn´ee par le seuil s.
∀(ei, ej)∈E2, eiR(E,s)ej ⇔ |date(ei)−date(ej)|< s (4.1) Les ´el´ements de l’ensembleE peuvent ˆetre repr´esent´es dans un graphe non orient´e, G= (X, V). L’ensemble des sommets de ce graphe est l’ensemble des ´el´ements, X =
CHAPITRE 4. CARACT´ERISATION DES ATTAQUES OBSERV´EES SUR LE POT DE MIEL HAUTE INTERACTION
Fig. 4.6 – Impression sur une feuille.
Fig. 4.7 – Exemple d’application de l’algorithme de la fenˆetre glissante
E. L’ensemble des arˆetes de ce graphe est l’ensemble des couples d’´el´ements li´es par la relation de proximit´e,V =ei, ej ∈E2/eiR(E,s)ej. La figure 4.7 pr´esente un exemple avec 10 ´el´ements, num´erot´es de 1 `a 10. Avec un seuil de 3 unit´es, le graphe obtenu contient 10 sommets et 10 arˆetes. Pour cet exemple, il n’existe pas d’arˆetes entre les sommets 3 et 4 et entre les sommets 6 et 7 car le temps qui les s´epare est ´egal ou sup´erieur au seuil de 3 unit´es. Pour la mˆeme raison, il n’existe pas d’arˆete entre les sommets 4 et 6 et entre les sommets 7 et 10. Pour finir, on constate des arˆetes qui sautent des ´el´ements : entre les sommets 1 et 3, entre les sommets 7 et 9 et entre les sommets 8 et 10.
95
Algorithme 3Algorithme de la fenˆetre glissante Entr´ees: E, s∈R+
Sorties: Fg(E, s) =p∈ P(E) p← ∅
- - L’ensembleE ne doit pas ˆetre vide.
siE 6=∅ alors
- - Amorcer avec un groupe contenant le plus petit ´el´ement, en fonction de la date.
e←x∈E/∀y∈E, date(x)≤date(y) o← {e}
E ←E−o
- - m contient la date du dernier ´el´ement absorb´e dans o.
m←date(e)
- - Continuer tant qu’il reste des ´el´ements orphelins.
tant que E6=∅faire
- -R´ecup´eration du prochain ´el´ement le plus proche, dans E.
e←x∈E/∀y ∈E, date(x)≤date(y) E←E− {e}
- -Clˆoture du groupe si l’´ecart est trop important.
sidate(e)−m≥salors p←p∪ {o}
o← ∅ finsi
- -Grandir le groupe.
o←o∪ {e} m←date(e) fin tant que
- - Ne pas oublier le dernier groupe en cours d’identification.
p←p∪ {o} finsi
Une chaˆıne du graphe est une suite de sommets du graphe c = (c1, ..., cn) telle que deux sommets successifs de cette suite soient li´es par une arˆete. Nous noterons CG l’ensemble des chaˆınes du graphe G = (X, V). Une composante connexe d’un graphe est constitu´ee des sommets induits par la relation “est accessible `a partir de”. L’accessibilit´e est permise par le biais des arˆetes. L’ensemble des composantes connexes d’un graphe forme une partition des sommets de ce graphe. Or, dans notre cas, la pr´esence d’une arˆete indique une dur´ee entre ´el´ements inf´erieure au seuil donn´e s. Donc, une chaˆıne repr´esente une succession d’´ecarts inf´erieurs au seuil. L’ensemble des groupes `a obtenir est alors constitu´e de l’ensemble des composantes connexes du graphe pr´ec´edent. Pour notre exemple pr´ec´edent, nous obtenons un ensemble de trois groupes, identifi´es sur la figure par des pointill´es. Une d´efinition formelle de la fonction permettant d’obtenir l’ensemble des groupes, Fg(E, s), est donn´ee dans la suite.
CG=∪∞n=1{c= (c1, ..., cn)∈Xn/∀i < n,{ci, ci+1} ∈V} (4.2) Fg(E, s) =p∈ P(E)/∀r∈p,∀(ei, ej)∈r2, ei 6=ej ⇒ ∃(ei, ..., ej)∈CG (4.3)
∀(r, r′)∈p2,∀(ei, ej)∈(r, r′), r6=r′ ⇒6 ∃(ei, ..., ej)∈CG
CHAPITRE 4. CARACT´ERISATION DES ATTAQUES OBSERV´EES SUR LE POT DE MIEL HAUTE INTERACTION
L’impl´ementation de cette fonction repose sur les ´etapes suivantes (cf. l’algorithme 3). On part d’un groupe contenant le plus petit ´el´ement, en fonction de la date. On fait grandir le groupe en absorbant le prochain ´el´ement le plus proche, si l’´ecart entre le dernier ´el´ement absorb´e et ce prochain ´el´ement est inf´erieur au seuil. Si cet
´ecart est sup´erieur au seuil, on clˆot le groupe et on recommence avec un groupe contenant l’´el´ement qui n’a pas pu ˆetre absorb´e. On poursuit tant qu’il reste des
´el´ements orphelins. A pr´esent, formalisons la d´efinition d’une session.