• Nenhum resultado encontrado

Présentation générale

L- EDIT

3.2 Les 2-intervalles

3.2.1 Notations et modélisation de molécules d’ARN

Notations. Afin de définir la notion de 2-intervalle, nous débutons cette section par la présentation de la notion d’intervalle.

Définition 3.14 (Intervalle). Un intervalle I = [x : y] est l’ensemble des points sur la droite réelle compris entre les deux points extrémitésxety.

Étant donnés deux intervalles I = [x : y] et J = [x0 : y0], nous définissons deux relations de comparabilité illustrées en Figure 3.3:

1. la précédence (notée<):I < J si et seulement siy < x0; 2. l’inclusion (notée⊆):I ⊆J si et seulement six0 < xety < y0.

Deux intervalles incomparables par précédence ou inclusion sont dits chevauchants.

Figure 3.3 – Relations de comparabilité entre intervalles.

Définition 3.15 (Intervalles disjoints). Deux intervallesI etJ sont disjoints si il n’existe pas de point de la droite réelle appartenant à la fois àI et àJ – i.e.I < J ouJ < I. On notera alorsIT

J =∅. Définition 3.16 (2-intervalle). Un 2-intervalle est l’union disjointe de deux intervalles. Nous noterons un 2-intervalle parD = (I, J)oùI etJ sont des intervalles tels queI < J.

Définition 3.17 (2-intervalles comparables). Deux 2-intervallesD1 = (I1, J1)etD2 = (I2, J2)sont comparables siI1, I2, J1, J2 sont disjoints deux à deux (i.e. les intervalles impliqués ne se chevauchent pas).

CHAPITRE 3 — Présentation générale 45

Étant donnés deux2-intervalles comparablesD1 = (I1, J1)etD2 = (I2, J2), il est facile de vérifier que D1 etD2 sont dans l’une des situations illustrées en Figure 3.4 et définies formellement par l’une des trois relations suivantes:

• D1< D2siI1 < J1 < I2 < J2;

• D1@D2siI2 < I1 < J1 < J2;

• D1./ D2siI1 < I2 < J1 < J2.

Figure 3.4 – Relations de comparabilité entre 2-intervalles.

Notons que les relations<et@sur les 2-intervalles sont transitives: i.e. siD1 < D2(resp.D1@D2) etD2< D3(resp.D2 @D3) alorsD1< D3(resp.D1 @D3).

Deux 2-intervalles D1 etD2 sont τ-comparables pour un τ ∈ {<,@, ./} siD1τ D2 ou D2τ D1. Pourvus de cette notion, nous définissons celle de modèle de comparaison.

Définition 3.18 (Modèle de comparaison). SoientDun ensemble de 2-intervalles etR ⊆ {<,@, ./} un ensemble non vide. L’ensemble Dest R-comparable si pour tout couple de 2-intervalles distincts (D1, D2)deD,D1etD2sontτ-comparables pour unτ ∈R. Tout sous-ensemble non videRest appelé modèle de comparaison.

D’après cette définition, si un ensemble de 2-intervallesDestR-comparable alorsDest un ensemble de 2-intervalles disjoints.

Définition 3.19 (Support). Le support d’un ensemble de 2-intervalles D, notéSupport(D), est l’en- semble de tous les intervalles impliqués dansD.

Dans [94], Vialette a proposé deux restrictions sur le support:

1. tous les intervalles du support sont de taille identique;

2. tous les intervalles du support sont disjoints deux à deux, i.e. si deux intervallesI, I0 ∈ Support(D) se chevauchent, alorsI =I0.

À partir de ces restrictions sur le support, nous pouvons définir un ensemble de restrictions sur la complexité structurelle d’un ensemble de 2-intervalles, et donc sur la complexité même des problèmes utilisant des 2-intervalles. Les deux restrictions sur le support induisent les trois niveaux de complexité suivants illustrés en Figure 3.5:

UNLIMITED: aucune restriction;

UNITARY: restriction 1;

46 CHAPITRE 3 — Présentation générale

DISJOINT: restrictions 1 et 2.

Figure 3.5 – Exemple d’ensemble de 2-intervalles respectant les différents niveaux de complexité de support:UNLIMITED,UNITARYetDISJOINT.

Étant donnés deux niveaux de complexitén1etn2, on noten1 ⊂n2si tout ensemble de 2-intervalles respectant le niveau de complexité n1 respecte également le niveau de complexité n2. À l’instar des séquences arc-annotées, nous définissons une unique hiérarchie de niveaux de complexité pour les 2- intervalles définie à l’aide de la notion de support.

Propriété 3.3 (Hiérarchie des niveaux de complexité). DISJOINTUNITARYUNLIMITED. Le bien-fondé de la Propriété 3.3 découle des définitions des niveaux de restriction de support. Étant donnés un ensemble de 2-intervallesD, un problèmePprenant en entréeDet un modèle de comparaison R ⊆ {<,@, ./}, on note P(n1, R) le sous-problème de P où Drespecte le niveau de complexité de supportn1et le résultat deP(n1, R)est un sous-ensemble deDR-comparable.

SoientP(n1, R)etP(n2, R)deux sous-problèmes deP, on noteP(n1, R)⊂ P(n2, R)sin1 ⊂n2. Cette définition et la Propriété 3.3 permettent de définir également une hiérarchie entre les différents sous-problèmes deP comme illustrée dans la Table 3.8.

P(UNLIMITED, R) ⊃ P(UNITARY, R) ⊃ P(DISJOINT, R)

Table 3.8 – Hiérarchie entre les différents sous-problèmes deP en fonction des niveaux de complexité du support,∀R⊆ {<,@, ./}.

Pourvus de cette hiérarchie entre les différents sous-problèmes deP, nous en déduisons une propriété sur la propagation de la complexité du problèmeP.

Propriété 3.4. SoientP(n1, R)etP(n2, R)deux sous-problèmes dePtels que 1. n1 etn2appartiennent à{DISJOINT,UNITARY,UNLIMITED};

2. R⊆ {<,@, ./}; 3. P(n1, R)⊂ P(n2, R).

Si le problèmeP(n1, R)est NP-complet (resp. le problèmeP(n2, R) est polynomial) alors le pro- blèmeP(n2, R)(resp.P(n1, R)) l’est également.

CHAPITRE 3 — Présentation générale 47

Modélisation de molécules d’ARN. Partant du constat que pour de nombreuses molécules d’ARN, la structure est mieux conservée durant l’évolution que la séquence de nucléotides [32], Vialette a étudié, dans [93, 94], le problème de l’élaboration d’une représentation générale de motifs structuraux, i.e. de descripteurs macroscopiques des structures secondaires d’ARN. L’approche adoptée a été de définir des descripteurs géométriques d’hélices à l’aide des 2-intervalles. Les propriétés géométriques des 2- intervalles peuvent permettre une meilleure compréhension de la complexité du problème de recherche de motifs structurés dans des séquences d’ARN.

Intuitivement, chaque 2-intervalle représente une hélice, i.e. une suite continue de liaisons entre nu- cléotides complémentaires. Plus précisément, étant donné un 2-intervalle D = (I, J) représentant une hélice,I(resp.J) représente la première (resp. seconde) suite continue de nucléotides, en parcourant le brin d’ARN dans le sens50−30, constituant l’hélice, comme illustré en Figure 3.6. Ainsi un ensemble de 2-intervalles représente une structure d’ARN en faisant abstraction de la nature des nucléotides (les longueurs des régions simples brins et des hélices peuvent être modélisées dans cette représentation en faisant varier l’espace entre deux intervalles et la taille de ces derniers). La contrainte de planarité des structures secondaires d’ARN induit le lemme suivant.

Lemme 3.3. Toute structure secondaire sans pseudo-noeud peut être modélisée à l’aide d’un ensemble de 2-intervalles{<,@}-comparable respectant le niveau de complexité de support DISJOINT.

Figure 3.6 – Exemple de représentation de la structure de l’ARN ribosomal 16s d’Escherichia Coli [60]

au moyen de 2-intervalles (vue partielle). Par souci de lisibilité, les longueurs des régions simples brins n’ont pas été respectées.

48 CHAPITRE 3 — Présentation générale