• Nenhum resultado encontrado

Algorithme de génération de séquence

L'algorithme de génération de séquences spéciques a pour objectif de générer une séquence dont la conguration la plus probable est un PM. Pour optimiser la stabilité, cette séquence doit aussi posséder une valeur de ∆G xée. Cet algorithme est composé de deux étapes. La première étape consiste en la génération aléatoire d'une séquence en bases azotées et la seconde vérie la spécicité de la séquence à travers les 3 règles dénies.

3. Analyse théorique d'une séquence générée 77 Le ltre déni vérie uniquement la spécicité de la séquence. La stabilité est caractérisée par deux paramètres ∆G, la variation d'énergie libre de Gibbs, etl la longueur de la séquence inconnue. L'énergie ∆G est calculée à partir du modèle du plus proche voisin dans l'approche populationnelle étudiée au chapitre 2. Ces deux paramètres sont liés. En eet, son calcul né- cessite la connaissance de la séquence en bases azotées et dépend donc indirectement de la longueur l exprimée en bases azotées. Cette dernière étant inconnue, il est nécessaire de xer l'un des deux paramètres pour notre algorithme. En xant une valeur maximale de l'énergie, notée ∆Gm, telle que l'énergie libre de la séquence inconnue soit inférieure à ce seuil, un enca- drement de l peut aussi être proposé. Le choix d'une valeur pour l impose alors à l'algorithme la production d'une séquence de cette longueur.

L'intervalle estimé est de la forme[lmax;lmin]dont les bornes sont les longueurs des séquences maximale et minimale respectivement. En eet, comme il s'agit d'une conguration hybridée de type PM, l'énergie de la séquence est comprise dans l'intervalle déni par les énergies des deux séquences caractéristiques. Ces séquences ainsi que les expressions analytiques de leurs énergies en fonction de la longueur en bases azotées ont été étudiées au chapitre 2 et 3. D'après ces expressions (équations 3.5 et 3.4) lmax et lmin sont estimées à l'aide des équations 4.2 et 4.3 :

lmax = ∆Gm+ 3.1

3.4 (4.2)

lmin = ∆Gm+ 1.1

1.2 (4.3)

La séquence aléatoire produite par l'algorithme est donc de longeur l et d'énergie comprise dans l'intervalle [∆Glmin,∆Glmax] d'aprés les équations 3.4 et 3.5, avec ∆Glmax = ∆Gm .

La deuxième étape est la vérication de la spécicité de la séquence à travers le ltre déni par les 3 règles. Celle-ci nécessite la détermination de deux paramètres : α etβ. Le paramétre α est la distance de Hamming minimale pour la dénition des 3 règles, et β est la longueur des segments à comparer en nombre de bases. Un schéma représentatif de cet algorithme est illustré dans la gure 4.2.

3 Analyse théorique d'une séquence générée

L'objectif de l'algorithme est de proposer des séquences pour lesquelles les congurations dénies dans le ltre sont peu probables. La probabilité de formation des congurations est donnée à travers la valeur du ∆G correspondant. Ainsi, les congurations dont la variation d'énergie de Gibbs est inférieure à 4 Kcal/mol sont considérées comme peu probables [Lee 94].

Quatre bases correspondent à cette énergie et le paramètre α est donc initialisé à cette valeur.

A l'aide de la fonction de Hamming, des segments de longueur β sont comparés. Cette lon- gueur peut être initialisée avec des valeurs proches de celle de persistance de l'ADN simple brin, estimée à 11 bases (pour une forme B de l'ADN) [Williams 01]. Cette longueur caractérise la plus petite unité d'un brin assimilable à un segment rigide1. Les séquences étant générées aléa- toirement, l'optimisation du temps de calcul conduit à une sous estimation de cette longueur,

1. Chapitre 1, paragraphe 1.3.1

78 Chapitre 4. Etude et caractérisation expérimentale de la spécicité

Figure 4.2 - Schéma représentatif de l'algorithme de génération de séquence.

initialisée ainsi à 8 bases. Les choix de l'énergie et de la longueur de la séquence sont xés en regard de la séquence spécique recherchée. En eet, une meilleure adhésion est probable avec une énergie de conguration PM plus faible.

La probabilité de formation de MM augmente avec la longueur de séquence. Des séquences de longueurs faibles sont donc privilégiées. D'une part, par comparaison à la séquence S1 étudiée au chapitre 3, la longueur des séquences générées doit être inférieure. D'autre part, pour des raisons de détection, la caractérisation expérimentale des séquences impose un choix de longueur au minimum supérieure à 10nm. Une séquence exemple de longueur 30 bases, notéeS3 est ainsi produite à l'aide de cet algorithme. Les séquences en bases azotées de S3 et de sa séquence complémentaire S4 sont données dans l'Annexe A.

A travers une analyse par le logiciel mFold, une comparaison des congurations possibles entre la séquence spéciqueS3et l'ancienneS1 est donnée dans le tableau 4.2. Une conguration instable de type épingle à cheveux est possible pour la séquenceS3 alors que les congurations de ce type sont stables dans leur ensemble pour la séquence S1 (gure 4.3). Pour les congurations de type hétéro-complémentaire, aucune conguration stable n'est possible pour la séquence proposée.

Avec une probabilité optimale pour la conguration PM, la séquenceS3 semble plus spécique que la séquence S1 initialement testée dans le projet Golem.

An de valider la spécicité de cette séquence, des expériences sont menées. La stabilité mesurée est analysée à l'aide de la méthode énergétique proposée au chapitre 3.

3. Analyse théorique d'une séquence générée 79

Figure 4.3 - Comparaison des congurations en épingle à cheveux des séquenceS1 et S3.

Propriétés S1 S3

Hétéro-complémentaire 118 41

Epingle à cheveux 14 1

Hétéro-complémentaire (énergie >4Kcal/mol) 27 0 Epingle à cheveux(énergie >4Kcal/mol) 14 0

∆G(PM) 164Kcal/mol 51 Kcal/mol

Tableau 4.2 - Tableau comparatif deS1 et S3.

80 Chapitre 4. Etude et caractérisation expérimentale de la spécicité

Figure 4.4 - Comparaison des énergies des congurations hétéro-complémentaires et "Perfect match" stables des séquencesS1 et S3.

4 Analyse expérimentale

Des expériences sont réalisées dans le but de caractériser la spécicité d'une séquence pro- duite par l'algorithme. Celles-ci sont eectuées à l'aide d'un AFM commercial du laboratoire AMIR de l'univérsité d'Oldenburg (Allemagne). Les substrats utilisés possèdent les mêmes propriétés et sont toujours en silicium avec le même protocole (Annexe C).

Cette partie s'attache à caractériser les séquences S3 et sa complémentaire S4. Une étude particulière est menée pour la spécicité à partir des forces de ruptures mesurées et de leur comparaison avec celles du chapitre 3. Ainsi, pour l'interaction spécique, une distribution homogéne des forces est attendue puisqu'une seule conguration stable est possible alors que pour les interaction non spécique, une distribution non homogéne est attendue.

Pour chaque expérience réalisée, le processus A/R est répété 10 fois sur des points diérents du substrat, la répétabilité du processus étant déjà démontrée dans le précédent chapitre.

Les expériences réalisée à Londres sont diérentes des expériences détaillées dans ce présent chapitre car le matériel utilisé (AFM, poutres, température ambiante, bruit...) est disemblable.

L'objectif apparaît aussi disimilaire puisque ces expérimentations visent à montrer la spécicité de la nouvelle séquence et l'inuence de deux paramétres expérimentaux la vitesse et le temps d'attente.

Le premier paragraphe rappelle les éléments constitutifs de ces expériences. La méthode éner- gétique est ensuite utilisée pour analyser la stabilité. L'inuence des paramètres fondamentaux comme la vitesse est aussi étudiée. Enn, un nouveau paramétre est introduit, le temps d'at- tente. Il correspond à un temps mesuré en secondes, introduit entre les deux étapes approche et retrait d'une mesure AFM. L'introduction de ce paramétre dans la caractérisation des inter- actions entre des brins d'ADN est un moyen d'étudier l'inuence du temps sur la stabilité du

4. Analyse expérimentale 81 velcro spécique.

Documentos relacionados