• Nenhum resultado encontrado

Chapitre3. La description par ensemble appliquée aux protéines désordonnées

d’un champ de force [116], soit en utilisant des algorithmes génétiques sélectionnant les meilleures structures en accord ou soit encore en pesant le poids des structures utilisées dans une approche bayésienne [117]. Ces méthodes ont été appliquées avec succès avec d’autres algorithmes combinant données RMN et SAXS [118,119]. Des consensus semblent maintenant se dessiner concernant le traitement et la validation des approches comme en témoignent ces revues [99,120,121].

L’interprétation des données RMN ou SAXS des protéines désordonnées est un défi scientifique nécessitant des connaissances en mathématiques, physiques. Cette rapide présentation des méthodes n’est évidemment pas exhaustive et ne permet pas d’as- similer la complexité des problèmes rencontrés lors du traitement des données. C’est pourquoi nous présenterons au paragraphe suivant les grandes lignes à approfondir concernant le fonctionnement de la description par ensemble sous contraintes.

3.4. Avant-propos, réflexion

peptide de 10 résidus. Il est aussi possible de peser le poids des conformations pré- sentes pendant la sélection. Ce choix est principalement méthodologique et n’engage pas l’approche considérée, qui nécessite juste alors N paramètres de plus.

La détermination d’un sous-ensemble de structures est un problème d’analyse quantitative multivariée. Comme précédemment exposé nous sommes en présence d’un système présentant un nombre de degrés de liberté impressionnant et nous ne dispo- sons que de mesures expérimentales restreintes. Il est ainsi particulièrement difficile de déterminer une seule solution à ce problème. L’utilisation même de données RMN ou SAXS ne permet pas de déterminer sans ambiguïté des ensembles en accord avec les données expérimentales. Il faut donc évoluer prudemment lors des protocoles de sélections, la dégénérescence des solutions est à priori inévitable sans la combinaison des différents paramètres.

Les questions fondamentales

Nous mettons maintenant en avant différentes questions ou problèmes que nous nous efforcerons de mentionner ou résoudre dans les chapitres suivants :

- Point1: l’accord avec les données expérimentales ne garantit pas le sens physique de l’ensemble en sens ensemble respectant une distribution de Boltzmann

- Point 2 : le nombre de degrés de liberté d’un tel système est très important com- parativement aux nombres de données disponibles pour caractériser de tel système - Point 3: il n’existe pas de solution unique en accord avec les données expérimen-

tales

- Point4 : quel nombre de structures devons-nous utiliser dans une description par ensemble ?

Conclusion du chapitre

Durant ces trois chapitres, nous avons introduit les concepts et outils fondamentaux pour comprendre et étudier les protéines désordonnées. Ce manuscrit propose ainsi d’expliquer comment en combinant la résonance magnétique nucléaire avec des outils numériques il est possible d’obtenir une description moléculaire de l’état déplié. La solution retenue pour décrire la dynamique des protéines désordonnées est de recourir à un modèle statistique appelé la description par ensemble explicite de structures, dé- crivant l’ensemble des états accessibles. En continuité, le chapitre suivant présentera les réalisations du groupe Flexibilité et Dynamique des Protéines et notamment le modèle choisi pour les travaux de thèse.

4

L a description par ensemble :

présentation et application à la protéine U biquitine dénaturée dans l ’ urée

C

e chapitre englobe les travaux réalisés au sein de l’équipe en amont de la thèse. Il se divise en deux parties, l’une concerne la présentation de la description par en- semble, la seconde concerne l’application de cette méthode pour caractériser la protéine Ubiquitine dénaturée dans l’urée à8M en combinant la description par ensemble sous contraintes avec les couplages dipolaires résiduels.

Courant des années 2000, de nombreuses questions sont adressées à la commu- nauté scientifique pointant du doigt la nécessité de développer des méthodes et outils physiques pour caractériser les protéines intrinsèquement désordonnées [122]. Deux aspects doivent être mis en place : de nouvelles méthodes expérimentales adaptées à la dynamique des protéines intrinsèquement désordonnées sont à développer mais aussi des outils d’analyse et de traitement des données. En effet, l’abandon de la représentation des protéines par une unique structure a nettement complexifié la compréhension des mécanismes biologiques associées aux protéines intrinsèquement désordonnées et constitue un défi à relever. La description par ensemble explicite de structures présentées au chapitre précédent (en section 3) se trouva un modèle viable pour analyser le comportement des protéines désordonnées. C’est dans cette optique que le logiciel Flexible-Meccano a été développé par le groupe Flexibilité et Dyna- mique des protéines. Nous aborderons donc le fonctionnement de cet algorithme et les applications et perspectives qui en ont découlé. Ces travaux se sont concrétisés par plusieurs publications combinant le modèle développé et les paramètres RMN et SAXS [123,108,124,112].

Une deuxième étape fut la mise en place d’une approche plus quantitative, il s’agissait d’exploiter la diversité des structures composant les ensembles générés par le logiciel Flexible-Meccano pour sélectionner des sous-ensembles de structures les plus en adéquation possible avec les données expérimentales et ainsi caractériser au mieux les règles et spécificités régissant le comportement des protéines désordonnées.

La fonction guidant la sélection cherche alors uniquement à minimiser la différence entre les données expérimentales et les données simulées en choisissant les structures les plus appropriées. Ce problème d’optimisation, à priori trivial, nécessita l’implé- mentation d’un algorithme génétique : Asteroids pour A Selection Tool for Ensemble Representations of Intrinsically Disordered States, la mise en place d’outils spécifiques pour calculer des couplages dipolaires résiduels et de nombreux tests pour valider la consistance de l’approche. Nous avons finalement mis au point une méthode combinant

Chapitre 4. La description par ensemble : présentation et application

Flexible-Meccano et Asteroids permettant de sélectionner des ensembles de struc- tures représentatifs de l’état déplié en utilisant les CDRs. Nous allons donc présenter les étapes fondamentales de la description par ensemble sous contraintes et répondre aux questions précédemment évoquées concernant le nombre de structures à utiliser ou la dégénérescence des solutions. Les tests présentés serviront de gages de qualité de la description et seront continuellement repris et appliqués dans les chapitres suivants sur d’autres systèmes.