• Nenhum resultado encontrado

III. LFY, un facteur de transcription original

1. Généralités sur les facteurs de transcription

Nous avons vu combien la régulation spatio-temporelle de l’expression des gènes pouvait être importante dans les voies de signalisation de réponses à des stimuli environnementaux ou endogènes, combien elle était importante au développement de la plante. Ce rôle des facteurs de transcription semble généralisable à tout organisme vivant: les facteurs de transcription sont les « architectes du Vivant ». Aussi, l’altération de l’expression des gènes qui les codent serait la source principale de diversité et changement qui sous-tendent l’évolution (Carroll, 2000).

37 a) Les grandes familles de protéines associées à l’ADN

Les protéines capables de lier l’ADN, à partir des entrées de 240 structures de complexe protéine/ADN dans la banque PDB (Protein Data Bank), ont été classés en 8 grandes familles sur les bases de la structure de leur motif de liaison à l’ADN ou DBD (DBD, DNA binding domain): 1-les HTH (Hélice-Tour-Hélice, incluant les HTH ‘winged’, littéralement ‘ailés’), 2-les coordinateurs de zinc, 3-les protéines type zipper, 4-les autres hélices α, 5-les feuillets β, 6-les épingles à cheveux/ruban β, 7-les autres, 8-les enzymes (Fig.11; Luscombe et al., 2000).

38

1-les HTH

La grande famille des HTH naît d’un DBD de 20 aa définissant deux hélices α quasi perpendiculaires connectées par un tour de quatre résidus β. Parmi les HTH sont notamment répertoriées les protéines à homéodomaine, les protéines MYB, la famille des Cro et répresseurs, la famille des répresseurs LacI, les protéines à domaine paire Prd, la famille de transposases Tc3. Par extension, les HTH ailés, présentant un lien du type boucle formée d’une troisième hélice α et d’un feuillet β adjacent qui vient remplacer le tour de résidus β, peuvent être assimilés à des membres de cette famille dès lors que les deux hélices α restent quasi-perpendiculaires. Ce motif contacte l’ADN au niveau du grand sillon via la seconde hélice α du motif, élément de reconnaissance ou sonde de l’ADN, qui s’insère véritablement dans le sillon. Les contacts de soutien au squelette phosphate de l’ADN sont principalement assurés par le tour et par la première hélice α qui ponte le grand sillon d’ADN à partir de son extrémité N-terminale. D’autres contacts avec l’ADN peuvent être réalisés par le reste de la protéine, et peuvent contribuer également à la spécificité de reconnaissance. Les deux hélices α du motif HTH sont typiquement confinées au sein d’un fagot de trois à six hélices α qui confèrent un coeur hydrophobe stabilisateur. Bien que les motifs HTH puissent présenter de très fortes homologies de structures entre protéines de familles fonctionnelles éloignées, les séquences d’acides aminés sont quant à elles très variables et expliquent la variabilité de séquences d’ADN reconnues (Fig.11A).

En général, il a été observé que les HTH d’origine procaryote reconnaissaient des séquences palindromiques sous forme d’homodimère, tandis que les HTH eucaryotes, dont la famille des protéines à homéodomaine, contactent des séquences d’ADN pouvant être non symétriques sous forme soit de monomère, homo- ou hétérodimère.

2-les coordinateurs de zinc

Les protéines coordinatrices de zinc contiennent la plus importante famille de facteurs de transcription eucaryotes, la famille des doigts de zinc ββα. On y compte aussi la famille des récepteurs hormonaux (hormones stéroïdes, thyroïdes et rétinoïdes), la famille boucle-feuillet-hélice (ex.p53) et la famille Gal4. Leur DBD est caractérisé par la coordination tétraédrique de un ou deux atome(s) de zinc par des résidus cystéines et histidines conservés. L’étendue de cet arrangement serait due à la stabilité structurale que confère le ou les atome(s) de zinc. Il est important de noter que la coordination d’atomes de zinc n’est pas seulement observée dans l’interaction protéine-ADN mais également dans des interactions protéine-protéine. La liaison à l’ADN se fait de façon générale par insertion d’une hélice α dans le grand sillon. Une seconde hélice α peut éventuellement venir contacter le squelette phosphate (cas des récepteurs hormonaux et de la famille Gal4) et des boucles peuvent établir des liaisons au niveau du petit sillon (cas de la famille boucle-feuillet-hélice; Fig.11B).

39 Enfin, ces facteurs peuvent agir en monomère (cas de la famille des doigts de zinc ββα), en homodimère (cas des récepteurs hormonaux et de la famille Gal4), en hétérodimère (cas des récepteurs hormonaux) ou encore en tétramère (cas de la famille boucle-feuillet-hélice).

3-les protéines de type-zipper

Ce groupe tire son nom de la façon dont ses membres se dimérisent. Il regroupe deux familles de protéines d’origine eucaryotes, les leucine zippers et les hélice-boucle-hélice ou HLH (Helix-Loop- Helix) qui peuvent agir aussi bien en homo- qu’en hétérodimère.

Les leucine zippers, les protéines C-Jun et C-Fos par exemple, ont une structure en deux domaines: un domaine de dimérisation et un DBD. Chaque monomère consiste en une grande hélice α d’environ 60 aa. La région zipper, ou région coiled coil, est constituée de leucines ou de résidus hydrophobes similaires espacés tous les huit résidus afin de toujours être exposés sur la même face de l’hélice α. Ces résidus peuvent ainsi contacter les résidus hydrophobes équivalents au niveau du deuxième monomère. Le domaine DBD, domaine basique situé à l’extrémité N-terminale de chacun des deux monomères, contacte le grand sillon de l’ADN (Fig.11C).

Les HLH dérivent des leucine zipper par l’intercalation d’une boucle au niveau de la grande hélice α qui sépare physiquement le domaine de dimérisation du DBD. Hormis cette différence qui leur confère un gain de flexibilité dans le positionnement respectif de chaque hélice N-terminale au niveau de l’ADN, leurs caractéristiques sont les mêmes que celles des leucine-zippers.

4-les autres hélices αααα

Ce groupe compte sept familles aux fonctions très différentes: Skn-1 et les protéines à boîte MADS sont des régulateurs d’origine eucaryote, Papillomavirus1 E2 et EBNA1 sont des régulateurs et initiateurs de la réplication d’origine virale, les histones et le groupe de protéines à haute mobilité (HMG, High-Mobility Group) sont des protéines architecturales de compaction de l’ADN, et Cre est une recombinase site-spécifique. Bien que leurs structures soient très différentes, toutes ces protéines contactent l’ADN via une hélice α. Du fait de leur variabilité, je me limiterai ici au descriptif de protéines présentant un intérêt dans le cadre de mon travail.

Les protéines à boîte MADS, protéines au rôle déjà évoqué à maintes reprises dans les paragraphes précédents, ont DBD de 56 résidus projetant de longues hélices dans le grand sillon de l’ADN à la manière des leucine zippers et établissent d’autres points de contacts avec le squelette phosphate (Fig.11D).

La recombinase Cre est dimérique. Chaque monomère consiste en deux domaines structuraux qui se replient selon un fagot d’hélices. Ensemble ces domaines viennent clamper l’ADN, insérant des hélices α à la fois dans les petit et grand sillons.

40

5-les protéines à feuillets ββββ

Ce groupe se limite à la famille des protéines de liaison des boîtes TATA. Il se caractérise par un large feuillet β de 10 brins antiparallèles qui vient recouvrir l’ADN au niveau du petit sillon (Fig.11E).

6-les protéines à épingles à cheveux/ruban ββββ

Ce groupe se distingue des protéines à feuillets β par la taille du feuillet ou épingle à cheveux β qui contacte l’ADN, de deux à trois brins. L’interaction peut se faire ici aussi bien au niveau du petit que du grand sillon, en monomère ou en dimère selon la protéine (Fig.11F).

7-les autres

Deux familles non-enzymatiques utilisent un motif structural secondaire de liaison à l’ADN mal défini. Toutes deux fonctionnent en dimère où chaque monomère présente un multidomaine servant à la fois à la liaison à l’ADN, à la dimérisation, et à l’adressage au noyau (Fig.11G).

8-les enzymes

A la différence des autres groupes, ce groupe rassemble des protéines de même fonction (toutes altèrent la structure de l’ADN par catalyse chimique). Chez les enzymes comme chez le groupe des « autres », le DBD est généralement difficile à décrire en termes de motif structural simple, ces protéines utilisant une large combinaison d’hélices α, feuillets β et boucles à ces fins. Beaucoup possèdent trois domaines distincts: un domaine de reconnaissance de l’ADN qui « lit » la séquence d’ADN, un domaine catalytique comprenant le site actif de l’enzyme et si nécessaire, un site de dimérisation. La structure en résultant présente une cavité en forme U où est lié l’ADN, occasionnant souvent de sévères déformations de la structure d’ADN (Fig.11H).

b) Etat des connaissances sur les facteurs de transcription végétaux

Le séquençage du génome entier d’A. thaliana a permis d’évaluer la proportion des facteurs de transcription à près de 6% des gènes codants d’A. thaliana, soit 1500 gènes environ sans compter les gènes auquel il n’a pas encore été assigné de fonction (40 à 50% des gènes). Cette proportion est 1.3 fois plus importante que celle de la drosophile Drosophila melanogaster, et 1.7 fois plus que celle de Caenorhabditis elegans et de la levure Saccharomyces cerevisiae. De plus, on note que parmi ces 1500 gènes, près de la moitié appartiendrait à des familles de facteurs de transcription spécifiques au règne végétal, innovation qui résulterait du mode de vie végétal original. Pour s’adapter aux nouvelles contraintes occasionnées par leur ancrage à la terre (immobilité), les plantes ont effectivement du développer des réseaux métaboliques mettant en jeu des facteurs de transcription qui se distinguent remarquablement d’un point de vue de leur séquence des facteurs de transcription procaryotes et autres eucaryotes (Shiu et al., 2005).

41 A. thaliana contient de nombreuses duplications de gènes en tandem et duplications à large- échelle interchromosomiques qui représenteraient plus de 60% du génome. Ces duplications sont à l’origine de grandes familles de protéines qui peuvent se voir réparties à l’ensemble des cinq chromosomes. Parmi ces familles, deux ont été particulièrement amplifiées chez A. thaliana comparativement aux animaux et champignons, à savoir les protéines MYB (136 membres) et les protéines à boîte MADS (82 membres). Le DBD des protéines MYB repose sur une structure HTH pourvue de trois résidus tryptophane espacés régulièrement. Chez A. thaliana, la plupart de ces protéines MYB appartiennent à la classe R2R3-MYB (131 membres) contenant deux répétitions imparfaites du motif MYB, tandis que la classe R1R2R3-MYB, beaucoup plus classique chez les animaux, est très rare (5 membres; Riechmann et al., 2000). Le DBD des protéines à boîte MADS a déjà été détaillé quant à lui dans le paragraphe III.1.a.4 ‘les autres hélices α’.

Les facteurs de transcription spécifiques au règne végétal ont été classés et nommés en fonction de leur DBD. Une revue publiée en l’an 2000 fait état de ces DBD, décrits en onze larges familles: les protéines WRKY (72 membres), NAC (109 membres), AP2/ERF (144 membres), GARP, GRAS, Trihelix DNA, TCP, Auxin response factors (ARFs), SBP (17 membres), Nin-like et ABI3/VP1 (Riechmann et al., 2000; Yamasaki et al., 2008). De ces onze familles, beaucoup présentent des homologies structurales avec d’autres protéines eucaryotes: le DBD des WRKY et des NAC ressemble au domaine coordinateur de zinc GCM d’insectes, les protéines GRAS seraient apparentées aux protéines STATs, et des protéines Trihelix DNA et GARP auraient la même origine que les protéines MYB. Sur les quelques DBD présentés comme spécifiques aux plantes, peu ‘survivent’ à la comparaison avec des nouvelles entrées de structures animales et procaryotes dans la banque PDB.

Les facteurs de transcription AP2 par exemple, l’une des trois familles de facteurs de transcription les plus abondantes chez A. thaliana, semblaient apporter un nouveau mode de reconnaissance de l’ADN par un feuillet β (Riechmann et al., 2000). Mais récemment, des homologies structurales ont été mises en évidence avec les integrases du transposon procaryotique Tn916 et du bactériophage λ, ainsi qu’avec des endonucleases de levure et putativement de bactéries, de phages et de protistes (Yamasaki et al., 2008).

Ainsi, ces observations indiquent que la majorité des DBD spécifiques aux plantes dériveraient d’espèces non végétales, DBD qui ont ensuite été amenés à se dupliquer pour former des familles multigéniques chez les végétaux supérieurs.