• Nenhum resultado encontrado

Chapitre II Définition de l’approche : à la découverte de la famille des A1b

B. Recherche des gènes homologues au gène codant pour PA1b dans le génome

4) Analyse des séquences

Les différentes séquences (complètes et incomplètes) obtenues ont été alignées en utilisant le logiciel MultalinTM élaboré à l’INRA de Toulouse et disponible sur Internet

1,5 kb gène humain : témoin

positif Bandes

clonées

1 kb 0,5 kb 1,6 kb

Définition de l’approche : à la découverte de la famille des A1b

104

(http://www.toulouse.inra.fr/multalin.html). Pour les séquences de peptides racinaires de M. truncatula, l’alignement a été arrangé manuellement afin de conserver l’alignement des cystéines (Figure 52). Les séquences obtenues sont nommées d’après la nomenclature neutre proposée par Y. Rahbé10.

La structure globale du gène de PA1b est conservé dans toutes les espèces. On retrouve un peptide signal relativement variable coupé d’un intron de taille variable (de 82 à 368 pb pour le pois et le soja respectivement), puis A1b, un court peptide intermédiaire potentiel de longueur relativement variable, et enfin A1a qui apparaît plus conservé (y compris chez les homologues non-graines). La forte conservation de la molécule tend à indiquer qu'elle joue un rôle précis toutefois encore inconnu. Higgins et al. (1986) et Gatehouse et al.

(1985) proposent un rôle de stockage du soufre dans les graines, ce qui n'explique ni cette forte conservation, ni la présence d'homologues relativement proche dans les racines.

La comparaison avec les séquences publiées du pois et du soja montre que nos séquences sont de nouveaux allèles avec peu de mutations, toutes synonymes dans le cas de la séquence du soja par rapport à certains EST. Les nouveaux gènes de M. truncatula et du haricot apportent de la variabilité dans la famille peptidique, amenant à distinguer certains acides aminés particulièrement bien conservés dans les A1b. Il s’agit des six cystéines il est à noter que la dernière est exceptionnellement absente dans la séquence MtrA1b007), des cinq prolines, des glycines G5 et G30 en plus de l’arginine R21 et de la leucine L27.

Les deux séquences de M. truncatula, dont une assez fortement divergente (MtrA1b007), restent toutefois plus proches de la séquence de PA1b que des peptides racinaires et nodulaires auparavant publiés chez cette espèce (Gamas et al., 1996).

L’analyse des séquences complètes déjà connues, ainsi que la structure tridimensionnelle de PA1b, permet de distinguer plusieurs régions plus ou moins conservées (Figure 52 et Figure 51): région de maturation N-terminale, segment nC1 N-terminal, segment CC2 court, segment CC3 où a été ancré le primer N-terminal, formant une boucle apparemment souple laissant les résidus F et E accessibles à un pôle de la molécule, segment CC4 variable formant une boucle opposée à la précédente, segment CC5 très court (CXC), segment CC6 replié réalisant un doigt rigide hydrophobe dont l’extrémité jouxte les résidus F et E au même pôle du peptide, puis segment Cc7 C-terminal et enfin région intermédiaire I entre PA1b et PA1a, éliminée à la maturation du peptide.

nC1 CC2 CC3 CC4 CC5 CC6 Cc7 PA1b ASCNGVCSPFEMPPCGTSACRCIPVGLVIGYCRNPSG

Figure 51 : CC1 à 7 : Segments de PA1b délimités par les cystéines 1 à 6.

 La séquence de maturation à clivage post A (motif V/IEA) s'avère bien conservée entre peptides racinaires et peptides de graines. Il est probable que l'enzyme responsable de cette maturation soit elle aussi relativement conservée. Il faut toutefois remarquer que les sites de coupure des peptides racinaires et du lupin ne sont pas connus expérimentalement, les séquences obtenues ne provenant pas de séquençage protéique mais nucléique. Seuls les peptides décrits par Higgins et al.

(1986) et Watanabe et al. (1994), ainsi que ceux ressortant de notre étude (pois, soja et haricot) sont parfaitement caractérisés d'un point de vue post-traductionnel.

10 les trois premiers caractères sont la première lettre du nom de genre et les deux premières du nom d'espèce, suivis de trois lettres indiquant le type de peptide (A1b ou A1a) et de trois chiffres (NNN) permettant d'identifier les isoformes d'une même espèce : GesA1xNNN.

 Le segment CC3 s'avère extrêmement conservé (CSPFEM(/V)PPC) dans les séquences de type peptide de graine. Cette extrême conservation et sa position tridimensionnelle dans la protéine (coude tourné vers l'extérieur du peptide, dû à la présence de trois prolines dont une cis (Jouvensal et al., 2003)) permettent de supposer que ce segment jouerait un rôle important dans l’activité du peptide.

 La variabilité de la boucle CC4 se trouve confirmée par les séquences obtenues. En effet, au delà de la variabilité des acides aminés accentuée par l'apport des nouvelles séquences, le nombre même de ceux-ci varie : PvuA1b001 présente 5 acides aminés contre 4 pour les autres séquences de graines.

 Au contraire, le segment CC5 est parfaitement conservé. Dans tous les peptides de graines, le motif est CRC, pour les autres peptides, l'acide aminé central varie fortement (CXC). Cette conservation du motif (un seul acide aminé entre les deux cystéines) est certainement lié à une forte contrainte structurale concernant probablement la connectivité des ponts disulfures.

 Le doigt hydrophobe (CC6) s'avère assez variable, avec toutefois conservation de la proline à la deuxième position, de la leucine à la cinquième et d'une glycine à l'avant-dernière, pour les peptides de graines. Au vu de sa position tridimensionnelle (tourné vers l'extérieur, en face du segment CC3) et de son hydrophobicité conservée, ce segment pourrait également être important pour la toxicité de ce peptide.

 Le segment I, situé entre PA1b et PA1a présente une variabilité de longueur, plus importante et plus attendue que pour CC4, puisque n’influant pas sur la structure des peptides. On peut remarquer que le premier acide aminé de ce peptide, V ou L dans la plupart des séquences, est une proline pour les deux séquences de M.

truncatula. Jouxtant le site de clivage observé chez le pois (glycine C-terminale remplacée dans cette espèce par une sérine), elle pourrait empêcher la maturation de type pois des peptides de cette plante.

On ne connaît pas le mode d’action des peptides de type A1b et l’observation de motifs conservés ou au contraire fortement variables peut être une aide à la détermination des régions actives. Néanmoins, l’absence de véritable motif protéique structural détecté, ne permet pas de présager du mode d’action et du rôle exact de ces peptides, dans les insectes cibles comme dans la graine. En effet, la caractérisation du site de liaison de PA1b dans les tubes digestifs des charançons est en cours au laboratoire et l’activité entomotoxique éprouvée de ce peptide permet de le considérer comme molécule de défense des graines.

Toutefois, les peptides apparentés caractérisés chez le soja et le lupin n’ont pas été testés pour leur activité entomotoxique. La toxicité analogue observée sur la farine de soja au cours de ce travail laisse présager d’une réelle activité toxique de ces peptides mais n’exclut pas un éventuel autre rôle. En effet, il se peut que ces peptides servent de réserve de soufre dans la graine comme proposé initialement par Higgins et al. (1986). Il est également possible qu’ils interviennent dans un mécanisme de transduction de signal, au sein de la plante, comme suggéré pour le lupin par Ilgoutz et al. (1997), et pour le soja par Watanabe et al. (1994).

<--- leader ---> <--- PA1b ---> <- PA1a ->

PsaA1b005 (Delobel et al., 1998) ASCNGV---CSPFEMPPCGTSA-CRCIPVGLVI--GYCRNPSG

Q40999 (Psa, M81864) MASVKLA-SLIVLFATLGMFLTKNVGA ASCNGV---CSPFEMPPCGSSA-CRCIPVGLLI--GYCRNPSG V—-F LKGN DEHPNLC/…

PsaA1b048 (non publiée) CRSSA-CRCIPVGLLI--GYCRNPSG V--F LKGN DEHPNLC/…

PsaA1b012 (AJ574794) MASVKLA-SLIVLFATLGMFLTKNVGA ASCNGV---CSPFEMPPCGTSA-CRCIPVGLFI--GYCRNPSG V--F LKAN DEHPNLC/…

PsaA1b011 (AJ574793) MASVKLA-SLIVLFATLGMFLTKNVGA ASCNGV---CSPFEMPPCGTSA-CRCIPVGLVI--GYCRNPSG V--F LRTN DEHPNLC/…

PsaA1b014 (AJ574795) MASVKLA-SLIVLFATLGMFLTKNVGA ASCNGV---CSPFEMPPCGSSA-CRCIPVGLLI--GYCRNPSG V--F LKGN DEHPNLC/…

PsaA1b015 (AJ574796) MASVKLA-SLIVLFATLGMFLTKNVGA ISCNGV---CSPFDIPPCGSPL-CRCIPAGLVI--GNCRNPYG V--F LRTN DEHPNLC/…

PvuA1b041 (non publiée) CSPFEMPPCGSSD-CRCVPYGLFV--GSCIHPTG LSAA AKMI DEHPNLC/…

PvuA1b001 (AJ574792) MANVRVAPLALFLLATSIMFPMKKTEA VVCSGV---CSPFERPPCGSTRDCRCIPYGLFI--GACTYPSG LSSV AKTI DEHPNIC/…

GmaA1b005 (AJ574791) MAVFLLATSTIMFPTKIEA ADCNGA---CSPFEMPPCRSRD-CRCVPIGLVA--GFCIHPTG-LSSV AKMI DEHPNLC/…

BE661090 (EST Gma) MAVFLLATSTIMFPTKIEA ADCNGA---CSPFEMPPCRSRD-CRCVPIGLVA--GFCIHPTG LSSV AKMI DEHPNLC/…

AJ389043 (EST Mtr) MTYVKLAILAVLHLTIFLIFQTKNVEA ASCPNVGAVCSPFETKPCGNVKDCRCLPWGLFF--GTCINPTG SKYN MKMI EEHPNLC/…

TC18698 (EST Mtr) MANVKLAPFAVFCLAAFLMFPMKKIEG ESCESRG--CIFYINDSCPSG--CVCDPIDPVTWAGVCVSYS SI KKKV EEHPNYC/…

MtrA1b006 (AJ574789) MAYIRFAHLVVFLLAAFSLVPTKKVGA TDCSGA---CSPFEMPPCRSSD-CRCIPIGLVA--GYCTYPSS P-TV MKMV EEHPNLC/…

MtrA1b007 (AJ574790) MAYLRLAHLVVFLHATFSLIFPMMKAA EDCSGI---CSPFEMPPCPSSS-CRCIPVILIG--GNYVDPSS P-TI TKMV EKHANLC/…

Q9FRT9 (Van, AB052880) AADCNGA---CSPFQMPPCGSTD-CLCIPAGLLFV-GYCTYPSG LSSV AKMI DEHPNLC/…

Q9FRT8 (Vra, AB052881) AADCNGA---CSPFEMPPCRSTD-CRCIPIALFG--GFCINPTG LSSV AKMI DEHPNLC/…

Consensus (A1b de graines) a c g cspf ppc crc p l g c p g + dehpnlc

Figure 52 : alignement des séquences obtenues lors de notre travail et de celles de la littérature. La première colonne identifie les peptides (accession de Swissprot, d’EST, ou d’EMBL, nom du gène) ainsi que l’organisme source : Psa : Pisum sativum, Pvu : Phaseolus vulgaris, Gma : Glycine max, Mtr : Medicago truncatula, Van : Vigna angularis, Vra : Vigna radiata. La première ligne indique la maturation de type pois de la préproprotéine A1 (Higgins et al., 1986). Les cystéines conservées sont en

rouges, les autres acides aminés conservés sont en bleu.