RESULTATS
I. A. Organisation des gènes AtNIP
Les ADNc AtNIP1 et AtNIP2 ont été isolés à partir du crible double hybride effectué en utilisant SoRPOT ;2 comme appât. Une première recherche dans les séquences génomiques d’Arabidopsis disponibles à l’époque a mis en évidence un troisième gène très homologue aux deux précédents, appelé AtNIP3. Récemment, une recherche avec des critères de sélection moins stringents (recherche blastn sur http://www.ncbi.nlm.nih.gov/ avec des scores supérieurs à 100) a permis d’identifier un quatrième gène pouvant s’apparenter aux gènes AtNIP, nommé AtNIP4. Les gènes AtNIP1, AtNIP2, AtNIP3, AtNIP4 sont respectivement localisés sur les chromosomes IV, II, V et I. Les données bio-informatiques concernant l’annotation de ces gènes sont présentées dans le tableau 3.
Ces gènes NIP d’A. thaliana sont caractérisés par une grande identité de séquence nucléotidique au niveau de leurs séquences codantes. Les exons des gènes AtNIP1 et AtNIP2 présentent environ 80% d’identité. AtNIP3 est quant à lui plus proche de AtNIP2 que de AtNIP1 (49% d’identité contre 34%). Le gène AtNIP4 est le plus éloigné puisqu’il ne présente pas de similarité significative au niveau des séquences codantes avec les trois autres gènes. La comparaison des séquences du génome et des ADNc NIP1 et NIP2 (comparaison blastn sur http://www.ncbi.nlm.nih.gov/BLAST/) a permis de positionner leurs introns. En fait, les
tel-00011722, version 1 - 3 Mar 2006
quatre gènes de cette famille présentent la même organisation en 5 exons et 4 introns suggérant une origine commune.
AtNIP1 AtNIP2 AtNIP3 AtNIP4
Locus At4g35840 At2g17730 At5g66070 At1g74410
Clone AL031986 t17a5 K2A18 F1M20
Longueur de séquence codante Met-
Stop (pb) (1) 711 723 666 672
Accession EMBL AK118022 AK118593 x AY050433
identité nucléotitidique sur séquences
codantes (%) (2) AtNIP1 100 80 34 Non
significatif
AtNIP2 100 49 Non
significatif
AtNIP3 100 Non
significatif
AtNip4 100X
Tableau 3 : Récapitulation des données génomiques de la famille NIP chez A. thaliana.
(1) La séquence codante est définie par la phase de lecture ouverte la plus grande. (2) Les identités de séquences sont estimées à l’aide du programme « bl2seq » sur http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi, permettant de comparer un couple de séquences d’intérêts (nucléotidiques ici). Elles sont finalement rapportées sur la longueur de la séquence primaire la plus grande.
Seul le début de l’exon 1 se distingue par une plus grande variabilité de séquence – excepté pour le couple NIP1/NIP2 - avec seulement 19% d’identité entre NIP1/NIP3 et 25%
entre N I P 2 /N I P 3 d ’ a p r è s l e p r o g r a m m e « b l 2 s e q » (http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi) (résultats non montrés).
Cette famille de gène AtNIP comporte donc trois membres particulièrement proches, suggérant des fonctions similaires. Le dernier gène identifié AtNIP4 est plus distant.
Etant donné que les ADNc AtNIP1 et AtNIP2 ont été isolés dans une banque d’ADNc de rosettes, nous allons rechercher dans la partie suivante si les gènes NIP sont exprimés dans d’autres parties de la plante ainsi que dans d’autres organismes.
I.B.
Analyse des EST («Expressed Sequence Tag »)
La présence d’EST peut donner des indications sur le degré et le profil d’expression tissulaire d’un gène. Nous allons d’abord rassembler les ESTs disponibles dans les banques de données chez A. thaliana puis nous allons élargir cette recherche aux autres organismes afin d’identifier des homologues.
tel-00011722, version 1 - 3 Mar 2006
I.B.1Analyse des EST chez A. thaliana
Les recherches d’EST (« Expressed Sequence Tag ») sont faites par comparaison de séquence à l’aide de l’ADNc ou gène d’intérêt sur l’ensemble des banques d’EST disponibles (programme blastx, http://www.ncbi.nlm.nih.gov/BLAST/ et http://mips.gsf.de/proj/thal/db).
Au début de mes travaux de thèse, seul NIP2 présentait une EST détectée dans une banque établie à partir d’ARNm totaux de racines d’Arabidopsis (écotype Columbia Col-0). Toutes les EST de cette famille apparues depuis sont rassemblées dans le tableau 4.
Nous constatons que les EST NIP2 sont les plus nombreuses, et semblent présentes dans tous les tissus, et dans tous les stades : de la graine aux feuilles sénescentes. Les transcrits NIP4 sont détectés dans les rosettes ainsi que dans un mélange de tissus de plantules étiolées ou non. Les EST NIP1 sont détectées uniquement dans des extraits issus d'organes reproducteurs et NIP3 semble lui être détecté majoritairement dans les banques obtenues à partir d’extraits racinaires. Le profil d’expression n’est sans doute pas complet car l’accumulation des messagers peut être en dessous du seuil de détection des transcrits lors de la fabrication d’une banque d’EST.
EST (Numéros d’accession) Organes
ou tissus sources
AtNIP1 AtNIP2 AtNIP3 AtNIP4
RACINES AV539195
AV551599
AI996823 AV539195
AV551599 FLEURS ET SILIQUES AU230118
AU238872
AU239462 AU230771
GERMINATION à GRAINE MATURE AV808117.1
FEUILLES SENESCENTES CD534166
ORGANES AERIENS (2 à 6 semaines) AV521888
MELANGE DE TISSUS (1) T21251
AA395606
ROSETTES AV784006
Tableau 4 : EST NIP trouvées dans les banques de données chez A. thaliana.
(1): plantules étiolées 7 jours + racines + rosettes + organes aériens (tiges, fleurs et siliques).
tel-00011722, version 1 - 3 Mar 2006
Alors que le gène AtNIP2 semble être exprimé de façon ubiquitaire, les gènes AtNIP1 et AtNIP3 s’accumulent apparemment davantage dans les fleurs/siliques et racines respectivement.
I.B.2 Recherche d’EST homologues
Un crible large d’EST a mis en évidence des EST homologues aux transcrits d’Arabidopsis chez d’autres organismes. Quelques EST sont regroupées dans le tableau 5. Elles sont présentes exclusivement chez les végétaux, et jusqu’ici, aucune EST n’a été identifiée chez les végétaux inférieurs tels que les mousses et les algues.
Les homologies peuvent s’étendre depuis le milieu de l’exon 1 jusqu’au codon stop.
Certaines EST débutent à un codon codant une méthionine, et présentent une phase ouverte de lecture paraissant complète. Elles sont retrouvées dans tous types d’organes et de stade de développement (des graines au fruit). Les EST les plus représentées suggèrent l’existence de deux gènes chez les plantes monocotylédones, notamment le riz. Cette observation est confirmée aujourd’hui grâce au séquençage complet du génome nucléaire du riz. Les séquences NIP identifiées chez Arabidopsis thaliana, sont présentes exclusivement chez les végétaux supérieurs. Elles correspondent à des gènes exprimés dans différentes espèces et organes, à divers stades de développement.