• Nenhum resultado encontrado

A. Organisation des gènes AtNIP

RESULTATS

I. A. Organisation des gènes AtNIP

Les ADNc AtNIP1 et AtNIP2 ont été isolés à partir du crible double hybride effectué en utilisant SoRPOT ;2 comme appât. Une première recherche dans les séquences génomiques d’Arabidopsis disponibles à l’époque a mis en évidence un troisième gène très homologue aux deux précédents, appelé AtNIP3. Récemment, une recherche avec des critères de sélection moins stringents (recherche blastn sur http://www.ncbi.nlm.nih.gov/ avec des scores supérieurs à 100) a permis d’identifier un quatrième gène pouvant s’apparenter aux gènes AtNIP, nommé AtNIP4. Les gènes AtNIP1, AtNIP2, AtNIP3, AtNIP4 sont respectivement localisés sur les chromosomes IV, II, V et I. Les données bio-informatiques concernant l’annotation de ces gènes sont présentées dans le tableau 3.

Ces gènes NIP d’A. thaliana sont caractérisés par une grande identité de séquence nucléotidique au niveau de leurs séquences codantes. Les exons des gènes AtNIP1 et AtNIP2 présentent environ 80% d’identité. AtNIP3 est quant à lui plus proche de AtNIP2 que de AtNIP1 (49% d’identité contre 34%). Le gène AtNIP4 est le plus éloigné puisqu’il ne présente pas de similarité significative au niveau des séquences codantes avec les trois autres gènes. La comparaison des séquences du génome et des ADNc NIP1 et NIP2 (comparaison blastn sur http://www.ncbi.nlm.nih.gov/BLAST/) a permis de positionner leurs introns. En fait, les

tel-00011722, version 1 - 3 Mar 2006

quatre gènes de cette famille présentent la même organisation en 5 exons et 4 introns suggérant une origine commune.

AtNIP1 AtNIP2 AtNIP3 AtNIP4

Locus At4g35840 At2g17730 At5g66070 At1g74410

Clone AL031986 t17a5 K2A18 F1M20

Longueur de séquence codante Met-

Stop (pb) (1) 711 723 666 672

Accession EMBL AK118022 AK118593 x AY050433

identité nucléotitidique sur séquences

codantes (%) (2) AtNIP1 100 80 34 Non

significatif

AtNIP2 100 49 Non

significatif

AtNIP3 100 Non

significatif

AtNip4 100X

Tableau 3 : Récapitulation des données génomiques de la famille NIP chez A. thaliana.

(1) La séquence codante est définie par la phase de lecture ouverte la plus grande. (2) Les identités de séquences sont estimées à l’aide du programme « bl2seq » sur http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi, permettant de comparer un couple de séquences d’intérêts (nucléotidiques ici). Elles sont finalement rapportées sur la longueur de la séquence primaire la plus grande.

Seul le début de l’exon 1 se distingue par une plus grande variabilité de séquence – excepté pour le couple NIP1/NIP2 - avec seulement 19% d’identité entre NIP1/NIP3 et 25%

entre N I P 2 /N I P 3 d ’ a p r è s l e p r o g r a m m e « b l 2 s e q » (http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi) (résultats non montrés).

Cette famille de gène AtNIP comporte donc trois membres particulièrement proches, suggérant des fonctions similaires. Le dernier gène identifié AtNIP4 est plus distant.

Etant donné que les ADNc AtNIP1 et AtNIP2 ont été isolés dans une banque d’ADNc de rosettes, nous allons rechercher dans la partie suivante si les gènes NIP sont exprimés dans d’autres parties de la plante ainsi que dans d’autres organismes.

I.B.

Analyse des EST («Expressed Sequence Tag »)

La présence d’EST peut donner des indications sur le degré et le profil d’expression tissulaire d’un gène. Nous allons d’abord rassembler les ESTs disponibles dans les banques de données chez A. thaliana puis nous allons élargir cette recherche aux autres organismes afin d’identifier des homologues.

tel-00011722, version 1 - 3 Mar 2006

I.B.1Analyse des EST chez A. thaliana

Les recherches d’EST (« Expressed Sequence Tag ») sont faites par comparaison de séquence à l’aide de l’ADNc ou gène d’intérêt sur l’ensemble des banques d’EST disponibles (programme blastx, http://www.ncbi.nlm.nih.gov/BLAST/ et http://mips.gsf.de/proj/thal/db).

Au début de mes travaux de thèse, seul NIP2 présentait une EST détectée dans une banque établie à partir d’ARNm totaux de racines d’Arabidopsis (écotype Columbia Col-0). Toutes les EST de cette famille apparues depuis sont rassemblées dans le tableau 4.

Nous constatons que les EST NIP2 sont les plus nombreuses, et semblent présentes dans tous les tissus, et dans tous les stades : de la graine aux feuilles sénescentes. Les transcrits NIP4 sont détectés dans les rosettes ainsi que dans un mélange de tissus de plantules étiolées ou non. Les EST NIP1 sont détectées uniquement dans des extraits issus d'organes reproducteurs et NIP3 semble lui être détecté majoritairement dans les banques obtenues à partir d’extraits racinaires. Le profil d’expression n’est sans doute pas complet car l’accumulation des messagers peut être en dessous du seuil de détection des transcrits lors de la fabrication d’une banque d’EST.

EST (Numéros d’accession) Organes

ou tissus sources

AtNIP1 AtNIP2 AtNIP3 AtNIP4

RACINES AV539195

AV551599

AI996823 AV539195

AV551599 FLEURS ET SILIQUES AU230118

AU238872

AU239462 AU230771

GERMINATION à GRAINE MATURE AV808117.1

FEUILLES SENESCENTES CD534166

ORGANES AERIENS (2 à 6 semaines) AV521888

MELANGE DE TISSUS (1) T21251

AA395606

ROSETTES AV784006

Tableau 4 : EST NIP trouvées dans les banques de données chez A. thaliana.

(1): plantules étiolées 7 jours + racines + rosettes + organes aériens (tiges, fleurs et siliques).

tel-00011722, version 1 - 3 Mar 2006

Alors que le gène AtNIP2 semble être exprimé de façon ubiquitaire, les gènes AtNIP1 et AtNIP3 s’accumulent apparemment davantage dans les fleurs/siliques et racines respectivement.

I.B.2 Recherche d’EST homologues

Un crible large d’EST a mis en évidence des EST homologues aux transcrits d’Arabidopsis chez d’autres organismes. Quelques EST sont regroupées dans le tableau 5. Elles sont présentes exclusivement chez les végétaux, et jusqu’ici, aucune EST n’a été identifiée chez les végétaux inférieurs tels que les mousses et les algues.

Les homologies peuvent s’étendre depuis le milieu de l’exon 1 jusqu’au codon stop.

Certaines EST débutent à un codon codant une méthionine, et présentent une phase ouverte de lecture paraissant complète. Elles sont retrouvées dans tous types d’organes et de stade de développement (des graines au fruit). Les EST les plus représentées suggèrent l’existence de deux gènes chez les plantes monocotylédones, notamment le riz. Cette observation est confirmée aujourd’hui grâce au séquençage complet du génome nucléaire du riz. Les séquences NIP identifiées chez Arabidopsis thaliana, sont présentes exclusivement chez les végétaux supérieurs. Elles correspondent à des gènes exprimés dans différentes espèces et organes, à divers stades de développement.

II. Analyse bioinformatique des séquences primaires des protéines