• Nenhum resultado encontrado

Données expérimentales

No documento HAL Id: tel-00676015 (páginas 64-70)

III. Le modèle génétique canin

II.1. Données expérimentales

en bzip2 pour chaque gène. L’archive d’un gène contient jusqu’à cinq fichiers : les fichiers de sortie brute de codeML pour les différents modèles (deux séquences, un calcul par branche, modèles H

1

et H

0

) qui sont au nombre de 1 à 3 selon les requêtes; le fichier d’alignement au format Phylip; enfin, un fichier résultat qui regroupe les mêmes informations que dans le fichier UserDataset.htm.main mais avec un seul gène par fichier et sans formatage HTML.

Le module OMEGAbase inclut l’ensemble des valeurs calculées des ratio dN, dS et d’   pour chacun des ~10.000 gènes orthologues de chacune des 10 espèces utilisées. Un ensemble de requêtes peut-être utilisé pour extraire ces informations de la base de données OMEGA.

II. Différenciation génétique entre races canines

Le second volet de ma thèse a consisté à rechercher les signatures génétiques qui

différencient le génome des races canines actuelles, selon l’hypothèse qu’elles sont issues

d’un processus de sélection artificielle. Cette sélection très récente n’a pas encore

nécessairement impliquée les séquences codant pour les protéines, mais doit avoir influencé

les patrons de polymorphismes génétiques des génomes des différentes races. La sélection

des caractères désirés dans une race conduit à l’enrichissement du ou des variants alléliques

qui confèrent ou contribuent à ce caractère. Ceci se traduit par un changement des fréquences

alléliques des marqueurs proches sur le génome. Les patrons de variations génétiques qui

reflètent ces événements récents de sélection et les gènes sous-jacents et leurs mutations, sont

encore largement inconnus. L’étude du polymorphisme d’une population permet d’analyser le

génome au delà des cadres ouverts de lecture des gènes codant pour des protéines et de

réaliser des analyses qui criblent l’ensemble du génome.

responsables de ces mêmes maladies génétiques chez l’Homme et de réduire la prévalence des maladies chez le chien.

Le consortium LUPA a tout d’abord développé une nouvelle génération de puce SNPs haute résolution capable de cribler le génome canin avec plus de 170.000 SNPs (1 SNP/13 kb). Deux générations de puces SNPs ont été développées ces dernières années, une puce de basse résolution 22K SNP (1 SNP/110 kb) par la technologie Illumina et une puce de moyenne résolution de 48K (1 SNP/ 50 kb) par la technologie Affymetix. Le groupe de notre collaborateur Matthew Webster du consortium LUPA (Université d’Uppsala en Suède) a réalisé la sélection des SNP de cette puce à partir des deux millions SNP identifiés au cours du séquençage du génome canin (Lindblad-Toh, et al., 2005) et grâce à l’apport de nouvelles données de séquences qui ont ciblé les zones de trous (gap) du séquençage initial.

II.1.1. La puce CanineHD 170K

Cette puce “CanineHD” contient 172.115 SNPs validés pour obtenir des génotypes régulièrement espacés en moyenne de 13 kb le long du génome. Les SNPs de la puce proviennent:

-à 65,1% de la comparaison entre la séquence du génome de la race boxer (séquence canine de référence) et la séquence partielle du génome de caniche (Kirkness , et al. , 2003).

-à 25,4% des sites hétérozygotes dans la séquence du génome boxer.

-à 21,7% de la comparaison entre le boxer et des données de séquençages légers (0.5X) de neuf autres races canines.

-à 1,2% de la comparaison entre des séquences du génome du loup et/ou de coyote et du génome de référence.

-à 0,9% de données de reséquençages ciblés d’un individu de quatre races (lévrier irlandais, west highland white terrier, berger belge et shar-pei) et d’un loup pour disposer de SNP dans des intervalles non couverts par les autres méthodes de détection de SNPs.

-61-

Table 2 : Effectifs des races des 3 jeux de données. Les races présentes uniquement dans le jeu “Gentrain” ne sont pas représentées ici.

II.1.2. Test et validation de la puce CanineHD 170K II.1.2.1. Génotypage: les jeux de donnees

Trois jeux de données ont été générés par le génotypage des chiens sur la puce CanineHD:

- Le jeu de données appelé “Gentrain” est constitué de 450 chiens de 26 races et a été conçu et utilisé pour valider la puce d’un point de vue technique, et pour la qualité de la détection et fiabilité de l’allèle détecté.

- Le jeu “LUPA complet” est constitué des chiens non apparentés du jeu ‘Gentrain’ et de chiens de plusieurs autres races. Ces chiens sont issus de cohortes contrôles provenant des

race Gentrain LUPA

complet

LUPA réduit beagle

berger allemand berger australien berger belge tervueren border collie border terrier bouvier bernois boxer

braque de weimar bull terrier anglais bulldog anglais caniche standard cavalier king charles spaniel

chien d’élan suédois chien de traîneau groenlandais chien-loup tchécoslovaque chihuahua cocker anglais cocker spaniel dalmatien doberman english springer spaniel

epagneul breton

11 10 10

12 12 12

0 1 0

16 12 12

25 16 16

0 25 25

12 12 12

0 8 0

28 26 26

0 8 0

13 13 13

12 12 12

0 5 0

12 12 12

12 12 12

0 3 0

0 2 0

0 2 0

15 14 14

0 7 0

0 25 25

0 3 0

12 12 12

race Gentrain LUPA

complet

LUPA réduit eurasier

gordon setter grand epagneul de münster

greyhound lévrier irlandais carlin

retriever de la nouvelle écosse retriever du labrador retriever golden rottweiler saarloos samoyède schipperke schnauzer setter anglais shar pei siberian husky spitz finlandais teckels

terre-neuve terrier jack russell terrier yorkshire tretiever à poil plat effectif total

12 12 12

0 25 25

0 1 0

11 11 11

0 11 11

0 2 0

41 23 23

15 14 14

14 14 14

12 12 12

0 2 0

0 2 0

0 25 25

0 3 0

12 12 12

12 11 11

0 2 0

12 12 12

12 12 12

0 25 25

13 12 12

12 12 12

0 2 0

358 509 456

études génétiques d’associations analysées par les différents groupes constituant le consortium LUPA. Au total ce jeu est constitué des génotypes de 509 chiens de 46 races et de 15 loups. Ce jeu de données a servi à vérifier l’informativité des SNPs choisis et à réaliser des études d’associations de traits spécifiques de races.

- Le jeu “LUPA réduit” est constitué des populations pour lesquelles nous disposons de races représentées par au moins 10 individus. Ce jeu contient 456 chiens et constitue le jeu de données utilisé pour la recherche de régions de différenciation génétiques entre 30 races canines.

II.1.2.2. ‘Call rate’ et arbre phylogénétique

Un des deux critères majeurs d’évaluation de qualité d’une puce SNP est le taux de mesure effectif (call rate), qui est le taux de SNP dont les génotypes sont effectivement déterminés à l’effectif complet de 170K. Le jeu de données “Gentrain” a permis d’établir que le ‘call rate’ moyen est de 99,8% lorsque l’ADN est issu d’une extraction de sang et n’a pas été amplifié à posteriori (Rincon , et al. , 2011). Ainsi cette mesure de contrôle qualité indique un niveau de détection pour chaque individu de la quasi-totalité des génotypes des SNPs de la puce.

L’autre critère majeur de qualité d’une puce est la fiabilité des génotypes obtenus. Cette fiabilité est évaluée par la reproductibilité des génotypes que l’on évalue par deux approches : (1) l’utilisation de l’ADN d’un même individu séparé en deux échantillons pour lesquels on teste la reproductibilité du génotypage de chaque SNP, et (2) l’analyse de la cohérence mendélienne à partir d’individus apparentés. La puce CanineHD présente une reproductibilité et une cohérence mendélienne supérieure à 99,9%. L’informativité des SNPs et surtout la possibilité de comparer les races grâce aux génotypes de ces marqueurs est essentielle pour la recherche des bases génétiques des traits fixés des races et des régions génomiques potentiellement soumises à la sélection artificielle. Cette informativité à été vérifiée en construisant un arbre par l’approche de neighbor-joining basé sur la distance génétique entre les individus du jeu “LUPA complet” (Figure 6). On observe trois éléments importants : les chiens d’une même race sont systématiquement regroupés ensemble ; la structure interne de l’arbre est faible ; les branches internes du loup et de la race boxer sont plus longues que les autres. La structuration des races en branches indiquent que les données de génotypages des 509 chiens par la puce Illumina CanineHD sont bien cohérentes avec la structure connue de la population canine à savoir une véritable collection d’isolats génétiques globalement issus d’une population commune puis séparés en une courte période de temps. La longueur des branches ‘loup’ et ‘boxer’ reflètent respectivement la plus grande distance génétique de la

-63-

population loup par rapport aux races canines et un plus fort nombre de SNPs polymorphes chez le boxer dû à l’utilisation de la séquence d’un boxer comme principale source d’identification des SNPs (1/4 des SNPs proviennent exclusivement du boxer et les autres proviennent d’une comparaison avec le boxer). Le faible niveau de regroupement des races en groupe de races indique que la création des races a aboutit à une entité génétique qui a un impact fort sur le génome de ces races en comparaison des relations historiques entre elles.

La cohérence de cet arbre avec la structure connue de la population canine a permis de valider la précision et la fiabilité de la puce CanineHD et de garantir son utilisation pour les études d’associations et de recherche de différenciation génétiques.

II.1.3. Études d’association avec la puce 170k

Les premières analyses des données du jeux “LUPA complet” ont été une série d’études d’associations génétiques pan-génomique. Cette série d’études consiste à rechercher les causes génétiques de traits qui sont spécifiques de race. Pour cela les races ont été classées en différentes catégories selon le phénotype standard de la race pour des critères morphologiques (taille, poids, courbures des oreilles et de la queue, etc.) ou comportementaux (hardiesse, sociabilité). Pour corriger les biais potentiels liés à la structure des races, la significativité des associations obtenues entre un SNP et le phénotype analysé, est corrigée par une méthode de permutations dans laquelle ce sont les races qui sont soumises à la permutation. Chaque analyse est répétée 1000 fois en changeant aléatoirement le statut cas ou contrôle des races. La p valeur du meilleur SNP est retenue et la p valeur corrigée de chaque SNP correspond à la proportion de valeurs plus significative parmi les 1000 valeurs permutées par rapport à la valeur observée.

Ces études d’associations ont tout d’abord permis de reproduire les résultats d’associations antérieures basées sur d’autres puces SNPs. Par exemple pour l’étude génétique du phénotype poil fourni (‘furnishing’ qui correspond à la présence des moustaches, barbe et sourcils prononcés), le meilleur SNP (p valeur après permutation <

0.001) de l’analyse d’association se trouve à proximité (44 kb) de la mutation identifiée

comme responsable de ce caractère (Cadieu , et al. , 2009). Les données issues de la puce

CanineHD permettent de reproduire l’association entre la courbure de l’oreille et un locus du

chromosome 10 à 11,17 Mb (Jones , et al. , 2008; Boyko , et al. , 2010) ainsi que l’association

de la taille moyenne des races avec la région du gène IGF1 (chromosome 15 à 44 Mb)

précédemment identifié par Sutter (Sutter , et al. , 2007). Notre étude indique une nouvelle

association entre la variation de taille et la région du gène HMGA2 (Chromosome 10 à 11,07

Mb) qui est connu pour être associé au phénotype taille chez l’Homme (Gudbjartsson , et al. , 2008; Lettre , et al. , 2008; Weedon , et al. , 2008). Au delà de la validation d’associations déjà connues, cette étude définit de nouvelles associations pour les phénotypes “courbure de la queue” et “boldness”. Le phénotype de courbure de la queue est un phénotype très variable entre races de chien mais qui est fixé au sein de la plupart des races avec par exemple les races yorkshire terrier et chien-loup de saarloos qui présentent une forte courbure de la queue alors que les races retriever du labrador et dalmatien ont une queue non courbée. La queue, chez le chien, est un organe de communication, ainsi sa forme et son développement peuvent participer aux messages véhiculés entre animaux. Les variations de la morphologie de la queue sont multiples allant de l’anourie de certain schipperke, à la queue longue du barzoï en passant par la queue courte du bull terrier ou moyenne du dalmatien. Parmi les queues longues, on distingue un fouet tombant, horizontal ou relevé, qui se subdivise à nouveau en chandelle, en faucille ou encore enroulée. Les morphologies de la queue sont donc diverses et peuvent avoir un rôle important dans la perception qu’ont les congénères au cours d’une interaction. Les muscles sacro-coccygiens (SC) dorsaux sont des releveurs de la queue et peuvent être considérés comme un des paramètres permettant d’expliquer la courbure de la queue. Par ailleurs, la première vertèbre de la queue appartient à la colonne vertébrale. Par conséquent, une hypothèse est que la courbure de la queue peut être liée à des déficiences de la vertèbre de la queue qui font partie des anomalies squelettiques, ce qui renforce l'intérêt d’étudier ce phénotype. L’analyse de la courbure de la queue est réalisée par la comparaison de races possédant la queue courbée avec les races sans courbure de la queue présentes dans le jeu de données (Vaysse , et al. , 2011). Cette analyse a permis de définir une association entre la courbure de la queue et un locus du chromosome 1 entre 96,26 et 96,96 Mb. Ce locus n’était pas présent dans une précédente étude de ce phénotype (Jones , et al. , 2008) et suggère un locus candidat entre les gènes RCL1 et JAK2.

Une seconde analyse d’association a porté sur le phénotype ‘boldness’ ou ‘hardiesse/

intrépidité’ des races de chiens. Ce trait ‘hardiesse/intrépidité’ aurait été déterminant dans la spéciation du chien, dans la mesure où le tempérament individuel des loups ait pu être un élément important dans le succès de la mise en place d’une relation de domestication entre l’Homme et les futurs chiens. Un ensemble de 18 races appartenant à la catégorie ‘bold’

documenté par une étude précédente de l’association canine suédoise (Swedish Kennel Club), a été comparé à un ensemble de 19 races caractérisées par leur absence du phénotype ‘bold’

par la même étude. L’étude d’association a identifié un locus (p valeur après permutation

-65-

<   0.001) dans une région du chromosome 10 entre 10 et 12 Mb, un locus qui est commun au locus retrouvé associé au phénotype de la courbure de l’oreille et à la taille des races.

II.2. Recherche de régions de différenciation génétique : la

No documento HAL Id: tel-00676015 (páginas 64-70)