• Nenhum resultado encontrado

Etude des indices de similarité moléculaire Potentiel de charge électrostatique

Etude des indices de similarité moléculaire

Pour les composés à prédire (Tableau 11), les résultats sont : 6 composés actifs sont bien prédits et 1 le I64 est mal prédit. Un seul composé inactif est mal prédit, le I63.

Composés Prédiction Expérimental

I53 Actif Actif

I54 Actif Actif

I55 Actif Actif

I56 Actif Actif

I57 Actif Actif

I58 Inactif Inactif I59 Inactif Inactif I60 Inactif Inactif I61 Inactif Inactif I62 Inactif Inactif I63 Actif Inactif I64 Inactif Actif I65 Inactif Inactif

I66 Actif Actif

Tableau 11.

L’étude des prédictions donne des résultats en accord avec la validité statistique du modèle. En effet, la quasi-totalité des 14 composés à prédire le sont

La régression multiple a donné les résultats suivants : un coefficient de régression r2 est de 0.46 avec sept variables. Ce coefficient est très faible et le nombre de variables est élevé. Ces données ne permettent pas d’exploiter cette régression multiple.

L’analyse Partial Least Square donne les résultats statistiques suivants (Graphe 5). Avec huit vecteurs, le coefficient de régression est de 0.61% avec un pouvoir prédictif de 0.65%. Les résultats de prédiction sont regroupés dans le tableau 12.

Composés Prédiction Expérimental Différence

I53 8 8.5 0.5

I54 7.7 9.7 2

I55 9.4 7.6 1.8

I56 5.5 7.8 2.3

I57 7.9 7.85 0.05

I58 8.4 5 3.4

I59 6.1 5 1.1

I60 8.2 6.5 1.7

I61 8.6 6.6 2

I62 7.7 5.7 2

I63 7.5 5.9 1.6

I64 6.2 8.9 2.7

I65 6.2 6.2 0

I66 9.4 8.9 0.5

Tableau 12.

Sur les 14 composés, 4 ligands sont prédits avec un écart de pIC50 inférieur ou

un écart de prédiction compris entre 2.3 et 3.4. Ce résultat montre que l’on peut avoir des prédictions plutôt correctes alors que la validité statistique du modèle est faible (r2 = 0.61%).

Graphe 5.

Potentiel de lipophilie

L’analyse en composantes principales donne un pourcentage d’information sur les trois premiers axes de 93%. L’analyse des graphes 2D n’apporte aucune

Variables Total Inactifs bien classés Actifs bien classés

Carbo I37 73 % 87 % 59 %

Carbo I41 75 % 89 % 61 %

Carbo I14 77 % 80 % 73 %

Carbo I6 79 % 87 % 68 %

Carbo I43 83 % 87 % 77 %

Carbo I32 87 % 93 % 77 %

Carbo I2 89 % 93 % 82 %

Carbo I47 90 % 93 % 86 %

Carbo I48 90 % 93 % 86 %

Carbo I27 90 % 93 % 86 %

Carbo I16 90 % 90 % 91 %

Carbo I46 94 % 97 % 91 %

Carbo I50 98 % 97 % 100 %

r(CV)2 50 % 67 % 27 %

Tableau 13.

Le pourcentage de discrimination de 98 % est très bon mais le nombre de variables utilisées pour atteindre ce pourcentage est assez élevé. Dans ce cas précis, on pourrait sélectionner seulement huit variables ce qui donnerait un pourcentage de discrimination correct de 90 % avec cette fois-ci un r(CV)2 de 67 % (70% pour les composés inactifs et 64 % pour les actifs). Nous comparerons les résultats de ces deux analyses. Pour l’analyse utilisant 13 variables, tous les ligands inactifs sont classés inactifs sauf le I29 qui a une activité expérimentale de 7.4. Tous les composés actifs sont bien classés. Etant donné l’activité de 7.4 du composé mal classé et la valeur discriminante choisie arbitrairement de 7.5 nous pouvons considérer que cette analyse donne un résultat optimum. En ce qui concerne l’analyse utilisant 8 variables, cinq composés sont mal classés, les I19, I29, I34, I37 et I49. Le nombre de composés mal prédits est donc plus élevé tout en tenant compte que trois des produits (I29-34-37) ont des valeurs très proche de 7.5.

Les résultats des prédictions sont présentés dans le tableau 14.

Analyse avec 13 variables Analyse avec 8 variables Composés Prédiction Expérimental Prédiction Expérimental

I53 Inactif Actif Inactif Actif

I54 Inactif Actif Inactif Actif

I55 Actif Actif Actif Actif

I56 Actif Actif Actif Actif

I57 Actif Actif Actif Actif

I58 Actif Inactif Actif Inactif

I59 Inactif Inactif Inactif Inactif

I60 Inactif Inactif Inactif Inactif

I61 Actif Inactif Inactif Inactif

I62 Actif Inactif Inactif Inactif

I63 Inactif Inactif Inactif Inactif

I64 Actif Actif Actif Actif

I65 Inactif Inactif Inactif Inactif

I66 Inactif Actif Inactif Actif

Tableau 14.

La première remarque qui ressort de cette analyse des prédictions est que l’analyse avec 8 variables donne de meilleures prédictions. En effet les composés I61 et I62 sont classés correctement. Ceci montre qu’il ne suffit pas a priori d’avoir une très bonne discrimination pour avoir un bon pouvoir prédictif. Dans ce cas de figure, l’analyse avec 8 variables offre un pouvoir de prédiction supérieur à l’analyse avec

L’analyse Partial Least Square comme la régression multiple donne des résultats statistiques faibles. Nous avons retenu une équation composée de six vecteurs dont le coefficient de linéarité est de 0.66% avec un coefficient de prédiction de 0.41% (Graphe 6).

Graphe 6.

Les prédictions sont données dans le tableau 15.

Composés Prédiction Expérimental Différence

I53 7.5 8.5 1

I54 7.5 9.7 2.2

I55 7.5 7.6 0.1

I56 8 7.8 0.2

I57 9.5 7.85 1.65

I58 8.3 5 3.3

I59 6.5 5 1.5

I60 6.3 6.5 0.2

I61 5.6 6.6 1

I62 7.3 5.7 1.6

I63 6.4 5.9 0.5

I64 12.2 8.9 3.3

I65 6.9 6.2 0.7

I66 6.8 8.9 2.1

Tableau 15.

Sur les 14 composés, 7 ligands sont prédits avec un écart de pIC50 inférieur ou égal à 1, 3 sont prédits avec un écart de pIC50 inférieur ou égal à 2 et 4 composés ont un écart de prédiction compris entre 2.1 et 3.3. Ce résultat montre que l’on peut avoir des prédictions intéressantes alors que la validité statistique du modèle, entre autres

Les indices de forme

L’analyse en composantes principales donne un pourcentage d’information sur les trois premiers axes de 70%. L’analyse des graphes 2D n’apporte aucune information concrète.

L’analyse discriminante sépare les composés du crible avec une probabilité de 96% en combinant 6 variables (Tableau 16).

Variables Total Inactifs bien classés Actifs bien classés

Carbo I45 73 % 73 % 73 %

Carbo I18 79 % 83 % 75 %

Carbo I32 83 % 87 % 79 %

Carbo I13 87 % 90 % 84 %

Carbo I1 94 % 93 % 95 %

Carbo I12 96 % 97 % 95 %

r(CV)2 65 % 70 % 60 %

Tableau 16.

Le pourcentage de discrimination de 96 % est très bon et le nombre de variables utilisées pour atteindre ce pourcentage est seulement de six. Pour cette analyse, tous les ligands inactifs sont classés inactifs sauf le I28 qui a une activité expérimentale de 7.4. Tous les composés actifs sont bien classés sauf le I49. Etant donné l’activité de 7.4 du composé inactif mal classé et la valeur discriminante choisie arbitrairement de 7.5, nous pouvons considérer que cette analyse donne un résultat optimal.

Pour les composés à prédire les résultats sont présentés dans le tableau 17.

Composés Prédiction Expérimental

I53 Actif Actif

I54 Actif Actif

I55 Inactif Actif

I56 Actif Actif

I57 Actif Actif

I58 Inactif Inactif I59 Actif Inactif I60 Actif Inactif I61 Actif Inactif I62 Actif Inactif I63 Actif Inactif

I64 Actif Actif

I65 Inactif Inactif

I66 Actif Actif

Tableau 17.

La première remarque qui ressort de cette analyse des prédictions est que la discrimination de ces composés par leur aspect stérique semble peu précise. En effet les composés I59 à I63 sont classés parmi les ligands actifs. Ceci est sûrement dû à leur forme se rapprochant de certains composés actifs. Ces descripteurs ne tiennent

La régression multiple donne des résultats non exploitables. Le coefficient de régression r2 est de 0.31 avec deux variables.

L’analyse statistique Partial Least Square donne des résultats statistiques suivants. Nous avons retenu une équation composée de 8 vecteurs dont le coefficient de linéarité est de 0.76% avec un coefficient de prédiction de 0.34%

(Graphe 7).

Les prédictions sont données dans le tableau 18.

Composés Prédiction Expérimental Différence

I53 8.1 8.5 0.4

I54 7.8 9.7 1.9

I55 7.6 7.6 0

I56 9.1 7.8 1.3

I57 8.6 7.85 0.75

I58 6.5 5 1.5

I59 7 5 2

I60 8.5 6.5 2

I61 8.5 6.6 1.9

I62 9.1 5.7 3.6

I63 7.4 5.9 1.5

I64 8.7 8.9 0.2

I65 4.9 6.2 1.3

I66 8.3 8.9 0.6

Tableau 18.

Sur les 14 composés, 5 ligands sont prédits avec un écart de pIC50 inférieur ou

est prédit avec un écart de prédiction de 3.6. Ce résultat montre que 13 composés sur 14 ont un écart de prédiction inférieur à deux unités de pIC50 avec seulement deux composés le I61 et le I60 qui passent du « cluster » inactif à actif.

Graphe 7.

Le champ électrostatique

Les résultats de l’analyse en composantes principales sont les suivants :

- Les trois premiers axes factoriels contiennent 45% de l’information des descripteurs.

- L’analyse des combinaisons axiales 2D et 3D n’apporte aucun

Variables Total Inactifs bien classés Actifs bien classés

Carbo I35 73 % 73 % 73 %

Carbo I1 80 % 83 % 77 %

Carbo I2 83 % 87 % 79 %

Carbo I43 85 % 90 % 80 %

r(CV)2 26 % 30 % 20 %

Tableau 19.

Le pourcentage de discrimination de 85 % est bon et le nombre de variables utilisées pour atteindre ce pourcentage est seulement de 4 variables. Toutefois le pouvoir prédictif est très faible (26%).

L’analyse de régression multiple et l’analyse Partial Least Square donnent des résultats de linéarité faibles (r2 = 0.25 et 0.42) avec des pouvoirs descriptifs faibles (r(CV)2 = 0.17 et 0.32) et des prédictions très éloignées de la valeur expérimentale.

Le champ lipophilique

Les résultats de l’analyse en composantes principales sont les suivants :

- Les trois premiers axes factoriels contiennent 25% de l’information des descripteurs. L’analyse des combinaisons axiales 2D et 3D n’apporte aucun renseignement sur la répartition des composés suivant ces repères 2D et 3D.

L’analyse discriminante prévoit un pourcentage de discrimination de 75%

avec 15 variables. Ce pouvoir discriminant est très faible et ne permet pas une étude approfondie de la prédiction.

L’analyse de régression multiple et l’analyse Partial Least Square donnent des