• Nenhum resultado encontrado

III.4 Validation de la démarche

III.4.1 Choix d'indicateurs de performance

III.4.1.1 Mesures d'erreur de prédiction

Dans la littérature cinq familles de mesures d'erreur sont proposées pour évaluer et/ou comparer les performances de systèmes prédictifs (gure III.6). Nous les présentons briè- vement ci-après. Dénissons d'abord l'erreur de prédiction comme la diérence entre la sortie désiréeydet la valeur préditey. Pour un horizon de prédiction égal àˆ h, nous avons donc :

e(t+h) =yd(t+h)−y(tˆ +h) (III.10)

Mesures d'erreur

dépendantes de l'échelle

indépendantes de l'échelle

1. Formes d'agrégation des erreurs

2. Par agrégation de pourcentages de l'erreur

3. Par agrégation de ratios entre l'erreur et une erreur de référence 4. Par ratio entre une mesure d'erreur et une mesure d'erreur de référence 5. Par agrégation de ratios entre l'erreur et une mesure de référence

Fig. III.6 Typologie des mesures d'erreur

68 Chapitre III 1. Mesures par agrégation des erreurs

Ces mesures visent à agréger l'ensemble des erreurs de prédictions réalisées jusqu'à un instant donné. Elles sont donc dépendantes de l'échelle de la série de données considé- rées : par exemple, une erreur de une unité d'échelle correspond à des performances de prédiction bien diérentes si la série varie entre 0 et 1 ou entre 0 et 100.

Historiquement, l'erreur quadratique moyenne (Mean Square Error MSE), et la racine de l'erreur quadratique moyenne (Root Mean Square Error RMSE) sont les plus utili- sées par les statisticiens ([CA82], [NK99]). Ces mesures sont simples à calculer.

2. Mesures basées sur le pourcentage de l'erreur

Ces mesures sont construites à partir de l'ensemble des pourcentages d'erreur de prédic- tione%(t+h) = 100×(e(t+h)/y(t+h)). Elles sont donc indépendantes de l'échelle de la série de données et peuvent être utilisées an d'étudier les performances d'un même système prédictif sur diérents problèmes de prédiction. Leur calcul peut cependant être problématique si la série oscille autour de zéro (problème de division).

Dans cette famille de mesures, la plus largement répandue est la moyenne des pourcen- tage d'erreur de prédiction (Mean Absolute Percentage Error MAP E) [AC92].

3. Mesures par agrégation de ratios entre l'erreur et une erreur de référence

Ces mesures sont indépendantes de l'échelle de la série de données. Elles sont construites à partir de l'ensemble des ratios entre l'erreur de prédiction du modèle, et l'erreur obte- nue par un modèle de référence :r(t+h) =e(t+h)/e(t+h). Ce modèle de référence est généralement bâti sur le principe du pas aléatoire (Walk Random) ([HK06]). L'utili- sation de ce type de mesures d'erreur est recommandée par [AC92]. Elles permettent de comparer un système prédictif à un modèle de référence et présentent l'avantage d'être interprétables : si la mesure d'erreur est inférieure à 1, alors le système prédictif utilisé est plus performant que la méthode standard.

4. Mesures par ratios entre une mesure d'erreur et une mesure d'erreur de référence Ces mesures sont bâties sur un principe similaire aux mesures précédentes, à ceci près qu'il ne s'agit pas d'agréger des ratios d'erreur, mais de calculer un ratio de mesures d'erreur. A titre d'exmple, la mesure relative RelMSE = MSEa/MSEref permet de comparer un système prédictif a à un autre de référence : si RelMSE < 1 alors le système prédictif aest plus performant que le système de référence.

5. Mesures par agrégation de ratios entre l'erreur et une mesure d'erreur de référence Ces mesures sont construites par une approche hybride entre les mesures de types 3 et 4 : il s'agit d'agréger un ensemble de ratios entre l'erreur de prédiction du système étudié, et une mesure d'erreur agrégée d'un modèle de référence. Une telle mesure a été dénie par [HK06] : le MASE (Mean Absolute Scaled Error). Pour construire cette mesure, [HK06] propose de calculer, à chaque prédiction, le ratio entre l'erreur de prédiction du système étudié et la moyenne des valeurs absolues des erreurs d'un prédicteur naïf (c'est

III.4 Validation de la démarche 69 à dire un prédicteur qui considère que la valeur à prédire est égale à la valeur actuelle) :

q(t) = e(t+h)

t−11

Pt

i=2|yd(i)−yd(i−1)|

MASE=mean(|q(t)|)

Cette mesure est également interprétable : si MASE <1, le système construit est plus performant que la méthode naïve.

III.4.1.2 Choix de métriques de comparaison

L'intérêt des diérentes mesures d'erreurs a largement été discuté dans la littérature ([GH06]). Il en ressort qu'il n'existe pas de mesure universelle, satisfaisant à la fois des critères de pertinence, de facilité de calcul et de limites d'utilisation. Nous proposons de retenir les mesures suivantes, dénies en posantN le nombre total de prédictions réalisées.

Le RMSE, bien que dépendant de l'échelle de la série de données, reste la mesure d'erreur la plus utilisée. Le système prédictif est d'autant meilleur que leRMSE calculé est faible :

RMSE = vu ut 1

N XN t=1

[yd(t+h)−y(tˆ +h)] (III.11)

Le MAP E permet de s'aranchir de l'ordre de grandeur des données mais ne peut être utilisé si la série de données comporte des valeurs proches de 0 :

MAP E = XN t=1

100×[yd(t+h)−y(tˆ +h)]

yd(t+h)

(III.12) Le MASE est applicable pour tout type de série de données (autre que constante) et permet de comparer le système prédictif au modèle de référence naïf. En revanche, les performances de deux modèles prédictifs ne peuvent être ordonnées en regard de leur MASE respectifs :

MASE = 1 N

XN t=1





yd(t+h)−y(tˆ +h)

t−11

Pt i=2

|yd(i)−yd(i−1)|



 (III.13)

Nous proposons également de retenir le coecient de détermination R2 qui permet de considérer l'erreur autrement que par des calculs de moyenne : ce coecient permet de

70 Chapitre III mesurer la variabilité des erreurs de prédiction en regard de la variabilité de la série de données. Plus R2 est proche de 1, plus le système prédictif est pertinent.

R2= 1− PN t=1

(yd(t+h)−y(tˆ +h))2 PN

t=1

(yd(t+h)−y¯d)2

(III.14)

Nous dénissons enn une mesure par agrégation de ratios d'une forme d'erreur indépen- dante de l'échelle : le Geometric Mean of Degraduation of the Error by IntervalGMDEI.

Cette mesure est sans échelle et ne pose pas de problème de division par 0. Elle est in- terprétable. En adoptant les notations de l'équation (éq. III.15), si GMDEI < 1 alors le système prédictifA est meilleur que leB.

DEI(t+h) = Max(yd| e(t+h)

t=1,...,N)−Min(yd|t=1,...,N) = ydy(dmaxt+h)−yyˆd(tmin+h) GMDEI = QN

k=1

DEIDEIBA((k)k)1

N (III.15)