• Nenhum resultado encontrado

Partie I. Problématique

2. Comment évaluer la robustesse climatique des modèles pluie-débit ? 25

2.1.2. Proposition d’une procédure de test

À notre connaissance, les procédures standards de split-sample (SST) et differential split- sample test (DSST) sont presque toujours utilisées pour conduire des tests ponctuels, en nombre limité. Pour le DSST, ces tests restent souvent focalisés sur l’étude d’impact d’une ou deux variables climatiques sur la transférabilité des paramètres d’un modèle. Afin de surmon- ter ces limites, nous proposons une généralisation de ces procédures, notre objectif étant de permettre le test de modèles hydrologiques sur un nombre et une variété de situations aussi grands que possible. Nous souhaitons considérer toutes les situations : aussi bien les transferts sous climat équivalents (type SST) que très contrastés (type DSST).

Principe

La procédure que nous proposons est illustrée à la figure 2.2 et se compose des étapes suivantes : 1. Une fenêtre glissante de longueur choisie est utilisée pour découper la chronique d’obser- vations disponible en sous-périodes. Cette fenêtre est déplacée d’une année hydrologique entre deux sous-périodes, les chevauchements entre périodes étant donc autorisés. Sur la figure 2.2, ces sous-périodes sont indiquées en gris foncé, tandis que les zones en gris clair correspondent au reste de la chronique disponible.

2. Le modèle hydrologique que l’on souhaite tester est calé sur chaque sous-période à l’aide d’une fonction objectif préalablement définie. On retient ainsi un jeu de paramètres θ par sous-période. À cette étape, n’importe quelle fonction objectif ou algorithme de calage peuvent être utilisés. Dans nos tests, nous opterons toutefois pour une procédure automatique de sélection des paramètres assurant une répétabilité de l’exercice.

3. Pour chaque sous-période de calage, le jeu de paramètres optimal est transféré afin de réaliser tous les tests possibles en validation sur les autres sous-périodes. Celles qui che- vauchent la sous-période de calage ne sont pas considérées pour maintenir le cadre strict du calage-contrôle entre périodes indépendantes. De plus, une simulation de référence est construite pour chaque sous-période en utilisant le jeu de paramètres optimisé sur celle-ci. Notons que le nombre de tests en contrôle n’est pas constant entre toutes les sous-périodes mais cela n’est pas problématique car tous les résultats seront analysés en même temps.

Chaque sous-période joue alternativement le rôle de période de calage (donneuse de para- mètres) ou de validation (receveuse de paramètres). Nous utiliserons donc par la suite les notations D et R pour distinguer les périodes concernées par le transfert. Par exemple, on notera ˆQR,k[θD] le débit simulé au pas de temps k de la sous-période receveuse R en utili- sant le jeu de paramètres θ, issu du calage sur la sous-période donneuse D. La construction

des sous-périodes de test se fait indépendamment de considérations sur leurs caractéristiques climatiques, celles-ci n’intervenant que plus tard lors des analyses des performances en vali- dation. Les deux étapes qui composent cette démarche de tests (phase de construction des périodes d’intérêt et phase de test du modèle) sont donc réalisées dans un sens opposé à la pratique habituelle puisque nous procédons ainsi : (a) tout d’abord, de nombreux tests en calage-contrôle sont effectués sans distinction sur les conditions de transfert des paramètres, (b) ensuite, les conditions de transferts sont étudiées et mises en face des performances du mo- dèle en validation pour déterminer a posteriori si un lien peut être établi entre les variations de qualité des simulations et un facteur climatique donné. À notre connaissance, une telle généralisation du split-sample test, où aucun choix préalable n’est fait sur les sous-périodes testées, n’a pas encore été utilisée sur un grand nombre de cas.

Nous avons intitulé cette approche le generalized split-sample test (GSST), par analogie aux dénominations de Klemeš (1986).

AA5AB5237BBAB12314567829A

11

12

13

14

15

16

17

18

19

11A

111

112

113

114 1

1 1!

1"

1#

1$

1%

1&

1' 1 1 1 1!

1"

11

12

13

14

15

16

17

18

19

11A

111

112

113

114

1 1

1

12

13

14

15

16

17

18

19

11A

111

112

113

114 1%

11

12

13

14

15

16

17

18

19

11A

111

112

113

114 1"

26789AB4CAC8DCEF278B4C A534ABDA8B34

AC7D36789A B4A224954

AC7D36789A B4A224954

AC7D36789A B4A224954

89634ABDA8B34AFA69C46AB4CAF64C 532CACDA34CAC8DCEF278B4CA79B2F49B964C

AA5AB5237BB7AB12314567829A AA5AB5237BBAB12314567829A

Figure 2.2.: Méthodologie de test de calage-contrôle généralisée GSST (dans cet exemple, une chronique totale de 18 ans est découpée en sous périodes de 5 ans)

Nombre de tests réalisables

Le nombre de tests de transfert (Ntests) réalisés pour chaque bassin est fonction de la longueur de la série d’observations (Lchro) et de la longueur choisie pour les périodes de calage et de contrôle (Lper). En vérifiant l’inégalité (assez logique) Lchro ≥ 2Lper, alors le nombre Ntests

peut être calculé par la formulation :

Ntests= (Lchro−2Lper+ 1)·(Lchro−2Lper+ 2) (2.1)

Une chronique longue de 18 années découpées en sous-périodes de 5 ans (tel qu’illustré sur la figure 2.2) permettra la réalisation de 90split-sample tests. Dans les tests présentés plus loin, nous disposons plutôt de chroniques de 30 ans que nous découpons en sous-périodes de 10 ans, ce qui permet 132 split-sample tests. Des périodes de mise en route sont couramment utilisées pour initialiser les états du modèle, les critères d’erreurs (en calage ou validation) n’étant pas calculés sur celles-ci. Dans le cadre de notre méthodologie, nous ne tenons pas compte de ces périodes d’initialisation dans la constitution des couples de tests, c.-à-d. deux périodes sont jugées indépendantes même si l’une d’entre elles chevauche la période de mise en route de l’autre. Cette longueur d’initialisation doit simplement être soustraite pour le calcul de Lchro

(ex.si la série d’observations comporte 30 années et que le modèle est initialisé sur une année, alors on considèrera Lchro = 29 pour le calcul de Ntests).

Avantages

La procédure GSST devrait permettre de surmonter les limites abordées précédemment : 1. Elle permet un nombre important de cas d’analyse, qui couvrent de façon continue

l’espace des écarts de climat existant dans la série d’observations. Ce grand nombre de tests devrait améliorer la robustesse des interprétations.

2. L’utilisation de périodes continues plutôt que discontinues comme dans les approches de bootstrap permet de limiter les effets des années intermédiaires dans l’analyse des résultats (cf.discussion section 2.1.1). Les caractéristiques de chaque période (ex. pluie, température) pourront être strictement estimées sur les mêmes pas de temps que les critères d’erreur.

3. Elle nous semble moins subjective puisqu’aucun choix de sous-période ou de caractéris- tique de climat étudié n’est fait a priori (c.-à-d. avant la réalisation des tests).

4. L’influence de n’importe quelle caractéristique climatique sur la robustesse du modèle peut être étudiée. En effet, toutes les configurations possibles (c.-à-d. tous les couples de périodes) sont testées et aboutissent à une liste unique de performances du modèle en validation. Lors de l’analyse de la robustesse des modèles face à un changement de climat, passer d’une variable climatique à une autre (ex. pluie → température) revient simplement à exprimer cette même liste de performances en changeant la référence choisie pour la visualisation. Notons que cette comparaison n’était pas possible dans l’usage courant du DSST puisque le panier de périodes de contrôle n’était pas constant.

Inconvénients

La méthodologie GSST est critiquable sur le point suivant : si le nombre de tests est forte- ment augmenté comparativement aux usages préalables du DSST, cela s’accompagne d’une forte redondance de l’information dans les résultats des tests puisque les recouvrements sont autorisés entre les périodes de validation. La procédureGSST est toutefois conforme au cadre strict du split-sample test original, puisque les sous-périodes composant chaque couple de calage-contrôle sont toujours indépendantes l’une de l’autre. Lors de l’élaboration de cette méthodologie, notre objectif fut de maximiser le nombre de tests en ne se privant d’aucun couple de sous-périodes indépendantes. En effet, ne pas autoriser les recouvrements risquerait dans certains cas d’écarter les couples de sous-périodes les plus contrastés, ou alors l’opération devrait être répétée et conduirait à faire de multiples analyses par bassin au lieu d’une seule dans la configuration proposée ici. Le choix a donc été fait de conserver toutes les périodes de calage disponibles même si elles se chevauchent entre elles1. En conséquence, nous devrons garder à l’esprit que les critères de corrélations pouvant être calculés dans nos travaux, le seront entre des points n’étant pas rigoureusement indépendants. Cela ne modifiera toutefois en rien la validité des conclusions, ce qui nous intéresse étant une appréciation générale sur l’existence de liens entre évolutions des performances et changements subis lors de transfert des paramètres.