Application aux prévisions hydrologiques des grands bassins fluviaux de la Saône et de la Seine. Cette thèse porte sur l'amélioration d'une méthode probabiliste de prévision des précipitations, adaptée par analogie, appliquée aux grands bassins fluviaux de la Saône et de la Seine.
Principe de l'analogie en météorologie
Une impression de « déjà vu »
Par exemple, le principe peut être utilisé pour étudier les effets du changement climatique prédits par les modèles sur certaines zones urbaines (Kopf et al., 2008). Nous connaissons désormais le principe de l’analogie, mais nous ne savons pas comment l’appliquer pratiquement à la prévision des précipitations.
Procédure d'identification d'une analogue
Une situation objective est une situation sur laquelle on cherche à faire une prédiction, tandis qu'une situation candidate est une situation historique observée pour laquelle on cherche une analogie avec la situation cible. Pour la prévision des précipitations, il est nécessaire de disposer de deux archives : – une archive des vagues observées pendant la période candidate.
Historique
De l'approche statistique vers l'adaptation statistique
Il faut donc trouver un compromis entre un nombre suffisant de situations analogues pour exprimer l'incertitude des variables non prises en compte par l'analogie, et un nombre pas trop élevé pour garder des situations analogues suffisamment similaires. Nous appellerons ainsi période candidate la période pendant laquelle des situations analogues seront finalement recherchées.
Méthodes développées en France
Dans ce contexte, et plus récemment, la méthode d'analogie développée par Bontron (2004) pour les pas de temps journaliers a été adaptée par Marty (2010) aux pas de temps infra-journaliers sur les bassins de crue rapide de la région Cévennes-Vivarais. (Marty et al. La méthode). développé par Bontron (2004) sera décrit en détail plus loin dans ce chapitre (section 1.3).
Applications externes à la France
Comme nous l'avons indiqué précédemment (section 1.2.1), le principe d'analogie s'applique également aux prévisions saisonnières et à l'étude de l'impact du changement climatique. Cette approche s'est avérée efficace pour corriger les prévisions de précipitations (Hamill et Whitaker, 2006), ainsi que pour prédire les températures et les géopotentiels (Hamill et Whitaker, 2007).
Description de la méthode de référence
Sélection de situations analogues à la situation du jour C
Δi, ji, candidat) est le gradient dans la direction zonale du champ cible (respectivement candidat) de la variable V. Il permet ainsi de maintenir des situations où la quantité d'humidité présente dans la troposphère correspond à la quantité de l'humidité dans la troposphère. le but situationnel.
Emission de la prévision de pluie probabiliste
Enfin, pour avoir une idée de la fiabilité de la prévision, il est également possible de visualiser la répartition des précipitations observées lors de situations les plus similaires à la situation cible (Figure 1.7). Sinon (Figure 1.7 b), si les cumuls associés aux dix meilleurs analogues s'écartent significativement de la distribution de l'ensemble des situations, on peut supposer que la fiabilité est moins bonne.
Principales limitations
- Longueur des archives
- Homogénéité des archives
- Robustesse et fiabilité de la prévision des variables d'analogie
- Résolution
En effet, il semble intéressant de conserver des situations plus similaires à mesure que l'échéance augmente afin que les incertitudes soient représentatives de la dégradation de la fiabilité de la prédiction (Thévenot, 2004 ; Hamill et al., 2006). Cependant, du point de vue des prévisions limitées à quelques jours d'avance, il est possible d'utiliser d'autres variables explicatives des précipitations que les géopotentiels ou les variables d'humidité pour autant que la fiabilité des prévisions soit satisfaisante.
Conclusion et objectif de la thèse
Nous poursuivrons par la description des archives nécessaires à l'application d'une méthode de prévision des pluies par analogie, dont les caractéristiques (longueur, homogénéité, etc.) devraient convenir le mieux à ce type d'approche. En complément de ces archives météorologiques, des mesures historiques de flux aux stations situées aux sorties des bassins tests sont indispensables pour établir des prévisions de flux à partir d'un modèle hydrologique alimenté par des scénarios pluviométriques générés par une méthode analogique (pour l'étalonnage du modèle et la vérification des prévisions).
Zones d'étude
Le bassin versant de la Saône à Lyon
Cela n’empêche pas le débit fluvial d’être important, comme nous le verrons plus loin au chapitre 4 (section 4.2.2). Le bassin du Doubs est le plus montagneux, tandis que les bassins de la Petite Saône et de la Moyenne Saône sont vallonnés, avec une élévation maximale inférieure à celle atteinte dans le bassin du Doubs.
Le bassin versant de la Seine à Paris
Contrairement au bassin de la Saône, le bassin de la Seine dispose de quatre lacs réservoirs (figure 2.2) dont les principaux objectifs sont de réduire les risques d'inondation (réduction des débits de crue en aval des aménagements) et de soutenir les écoulements faibles en été et en automne1. 1 Toutes les informations sur les lacs des réservoirs de la Seine sont disponibles sur le site : http://www.iibrbs.fr.
Données disponibles
Archives de réanalyses météorologiques
Les données dont nous disposons pour notre travail proviennent du CD-ROM mais aussi du serveur FTP. Comme celles des archives américaines, les données des archives ERA-40 rassemblent analyses et prédictions (Kallberg et al., 2004).
Archives pluviométriques
Cette archive contient des nappes d'eau avec un intervalle de temps de 6 heures sur les 46 sous-bassins du bassin du Rhône. Pour reconstituer les niveaux d'eau à un intervalle de temps de 6 heures, Météo-France a utilisé les données des trois réseaux.
Archive hydrométrique
Nous utiliserons donc ces nappes d'eau transformées lorsque nous développerons la méthode d'analogie dans la deuxième partie de cette thèse. Cette dernière sera utilisée principalement dans la seconde partie du développement de la méthode de sélection analogue.
Evaluation globale
Choix du score CRPS
Pour une prévision probabiliste, elle présente l'avantage de prendre en compte la finesse (dispersion) et la précision (délai entre prévision et observation) de la prévision (Hersbach, 2000) (équation 3.2). Une prévision probabiliste peut être a) tout à fait précise (centrée sur la valeur finale observée), mais peu précise (la plage des précipitations observables est large) ; b) correct (peu d'incertitude sur la valeur prédite), mais peut être inexact (valeur médiane éloignée de la valeur finale observée).
Compétence CRPSS du CRPS
D’autres prédicteurs standards, tels que la robustesse ou le caractère aléatoire, peuvent également être utilisés. L'échantillonnage aléatoire peut également être considéré comme une prévision de référence (Wetterhall et al., 2005 ; Diomède et al., 2008).
Gain G de performance
Pour respecter l'effet de saisonnalité pris en compte dans la méthode de référence A0, nous avons choisi de construire la prévision climatologique, pour un jour cible, en considérant uniquement les cumuls pluviométriques observés dans une fenêtre temporelle de plus ou moins deux mois autour du jour prévu. . Le score CRPSS sera estimé pour tous les sous-bassins en mesurant le score CRPSS obtenu pour chaque sous-bassin, selon l'équation 3.6.
Evaluation en fonction d'un seuil
- Probabilité de détection (POD)
- Taux de fausses détections (POFD)
- Taux de fausses alertes (FAR)
- Score d'Hansen-Kuipers (TSS)
- Diagramme ROC et score AROC
En météorologie, le taux de fausses alarmes s'exprime d'un point de vue observation, c'est-à-dire qu'il évalue le rapport entre le nombre de fausses alarmes (B) et le nombre total de fois où le seuil S n'a pas été effectivement dépassé (B+D). En médecine, en revanche, le taux de fausses alarmes s'exprime d'un point de vue prédictif, c'est-à-dire qu'il évalue le rapport entre le nombre de fausses alarmes (B) et le nombre total d'avertissements (A+B).
Identification du biais de la prévision
Diagramme de Talagrand
La partie grise représente l'aire sous la courbe ROC. . Les observations ont souvent lieu en dehors de scénarios extrêmes.
Diagramme de fiabilité
Dans l'exemple de la figure 3.5, la prévision sous-estime les précipitations observées pour les probabilités faibles (inférieures à 0,25) tout en les surestimant pour les probabilités moyennes à élevées (supérieures à 0,5). Ce diagramme est donc conditionné par les prédictions et reflète ainsi le vrai sens des prédictions.
Contextes d'élaboration d'une prévision adaptée par analogie
Deuxièmement, notre attention se portera sur les archives météorologiques, en se concentrant plus spécifiquement sur les valeurs brutes des variables analogiques utilisées dans la méthode de référence. La mise en évidence des différences nous amènera à étudier la sensibilité de la méthode au choix de l'archive de réanalyse dans la dernière section.
Comparaison et critique des archives pluviométriques
Objectif et méthodologie
Cependant, les réanalyses des précipitations SAFRAN ne sont pas réalisées directement à partir des seules données de précipitations observées (voir section 2.2.2.2). Or, celles des archives MF/CNR ne proviennent que de données observées dans un réseau dense.
Résultats
Au pas de temps de 6 heures, les valeurs R² sont proches de 0,5, indiquant une relation faible entre les. Au pas de temps de 6 heures, le coefficient R² n'est que de 0,15 à 0,2 pour l'échantillon d'événements rares.
Analyse des régimes pluviométriques et hydrologiques
Régimes pluviométriques
Pour chaque sous-bassin de la Saône et de la Seine, nous avons évalué la fréquence des jours sans pluie (F0), les cumuls de précipitations avec une période de retour de 5 ans (PJXA5) et 10 ans (PJXA10) ainsi que le cumul maximum ( Pmax) observés sur la période (tableau 4.4). D'une manière générale, ce sont les sous-bassins de la Saône qui connaissent le plus de précipitations.
Régimes hydrologiques
Celui-ci s'exprime comme la moyenne des durées de débit de demi-pointe de chaque crue. La dynamique de la Seine à Paris est beaucoup plus lente, tandis que celle de la Seine à Bazoches est extrêmement lente.
Comparaison et critique des archives de réanalyses
Comparaison des variables d'analogie de la méthode de référence entre les réanalyses ERA-
Cependant, la valeur calculée sur le domaine D1 est très souvent supérieure à celle calculée sur le domaine d'extraction, même si l'écart a également diminué depuis la fin des années 1970. Sur le domaine d'extraction, l'écart total moyen entre les valeurs Z500 du Les archives ERA et le NNR sont d'environ 0,9 m, ce qui est négligeable par rapport à la portée de 1000 m.
Etude des anomalies d'humidité dans les réanalyses ERA-40
Les valeurs RH850 extraites des archives de l'ERA ont été comparées à celles fournies par huit stations de radiosondages dans et autour de l'Est de la France. Les valeurs de chaque station ont été comparées à celles extraites des archives ERA au point de grille le plus proche de la station.
Sensibilité de la méthode de prévision par analogie à l'archive de réanalyses
Archives NCEP/NCAR et ERA-40 à 2,5°
Cependant, les performances sont légèrement meilleures lorsqu'on utilise l'archive ERA, notamment pour les précipitations extrêmes (supérieures au quantile PNN99). Par ailleurs, les résultats montrent qu'en général les performances, bien qu'équivalentes, diminuent légèrement si deux archives différentes sont utilisées pour les situations cible et candidate.
Archive ERA-40 aux résolutions 2,5° et 1,125°
Un gain de performance faible mais non négligeable est ainsi obtenu lorsque l'analogie est faite à 1,125° par rapport à l'analogie à 2,5°. Le gain de performance moyen G, exprimé entre l'utilisation des champs à 1,125° par rapport à celle des champs à 2,5°, s'élève à 1,57% pour l'ensemble des sous-bassins.
Conclusion
Nous avons ensuite étudié la sensibilité de la méthode de référence à la résolution des champs de variables analogiques issues de l'archive ERA. Pour chacun d'entre eux, pour le bassin de la Saône, nous avons évalué la performance moyenne (CRPSS) obtenue sur la période de calibrage et sur la période de validation (figure suivante a)).
Définitions
Variables brutes
L'abaissement du niveau de tropopause est dû à l'intrusion d'air stratosphérique dans la partie supérieure de la troposphère. Cette variable est également utilisée dans les prévisions convectives dans les niveaux inférieurs et supérieurs de la troposphère.
Variables élaborées
T est la température au niveau de pression P ; r est le rapport de mélange de la vapeur d'eau. En prévision météorologique, la température TPE permet de caractériser la masse d'air dans les couches inférieures de la troposphère.
Analyse des liaisons entre les variables
Analyse en composantes principales
Dans la méthode de référence A0, la variable HR a été prise, faute de mieux, au niveau de 850 hPa. Si l'on s'intéresse à la projection des variables sur les axes 2 et 3 (figure 5.3), les regroupements sont moins clairs.
Analyse de corrélation et des similitudes entre champs
MinV et MaxV sont respectivement les valeurs minimale et maximale absolues des champs de la variable V sur la période. Les valeurs du coefficient de détermination montrent que les variables T850, T500 et TPE850 sont raisonnablement corrélées avec la variable Z500.
Tests préliminaires sur des variables d'analogie potentielles
Ainsi, les formes des champs thermiques variables (TPE850, T850 et T500) apparaissent similaires à celles des champs de hauteur géopotentielle, avec des valeurs de score TWS assez faibles, de l'ordre de 50 à 80. Une analogie supplémentaire sur la forme de Par conséquent, les champs de température ne fourniraient pas plus d’informations. régimes météorologiques, etc.).
Conclusion
Mais cette variable n'est-elle pas déjà liée à l'une des variables de la méthode de référence. Dans un premier temps, nous justifierons l’introduction de la température et préciserons la relation avec l’effet saisonnier considéré dans la construction de l’échantillon de situations candidates.
Pourquoi introduire la température ?
Inconvénient de la sélection des situations candidates
Nous nous écartons donc de la largeur de fenêtre temporelle initialement choisie (de quatre mois). La figure 6.2 illustre la sensibilité de la distribution des précipitations à la largeur de la fenêtre temporelle pour des situations candidates.
Principe et test préliminaire
En effectuant une sélection basée sur la température par analogie, l'effet de la saison peut être pris en compte. Pour rendre les résultats comparables, le nombre de situations retenues à l'issue de ce niveau de sélection des situations candidates est identique au nombre obtenu lors de la sélection initiale dans un délai d'environ deux mois, soit environ 3000 situations.
Optimisation des paramètres
- Choix d'un niveau de pression et d'une heure de mesure
- Choix de plusieurs heures de mesure et niveaux de pression
- Choix du nombre de situations candidates à retenir
- Choix du domaine d'analogie
- Choix du critère d'analogie
Il est possible de combiner plusieurs niveaux de pression et plusieurs temps de mesure de température. Les gains de performance moyens G sont représentés à droite, pour le bassin de la Saône.
Validation et diagnostic
Adaptation au bassin de la Seine
Nous avons donc considéré la combinaison optimale obtenue dans le bassin de la Saône (925 +36h et 600 +12h) et retenu 2900 situations candidates. Le nombre de situations candidates à retenir a également été optimisé pour le bassin de la Seine (Figure 6.17).
Validation sur les deux bassins tests
Malgré la proximité géographique des deux bassins expérimentaux, nous pouvons supposer que notre méthode A1 a été validée dans le bassin de la Seine, maintenant les gains positifs réalisés dans le bassin de la Saône. Les climatologies des périodes cible et candidate étant les mêmes, la prévision climatologique est donc privilégiée sur la période de calage.
Comparaison à la sélection par saisonnalité
Pour vérifier cela, nous avons simplement évalué la différence de score CRPS entre les méthodes A0 et A1 pour chaque situation cible de la période de calibration. Pour chacun d’eux, nous avons estimé l’écart temporel entre les dates des situations analogiques conservées à la fin de l’étape 2 et la date de la situation cible.
Conclusion
Cela nous amène enfin à nous poser une question plus générale : quelle est la proportion de situations similaires que la méthode A1 retient finalement et qui se situent en dehors de la fenêtre initiale de quatre mois. C'est pourquoi nous avons voulu prendre explicitement en compte la température de la masse d'air lors du processus de présélection.
Un niveau d'analogie supplémentaire
Objectif et choix de la variable
Par commodité, certains paramètres ont été fixés a priori : le critère d'analogie, le nombre d'analogues à sélectionner et les temps de mesure de la variable d'analogie. Nous avons ensuite choisi d'optimiser le niveau de pression auquel la variable est mesurée, ainsi que le domaine d'analogie.
Un niveau d'analogie intermédiaire
Les gains de performance G, obtenus dans le bassin de la Saône par rapport à la méthode A1 lorsque le domaine optimal associé aux différents niveaux de pression est appliqué, sont reportés dans le tableau 7.1 pour les deux variables DIV et W. Nous obtenons le gain le plus élevé lorsque la vitesse verticale était mesuré au niveau de pression 850 hPa.
Optimisation des paramètres
Choix du critère d'analogie
Cela nous permettra de vérifier si un critère de distance tel que le critère RMSE est approprié pour la vitesse verticale. En revanche, les performances se dégradent lorsque les critères R et TWS sont appliqués à la vitesse.
Nombres d'analogues à sélectionner
Le niveau de pression optimal est finalement le niveau de 850 hPa, et le domaine d'analogie optimale est petit, à peine plus grand que le domaine appliqué au niveau 3 (étendue zonale avec un pas de 2,5°). En revanche, la figure 7.2 montre que si 30 analogues sont détenus à la fin du niveau 2 (puis 25 au niveau 3), les performances se dégradent quel que soit le nombre de situations tenues au niveau 1.
Heures de mesure et domaine d'analogie
Une symétrie apparaît dans la répartition des temps de mesure par rapport au milieu de la période d'accumulation. Au vu des résultats, il nous semble intéressant d’envisager quatre ou cinq heures de mesure de vitesse verticale.
Validation et diagnostic
Adaptation au bassin de la Seine
Le nombre d'analogues conservés aux niveaux 1 et 2 a été déterminé et nous avons optimisé les temps de mesure de la vitesse verticale pour le bassin de la Seine. L'évolution de l'augmentation des performances en fonction du nombre de mesures de la vitesse verticale est identique à celle obtenue dans le bassin de la Saône.
Validation sur les deux bassins tests
Quant au bassin de la Saône, nous choisissons la combinaison des quatre moments pour le bassin de la Seine pour la suite. Une des raisons de ce résultat pourrait venir de la climatologie du bassin de la Seine durant la période de validation.
Diagnostic approfondi des résultats
La répartition des écarts entre les valeurs du score CRPS calculées avec les méthodes A1 et A2 est présentée sur la figure 7.11 pour le bassin de la Marne à La Ferté. La figure 7.12 montre les distributions associées à chacun des deux groupes pour le bassin de la Marne près de La Ferté.
Conclusion
Le nombre optimal N2 est finalement identique au nombre N1 de la méthode A1 (70), mais le nombre optimal N1 apparaît bien supérieur (170). Enfin, le gain de performance obtenu par rapport à la méthode A1 apparaît significatif pour le bassin de la Saône.
Domaine d'analogie du niveau 1
Cette cartographie de la pertinence de l'analogie par classe révèle une relation forte entre la région d'importance et la direction d'origine du vent d'altitude. Ensuite, pour chacune des situations cibles de la période de calage, nous avons utilisé le domaine optimal associé à la classe à laquelle il appartient.
Des heures de mesure supplémentaires
Variables du niveau 1
Variable du niveau 3
En revanche, il est clair que la variable TCW% doit être mesurée au moins deux fois. On note également que les heures supplémentaires 06h00 TU et 18h00 TU ne sont pas privilégiées si TCW% est mesuré à deux instants : la combinaison optimale est identique à celle utilisée jusqu'à présent.
Des niveaux de pression supplémentaires
Constat préliminaire
Nous allons maintenant effectuer une optimisation pour évaluer l'intérêt d'utiliser des niveaux de pression autres que celui de 850 hPa pour l'humidité relative.
Application à l'humidité relative
Le domaine d'analogie est ensuite optimisé pour l'ensemble du bassin de la Saône lorsque l'humidité relative est mesurée à chaque niveau de pression. Nous avons donc envisagé de mesurer l'humidité relative aux deux niveaux de pression 925 et 700 hPa.
Synthèse, validation et diagnostic
- Application au bassin de la Seine
- Validation sur les deux bassins tests
- Diagnostic des résultats
- Application à la méthode A1
Les principaux résultats obtenus pour le bassin de la Seine seront présentés ici, lorsque l'humidité est mesurée à un seul niveau de pression puis à deux niveaux de pression, en utilisant également l'approche type météo. A l'instar des résultats obtenus pour le bassin de la Saône, le niveau de pression privilégié est le niveau de 700 hPa pour tous les types de temps sauf le type classe 4 (Sud).
Conclusion
Modèle hydrologique
Description
Procédure de calage du modèle
Evaluation en conditions parfaitement connues
Génération des prévisions de débit
Prévisions naïves
Persistance
Climatologie
Prévision des précipitations
Ré-optimisation des nombres d'analogues
Etude statistique et critique des prévisions de précipitations
Discussion et conclusion
Prévision des débits
Pertinence des scénarios obtenus par tirage aléatoire
Evaluation des prévisions de débit
Conclusion
Choix préliminaires
Période d'étude et modèle de prévision
Disponibilité des variables d'analogie
Prévision des précipitations
Evaluation globale
Evaluation en fonction d'un seuil
Prévision des débits
Evaluation globale
Etude des performances en fonction du seuil de débit
Etude de cas
Remarques préliminaires
Exemple de défaut d'alerte
Exemple de fausse alerte
Exemples de bonne alerte
Comparaison à une prévision déterministe expertisée
Conclusions
Acte de colloque (2009), Colloque Isère 1859