3. P RINCIPAIS FORNECEDORES CLOUD
3.4 S OFTWARE COMO SERVIÇO
plus de relations et en adaptant sensiblement la terminologie. Le référentiel de Sargent
a été employé par Knepell et Arangno (1993) pour introduire la structure des
pro-cessus d’évaluation d’une simulation numérique. Le terme devalidation de modèle est
abandonné dans ce nouveau référentiel au profit du terme devalidation opérationnelle
2.
Selon la définition de Knepell et Arangno, (p. 3-25), ce processus vise ainsi à s’assurer
de la correspondance du modèle informatique avec la réalité perçue.
Limites de ces référentiels
Dans les formulations précédentes, on peut noter l’utilisation du termemodèledans
la sémantique de plusieurs procédures d’évaluation de la crédibilité. Leurs définitions
nécessitent de fait de préciser de quel modèle il s’agit, modèle conceptuel ou modèle
informatique.
De plus, malgré ces nombreuses formalisations, une caractéristique importante dans
le contexte actuel de la modélisation n’est pas représentée : la distinction entrecode de
calcul etmodèle numérique d’un système donné. En effet, dans le domaine qui nous
in-téresse, cette distinction est effective depuis le passage de la troisième à la quatrième
génération de modèles numériques, lors de la mise en place de systèmes génériques
permettant de développer des modèles numériques spécifiques
3. Cette distinction se
révèle particulièrement importante dans la définition du terme calage, comme le
sou-ligne Flavelle (1992) :
Calibration means modifying the values of adjustable parameters in a computer code
so that the calculated results match a given set of test data, or ‘tuning’ the model. This
is done when the computer code is applied to a particular problem, and is not part of
development of the software.
1.2 Proposition d’un cadre terminologique
Les limites des référentiels décrit dans la section précédente nous ont conduit à
chercher un nouveau référentiel de modélisation numérique plus en adéquation avec le
domaine de l’hydroinformatique. Cette section présente ainsi le référentiel développé
par Refsgaard et Henriksen que nous allons adopter dans la suite du document. Des
précisions seront apportées à la notion de calage, et l’on verra comment cette activité
s’inscrit dans un contexte plus large d’évaluation d’une modélisation.
1.2.1 Le référentiel de Refsgaard et Henriksen
Dans le cadre du projet européen HQA
4, un rapport a été produit sur
l’état de l’art des procédures d’assurance qualité pour la modélisation numérique
re-lative à la gestion de bassins versants (Refsgaard, 2002). Le troisième chapitre de ce
rapport (Refsgaard et Henriksen, 2002)
5est ainsi consacré à la proposition d’un cadre
théorique pour un guide en modélisation. Les auteurs proposent ainsi un nouveau
ré-férentiel terminologique, reproduit sur la figure 1.2. Ce réré-férentiel reprend le principe
2. Proposition de traduction du terme anglaisoperational validation.
3.
((Tools for building tools
))(Abbott, 1991, p. 19).
4.Harmonising Quality Assurance in model based catchment and river basin management (
www. harmoniqua.org)
C1 D
de celui développé par Schlesingeret al.en distinguant lecode de calcul dumodèle
nu-mérique. Les définitions précises des différents éléments et procédures sont regroupées
dans le tableau 1.1. Cette distinction conduit ainsi à scinder les procédures de
vali-dation du modèle et de vérification du modèle définies par Schlesingeret al. en trois
nouvelles procédures :
– la vérification du codepermet de vérifier l’implémentation informatique du
mo-dèle conceptuel ;
– lecalage de modèles’attache à ajuster les paramètres du modèle numérique en vue
de reproduire la réalité dans les limites de précision demandées ;
– lavalidation du modèleconsiste quant à elle à s’assurer que le modèle numérique
possède un niveau de précision cohérent avec l’application demandée.
Dans toute la suite du mémoire, nous nous appuierons sur ce référentiel
termino-logique, auquel vont être apportées quelques précisions dans la section suivante.
1.2.2 Précisions sur la notion decalage
Comme pour le termemodèle, plusieurs concepts semblent se dessiner sous
l’appel-lation de calage (Morton et Suárez, 2001). Nous nous en tiendrons à celui que nous
allons tenter d’identifier au travers de quelques définitions extraites de la littérature.
Ces définitions apportent des précisions sur plusieurs aspects du calage évoqués
seule-ment de manière succincte dans le référentiel de Refsgaard et Henriksen. Ces précisions
seront reprises dans le cadre méthodologique présenté dans la section 1.3.
Niveau de correspondance attendu
Comme rappelé par Scholten et al.(2001), le calage vise à reproduire le plus
fidè-lement possible le comportement du système considéré, celui-ci étant identifié par des
mesures directes :
Calibration aims at the reduction of differences between field observations and
corre-sponding model outcomes.
Le comportement du système ne peut être reproduit idéalement, puisqu’un modèle est
par nature imparfait. Unniveau de correspondance attendu doit donc être défini, pour
guider la tâche de calage du modèle, mais aussi celle de validation du modèle.
Un jeu de données de référence
Durant le calage, des paramètres du modèle vont être ajustés pour reproduire les
caractéristiques observées du comportement du système, représentées par un jeu de
données de référence (Tsang, 1991) :
Model calibration is the process by which certain unknown parameters to be used in
applying a code are determined by comparing modeling results with available data,
which the model is required to simulate.
Ce jeu de données correspond le plus souvent à un ou plusieurs événements passés
(Cunge, 2003) :
Calibration [..] consists in executing a number of simulations of past observed events
and in varying the parameters of the model until an acceptable (to the modeller)
coin-cidence between observations and computations is obtained.
1.2 P ’
Réalité Modèle conceptuel Modèle numérique Validation du modèle Simulation Analyse Programmation Confirmation de la théorie Vérification du code Code de calcul Construction du modèle Calage du modèleF. 1.2 – Éléments d’une terminologie en modélisation, d’après Refsgaard et Henriksen
(2004).
Terme Définition générique
Réalité Type de système naturel
Modèle conceptuel Description verbale, équations, relations fonctionnelles, ou
((lois
natu-relles
))tendant à décrire le type de système considéré
Code de calcul Programme informatique formalisant de manière générique le
comporte-ment du type de système considéré
Modèle numérique Description informatisée du système particulier étudié
Analyse Établissement de lois régissant un type de système
Programmation Développement d’un code transcrivant de manière informatique un modèle
conceptuel
Construction du modèle Établissement d’un modèle du système étudié à l’aide d’un code de
simula-tion générique
Simulation Utilisation d’un modèle validé pour obtenir des prédictions sur un système
donné
Confirmation de la théorie Détermination de l’adéquation du modèle conceptuel au type de système
considéré avec un niveau de correspondance acceptable pour le domaine
d’application visé
Vérification du code Contrôle de la représentation informatique du modèle conceptuel dans les
limites de correspondance attendues
Calage du modèle Ajustement des paramètres du modèle numérique en vue de reproduire la
réalité avec le niveau de correspondance attendu
Validation du modèle Établissement que le modèle numérique, dans son domaine d’applicabilité,
possède un niveau de correspondance cohérent avec le domaine
d’applica-tion visé
T. 1.1 –Glossaire de modélisation développé par Refsgaard et Henriksen (2004) –
C1 D
On peut noter ici l’importance des données qui n’apparaissent pourtant pas
explicite-ment dans le référentiel de Refsgaard et Henriksen. Nous reviendrons bien évidemexplicite-ment
sur ce point dans la suite du document, et notamment dans la section 2.4.2 du
cha-pitre 2.
Domaine d’application visé
Le processus d’ajustement ainsi que la manière d’évaluer la concordance entre
don-nées observées et résultats de simulation vont en outre dépendre fortement des objectifs
futurs du modèle. Ainsi, un modèle hydraulique ou hydrologique destiné à la prévision
de crues se doit de reproduire les caractéristiques de crues passées, et pas nécessairement
les périodes d’étiage (Guinot et Gourbesville, 2003). Ledomaine d’application visé du
modèle apparaît ainsi comme essentiel dans le processus de calage, mais aussi dans les
autres étapes d’une modélisation numérique – et notamment la validation (Goodrich,
1992) – comme on le verra dans la section 1.3.
1.2.3 Typologie des situations rencontrées en modélisation
Cette section présente les différents cas auxquels peut être confronté un
utilisateur/-concepteur de modèles numériques, et comment le calageet la validation s’inscrivent
dans cette typologie basée sur une approche systémique.
Approche systémique
L’approche adoptée dans cette section est résumée par la figure 1.3. Un modèle est
ainsi défini – dans une acceptation systémique (Le Moigne, 1990) – comme utilisant
des intrantspour produire des extrants. Les paramètres sont considérés comme partie
intégrante du modèle. En hydraulique fluviale, on peut voir de façon schématique les
intrants comme les conditions limites et initiale, et les extrants comme les hauteurs
d’eau et les débits le long du tronçon de rivière modélisé, pendant la période considérée.
Intrants −→ Modèle −→ Extrants
F. 1.3 –Approche systémique de la modélisation.
Problèmes direct et inverse
On peut classer les problèmes rencontrés en modélisation en deux grandes
caté-gories : d’une part le problème direct qui vise à déterminer les extrants, les intrants
et le modèle étant présumés connus. L’usage ((productif)) des modèles hydrauliques
correspond à ce type de problème, qui comporte deux situations possibles suivant la
connaissance sur les intrants : d’une part laprévisiondans laquelle les intrants sont
réel-lement connus (suivi en temps réel de la propagation d’une crue), et d’autre part la
prédiction dans laquelle les intrants représentent une situation hypothétique
(simula-tion d’une crue centennale). Les autres problèmes sont qualifiés deproblèmes inverseset
1.2 P ’
Situations en problème inverse
Deux types de situations peuvent se présenter à un modélisateur lors de la résolution
d’un problème inverse :
– l’identificationrevient à déterminer le modèle correspondant à un couple intrant/
extrant donné. Dans le cas de la modélisation hydraulique, cette situation revient
à construire un modèle numérique en déterminant ses paramètres, c’est-à-dire en
réalisant uncalagede celui-ci ;
– ladétectionconsiste à retrouver l’entrée qui produit une sortie donnée d’un
mo-dèle connu. En hydraulique, on peut relier cette situation à la reconstitution des
apports à l’amont d’un bief (reconstitution des conditions limite amont), mais
aussi à la reconstruction de l’état initial. On discerne ainsi plusieurs types de
si-tuations – que l’on va regrouper sous le terme détection– qui dépendent de la
partie inconnue des intrants : condition limite, condition initiale ou autre.
Cette typologie, résumée dans le tableau 1.2 adapté de Cunge (1975), a été synthétisée
par Wasantha Lal (1995).
Problème Situation Intrants Modèle Extrants
Direct Prévision connus connus ?
Prédiction hypothèses connus ?
Inverse Identification connus ? connus
Détection ? connus connus
T. 1.2 –Typologie des situations en modélisation, adapté de Cunge (1975).
1.2.4 De l’évaluation d’une modélisation au calage du modèle
Cette section présente les différentes facettes de l’évaluation d’une modélisation,
et comment la validation opérationnelle définie plus haut s’inscrit dans ce cadre plus
général. Ensuite, le calage du modèle – mais aussi la validation du modèle et une
par-tie de la vérification du code – est identifié comme une composante de la validation
opérationnelle. L’articulation de ces différents concepts est présentée sur la figure 1.4.
Evaluation d'une modélisation Validation opérationnelle
Vérification du code
Confirmation de la théorie Calage du modèle
Validation du modèle
F. 1.4 –Position des processus du référentiel de Refsgaard et Henriksen dans l’évaluation
C1 D
Évaluation d’une modélisation
L’évaluation des modélisations numériques a fait l’objet de nombreuses études,
no-tamment dans des domaines sensibles comme la défense militaire (Fossetet al., 1991)
ou la contamination des nappes par des radionucléides (Tsang, 1991). Ce dernier
ar-ticle a donné lieu à plusieurs discussions (Goodrich, 1992; Tsang, 1992a; Konikow,
1992; Tsang, 1992b) mettant en relief, d’une part des points de vue différents sur
l’éva-luation d’une modélisation, et d’autre part les incompréhensions dues à l’absence d’un
référentiel terminologique commun.
Dans leur ouvrage intitulé Simulation Validation–A Confidence Assessment
Metho-dology, Knepell et Arangno (1993) discernent cinq activités d’évaluation. Nous allons
replacer chacune de ces activités dans le cadre du référentiel de Refsgaard et Henriksen :
– la validation du modèle conceptuel correspond à laconfirmation du modèle
concep-tuel.
– la vérification du logiciel coincide avec lavérification du code;
– la vérification de la sécurité interne est reliée à la gestion du logiciel. Cette activité
se trouve en-dehors du cadre de ces travaux, puisqu’elle relève de la gestion au sens
large du code de calcul ;
– la validation des données vise à s’assurer de la cohérence et de la représentativité
des données. Cette activité, non représentée dans notre cadre terminologique,
sera évoquée dans la présentation d’un cadre méthodologique pour la
modélisa-tion (secmodélisa-tion 1.3) ;
– la validation opérationnelle regroupe implicitement les processus decalage de
mo-dèleetvalidation de modèle. Knepell et Arangno se sont en effet basés sur le
réfé-rentiel de Sargent (section 1.1.3) qui fait intervenir ce terme ;
Nous nous intéresserons dans ce mémoire uniquement à lavalidation opérationnelle,
qui s’appuie sur une comparaison des résultats du modèle avec des données issues du
système étudié.
Validation opérationnelle
Sargent (1984) distingue plusieurs approches pour la validation opérationnelle
sui-vant que le système à modéliser est observé ou non
6. Le tableau 1.3 regroupe les diff
é-rentes approches possibles. Dans le cadre d’une modélisation hydrologique, un bassin
versant non jaugé est un exemple d’un système non observé. En hydraulique fluviale,
le système est observé, et l’approche pour la validation opérationnelle est souvent
sub-jective
7: le calage et la validation s’effectuent à l’aide de graphiques, et l’exploration du
comportement du modèle peut s’effectuer à l’aide d’une étude de sensibilité. Dans la
suite, le terme devalidation opérationnelle sera restreint au cas d’un système observé.
Knepell et Arangno (1993) ne font aucune référence à une quelconque
distinc-tion de processus assimilables aucalage du modèle ou bien à la validation du modèle.
Cependant, les auteurs proposent une batterie de tests réalisables durant l’activité de
6. Sargent utilise le terme anglaisnon observable. Nous avons choisi le terme plus générique
((non
ob-servé
))afin de prendre en compte des systèmes où il n’existe simplement pas actuellement de possibilité
d’identifier les réponses à un événement passé. Pour plus de précisions sur les différences de validation
opé-rationnelle entre systèmesobservablesetnon observables, le lecteur pourra consulter un article de de Marsily
(1997).
7. Dans le cas d’un calage par optimisation, l’approche devrait être objective. Nous verrons dans le
chapitre 3 qu’il reste pourtant toujours une large part de subjectivité dans ce processus.
No documento
As transformações nos sistemas de informação preconizadas pelo cloud computing
(páginas 39-44)