
Considérons vingt prévisions pour le débit d'une rivière. Il peut s'agir de vingt prévisions déterministes ou d'une prévision d'ensemble comprenant vingt membres. Pour simplifier, nous nous appuierons sur deux catégories pour les prévisions et les observations. La première catégorie regroupe les débits inférieurs à un plafond défini. Nous désignerons ces phénomènes par la lettre « B », inscrite en bleu. La deuxième catégorie regroupe les débits dont la valeur est égale ou supérieure à un seuil donné. Nous désignerons ces phénomènes par la lettre « H », inscrite en rouge.

Dressons maintenant la liste des vingt observations correspondant à ces prévisions. Nous caractérisons donc le débit observé par les lettres B (comme « bas ») et H (comme « haut »). On peut comparer ces prévisions et ces observations de deux manières. La première est une vérification fondée sur les prévisions, et la seconde une vérification fondée sur les observations.

Pour la vérification fondée sur les prévisions, nous répartissons les prévisions dans deux groupes. Le groupe 1 est constitué de toutes les prévisions « B » et de leurs observations correspondantes. Le groupe 2 est constitué de toutes les prévisions « H » et de leurs observations correspondantes. À partir de là, nous pouvons poser deux questions importantes.
Question 1: Considérant une prévision de B, qu’a montré l’observation correspondante? Ici, nous voyons que 8/10, soit 80 % des observations correspondent à une valeur de B. Nous pouvons en déduire que le système de prévision est fiable pour le débit B.
Question 2: Considérant une prévision de H, qu’a montré l’observation correspondante? Cette fois, seulement 4/10, soit 40 %, des observations correspondent aux prévisions ayant une valeur de valeur H. Nous pouvons en déduire que, pour la catégorie de débits H, le système de prévision n'est pas aussi fiable.

Nous allons maintenant nous tourner vers la vérification fondée sur l'observation. Nous répartissons de nouveau les données en deux catégories, les débits B et les débits H, mais nous les définissons cette fois dans la perspective des observations. Le groupe 1 est donc constitué de toutes les observations de B et de leurs prévisions correspondantes. Le groupe 2 est constitué des observations de H et de leurs prévisions correspondantes. Maintenant, nous pouvons poser les deux questions suivantes.
Question 1: Considérant les observations du groupe de débits B, qu'avaient annoncé les prévisions correspondantes? Nous pouvons voir que 8/14, soit 57 %, des prévisions correspondent aux observations. Le système de prévision a donc permis de distinguer les conditions de faible débit dans un petit peu plus que la moitié des cas.
Question 2: Considérant les observations du groupe H, qu'avaient annoncé les prévisions correspondantes? Ici, 4/6, soit 67 %, des prévisions correspondent aux observations.
| Fiabilité | |
|---|---|
| Prévision: | Observations correspondantes correctes: |
| B | 80 % |
| H | 40 % |
| Discrimination | |
|---|---|
| Observation: | Prévisions correspondantes correctes: |
| B | 57 % |
| H | 67 % |
Que pouvons-nous en déduire? Dans ce cas, le système de prévision était fiable pour la catégorie de débits B. Autrement dit, pour une prévision de débit B, nous avions 80 % de chances que l'observation corresponde à B. Toutefois, la performance du système de prévision n'a pas été aussi bonne pour la discrimination des débits B. Pour une observation du débit B, il n'y avait que 57 % de chances que la prévision correspondante désigne B.
Pour les débits H, le système de prévision s'est révélé beaucoup moins fiable que pour les débits B. Seulement 40 % des prévisions de débit H correspondaient à des observations de H. Cependant, le système de prévision s'est révélé plutôt bon pour la discrimination des débits H. Lorsqu’un débit H est observé, il y a 2 chances sur 3 pour qu’il ait été prévu correctement.
Cet exemple, simple, ne prenait en compte que deux catégories. En réalité, on peut définir de nombreuses catégories dans le continuum entre le débit le plus faible possible et le débit le plus élevé possible. Dans ce cas, la vérification des prévisions conditionnelles se complique, mais le calcul de la fiabilité et de la discrimination des prévisions reste le même qu’avec un système simple à deux catégories.