La taille de l'échantillon correspond au nombre de couples observation-prévision utilisés dans le cadre d'une méthode de vérification particulière. Le concept d’échantillon est important. Un échantillon est un sous-ensemble représentatif d'un ensemble de données plus grand qu'on utilise à des fins statistiques. Il faut un nombre minimum d'échantillons dans un ensemble de données pour garantir un certain degré de confiance dans les prévisions. Plus l'échantillon est grand, plus il est probable que les données rendront compte de tout l'éventail des possibilités.

Par exemple, si l'on prévoit une crue majeure, le degré d'incertitude est en général plus élevé car les grandes crues figurent plus rarement dans les échantillons. L'utilisation d'un petit échantillon entraîne souvent une plus grande incertitude dans les indicateurs utilisés pour la vérification et, par conséquent, un degré de confiance moins élevé dans la prévision.

Si, durant 100 ans, les relevés indiquent que le débit d'une rivière est stable, il y a de bonnes chances pour que le comportement de cette rivière soit compris. L'incertitude diminue, tandis que le degré de confiance des prévisions augmente. À l'inverse, si l'on ne dispose que de 20 ans de relevés, il y a moins de chances que l’échantillon englobe tout l'éventail des débits qu’avec cent ans d'observation. L’utilisation d’un échantillon qui ne reflète pas bien l'éventail des possibilités accroît le degré d'incertitude des prévisions.

Sélectionnons parmi ces relevés une période de 20 ans. Pourquoi pourrait-on avoir de la peine à comprendre le comportement de la rivière sur la base de ce sous-ensemble de données?
Choisissez toutes les bonnes réponses.
Les bonnes réponses sont c) et d).
La rivière n'a pas connu d'écoulement de crue. Elle n'a pas non plus connu de débit d’étiage (extrêmement faible). Par conséquent, cette période de 20 ans n'est pas représentative du comportement de la rivière tel qu'il apparaît sur toute la période enregistrée.