Верификация гидрологических прогнозов: введение

Статистика ошибок

  • Два распространенных статических показателя ошибок:
    • Средняя абсолютная ошибка (САО)
    • Средняя квадратическая ошибка (СКО)

При верификации детерминистских прогнозов для измерения количественной точности обычно используются два статических показателя ошибок: Средняя абсолютная ошибка (САО) и средняя квадратическая ошибка (СКО).

Иллюстрация видов ошибок с помощью гидрографа

Оба вида ошибок учитывают разность между прогнозируемыми и наблюденными значениями. В них не учитывается, является ли эта разность положительной – прогнозируемое значение больше наблюдаемого, или отрицательной – прогнозируемое значение меньше наблюдаемого.

Формула расчета средней абсолютной ошибки (САО).

САО – это среднее значение абсолютных величин разностей между прогнозируемыми и наблюденными значениями. СКО – это квадратный корень из среднего значения квадрата разностей между прогнозируемыми и наблюденными значениями. В обоих случаях значение 0.00 указывает на полное совпадение наблюденных и прогнозируемых значений. Значения возрастают от нуля до больших ошибок и теоретически могут доходить до бесконечности.

Формула расчета средней абсолютной ошибки (САО).

СКО более чувствительна к большим разностям между прогнозируемыми и наблюденными значениями, чем САО. Поэтому САО целесообразнее использовать при верификации значений минимального стока, поскольку величина ошибки прогноза обычно намного меньше для прогнозов минимального стока. Большие ошибки, более характерные для прогнозов максимального стока, будут доминировать в статистике СКО.

Формула расчета средней ошибки

Другим видом ошибок является средняя ошибка (СО). СО – это средняя арифметическая разность между прогнозируемыми и наблюденными значениями.

Статистический показатель средней ошибки в гидрологии

В отличие от САО и СКО, СО указывает на то, будут ли прогнозируемые значения, как правило, выше или ниже наблюденных значений, поэтому вы можете получить отрицательные числа. Положительные значения указывают на тенденцию завышения прогнозных значений (прогнозные значения имеют тенденцию превышать наблюденные значения), а отрицательные значения обозначают тенденцию занижения прогнозных значений по сравнению с наблюденными значениями.

  • Средняя ошибка равна = 0 (ошибки сведены к нулю)
  • Средняя абсолютная ошибка > 0
  • Средняя квадратическая ошибка >> 0

Несмотря на то, что, как и в случае с другими статистическими данными об ошибках, наилучшим считается значение 0.00, это может ввести в заблуждение. Если в наборе прогнозов есть большие ошибки, которые равномерно распределены выше и ниже среднего значения, то средняя ошибка равна нулю, потому что ошибки компенсируют друг друга. Поэтому значение СО, равное нулю, не обязательно означает идеальный прогноз. В этом случае значения СКО и САО будут иметь ненулевые значения, указывающие на несовершенный прогноз. При верификации прогнозов важно использовать статистику СО вместе с другими оценочными критериями.