On the visual inspection of streamflow time series - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Access content directly
Conference Poster Year : 2023

On the visual inspection of streamflow time series

Inspection visuelle des séries temporelles du débit des cours d'eau

Abstract

This poster presents the results of a large visual inspection campaign of 674 flow time series in France by 43 evaluators, who were asked to identify flaws belonging to five categories: linear interpolation, drops, noise, point anomaly, and others. We examined the individual behavior of evaluators in terms of severity and consistency with other raters, as well as the temporal distributions of flaws and their influence on commonly used hydrological indicators. We found that agreement among raters was surprisingly low, with an average of 12% of overlapping periods reported as flaws. The most common types of flaws identified were linear interpolation and noise, and they were most often reported during low-flow periods in summer. The impact of cleaning the reported flaws from the time series was higher for low-flow indicators than for high-flow indicators, with change rates of less than 5% most of the time. We conclude that flaws identification in streamflow time series is highly dependent on the goals and skills of individual evaluators, raising the need for better practices for data cleaning that could benefit from future advances in machine learning tools.
Ce poster présente les résultats d'une campagne d'inspection visuelle de 674 séries temporelles de débits de cours d'eau en France. Cette inspection a été réalisée par43 évaluateurs dans le but d'identifier les périodes suspectées non-naturelles et de les classer d'an l'une de ces cinq catégories : interpolation linéaire, décrochements, bruit, anomalie ponctuelle, et autres. Nous avons examiné le comportement individuel des évaluateurs en termes de sévérité et de cohérence avec les autres évaluateurs, ainsi que la distribution temporelle de ces anomalies et leur influence sur les indicateurs hydrologiques. Les résultats montrent que l'accord entre les évaluateurs était étonnamment faible, avec une médiane de 12 % de taux d'accord sur les périodes signalées non-naturelles. Les types d'anomalies les plus reportés sont les interpolations linéaires et le bruit. Les périodes reportées sont plus fréquemment reportées pendant les périodes d'étiage en été. Inclure ces anomalies lors du calcul d'indicateurs hydrologique a un impact plus important sur les valeurs d'indicateurs de bas débit que pour sur indicateurs de haut débit. En conclusion, l'identification des périodes dites non-naturelles dans les séries temporelles débit dépend fortement des objectifs et des compétences des évaluateurs, ce qui soulève un besoin d'homogénéiser nos méthode de pré-traitement de données, qui pourraient potentiellement bénéficier des progrès futurs des outils d'apprentissage automatique.

Keywords

Fichier principal
Vignette du fichier
2023_AISH_Berlin_Critiques_Qobs.pdf (624.54 Ko) Télécharger le fichier
Origin Files produced by the author(s)

Dates and versions

hal-04172603 , version 1 (27-07-2023)

Identifiers

Cite

Laurent Strohmenger, Guillaume Thirel. On the visual inspection of streamflow time series: distributions and impacts of non-natural flow records. IAHS Symposium, 28th General Assembly of the International Union of Geodesy and Geophysics, Jul 2023, Berlin (Germany), Germany. 1p., 2023, ⟨10.5194/hess-2023-58⟩. ⟨hal-04172603⟩
17 View
8 Download

Altmetric

Share

Gmail Mastodon Facebook X LinkedIn More