Skip to Main content Skip to Navigation
Conference papers

Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux

Résumé : Dans le contexte de la mise en oeuvre la « Directive Cadre Européenne sur l'Eau » (DCE), Irstea mène des programmes de développement de méthodes d'évaluation et de diagnostic de l'état écologique des masses d'eau en France. Les équipes scientifiques d'Irstea interviennent notamment dans le développement d'indicateurs biologiques et, à ce jour, sept bioindicateurs relatifs à trois maillons végétaux (macrophytes, diatomées, phytoplancton) pour deux écosystèmes (cours d'eau et plan d'eau) ont été construits grâce aux données collectées chaque année par les opérateurs des réseaux de surveillance DCE sur plus de 4000 sites à l'échelle nationale, selon des protocoles normatifs validés. L'élaboration des outils d'évaluation de l'état écologique nécessite toute une chaîne méthodologique d'opérations partant des mesures et prélèvements in situ, en passant par le contrôle de la qualité des données transférées pour ensuite les bancariser de façon pérenne et calculer les métriques et indices pour l'évaluation et le diagnostic de l'état écologique. De par la quantité d'information ainsi générée, Irstea est aussi impliqué dans la construction de bases de données qui centralisent les données issues des réseaux de surveillance DCE. De ce fait, le contrôle de la qualité des données constitue une part importante du travail des biostatisticiens des équipes scientifiques d'Irstea. Ils se retrouvent donc confrontés aux thématiques relatives au « Big Data » et doivent veiller à ce que les données soient homogènes et conformes aux protocoles afin de fournir une base de travail de qualité satisfaisante pour l'élaboration d'outils d'évaluation. Ainsi, des routines de contrôle qualité des données et de mise en forme des données ont été développées pour l'alimentation et le transfert des bases de données, mais aussi pour faciliter les travaux statistiques qui en découlent et proposer des analyses pertinentes qui répondent aux hypothèses des chercheurs hydrobiologistes.
Mots-clés : CHAÎNE DE TRAITEMENT
Document type :
Conference papers
Complete list of metadata

https://hal.inrae.fr/hal-02610035
Contributor : Migration Irstea Publications <>
Submitted on : Saturday, May 16, 2020 - 7:02:21 PM
Last modification on : Wednesday, December 16, 2020 - 3:52:01 PM

Identifiers

  • HAL Id : hal-02610035, version 1
  • IRSTEA : PUB00063982

Collections

Citation

Sébastien Boutry, D. Carayon, M. Wach. Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux. JILO Journées Internationales de Limnologie et d'Océanographie, Nov 2018, Strasbourg, France. ⟨hal-02610035⟩

Share

Metrics

Record views

22