Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Access content directly
Conference Papers Year : 2018

Big data or Big cleaning ? Problems around data management in continental aquatic monitoring networks

Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux

Abstract

Dans le contexte de la mise en oeuvre la « Directive Cadre Européenne sur l'Eau » (DCE), Irstea mène des programmes de développement de méthodes d'évaluation et de diagnostic de l'état écologique des masses d'eau en France. Les équipes scientifiques d'Irstea interviennent notamment dans le développement d'indicateurs biologiques et, à ce jour, sept bioindicateurs relatifs à trois maillons végétaux (macrophytes, diatomées, phytoplancton) pour deux écosystèmes (cours d'eau et plan d'eau) ont été construits grâce aux données collectées chaque année par les opérateurs des réseaux de surveillance DCE sur plus de 4000 sites à l'échelle nationale, selon des protocoles normatifs validés. L'élaboration des outils d'évaluation de l'état écologique nécessite toute une chaîne méthodologique d'opérations partant des mesures et prélèvements in situ, en passant par le contrôle de la qualité des données transférées pour ensuite les bancariser de façon pérenne et calculer les métriques et indices pour l'évaluation et le diagnostic de l'état écologique. De par la quantité d'information ainsi générée, Irstea est aussi impliqué dans la construction de bases de données qui centralisent les données issues des réseaux de surveillance DCE. De ce fait, le contrôle de la qualité des données constitue une part importante du travail des biostatisticiens des équipes scientifiques d'Irstea. Ils se retrouvent donc confrontés aux thématiques relatives au « Big Data » et doivent veiller à ce que les données soient homogènes et conformes aux protocoles afin de fournir une base de travail de qualité satisfaisante pour l'élaboration d'outils d'évaluation. Ainsi, des routines de contrôle qualité des données et de mise en forme des données ont été développées pour l'alimentation et le transfert des bases de données, mais aussi pour faciliter les travaux statistiques qui en découlent et proposer des analyses pertinentes qui répondent aux hypothèses des chercheurs hydrobiologistes.

Keywords

No file

Dates and versions

hal-02610035 , version 1 (16-05-2020)

Identifiers

Cite

Sébastien Boutry, D. Carayon, M. Wach. Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux. JILO Journées Internationales de Limnologie et d'Océanographie, Nov 2018, Strasbourg, France. ⟨hal-02610035⟩

Collections

IRSTEA INRAE EABX
32 View
0 Download

Share

Gmail Mastodon Facebook X LinkedIn More