Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Big data or Big cleaning ? Problems around data management in continental aquatic monitoring networks

Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux

Résumé

Dans le contexte de la mise en oeuvre la « Directive Cadre Européenne sur l'Eau » (DCE), Irstea mène des programmes de développement de méthodes d'évaluation et de diagnostic de l'état écologique des masses d'eau en France. Les équipes scientifiques d'Irstea interviennent notamment dans le développement d'indicateurs biologiques et, à ce jour, sept bioindicateurs relatifs à trois maillons végétaux (macrophytes, diatomées, phytoplancton) pour deux écosystèmes (cours d'eau et plan d'eau) ont été construits grâce aux données collectées chaque année par les opérateurs des réseaux de surveillance DCE sur plus de 4000 sites à l'échelle nationale, selon des protocoles normatifs validés. L'élaboration des outils d'évaluation de l'état écologique nécessite toute une chaîne méthodologique d'opérations partant des mesures et prélèvements in situ, en passant par le contrôle de la qualité des données transférées pour ensuite les bancariser de façon pérenne et calculer les métriques et indices pour l'évaluation et le diagnostic de l'état écologique. De par la quantité d'information ainsi générée, Irstea est aussi impliqué dans la construction de bases de données qui centralisent les données issues des réseaux de surveillance DCE. De ce fait, le contrôle de la qualité des données constitue une part importante du travail des biostatisticiens des équipes scientifiques d'Irstea. Ils se retrouvent donc confrontés aux thématiques relatives au « Big Data » et doivent veiller à ce que les données soient homogènes et conformes aux protocoles afin de fournir une base de travail de qualité satisfaisante pour l'élaboration d'outils d'évaluation. Ainsi, des routines de contrôle qualité des données et de mise en forme des données ont été développées pour l'alimentation et le transfert des bases de données, mais aussi pour faciliter les travaux statistiques qui en découlent et proposer des analyses pertinentes qui répondent aux hypothèses des chercheurs hydrobiologistes.

Mots clés

Fichier non déposé

Dates et versions

hal-02610035 , version 1 (16-05-2020)

Identifiants

Citer

Sébastien Boutry, D. Carayon, M. Wach. Big data ou Big cleaning ? Problématiques autour de la gestion des données dans les réseaux de suivis aquatiques continentaux. JILO Journées Internationales de Limnologie et d'Océanographie, Nov 2018, Strasbourg, France. ⟨hal-02610035⟩

Collections

IRSTEA INRAE EABX
32 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More