Assessing the transferability of a multi-source land use classification workflow across two heterogeneous urban and rural areas
Évaluation de la transférabilité d'un processus de classification de l'usage des sols à partir de sources multiples dans deux zones urbaines et rurales hétérogènes
Résumé
Mapping Land Use (LU) is crucial for monitoring and managing the dynamic evolution of the human activities of a given area and their consequential environmental impacts. In this study, a multimodal machine learning framework, using the XGBoost classifier applied to attributes constructed from heterogeneous spatial data sources, is defined and used to automatically classify LU in the two French departments of Gers and Rhône. It reaches a mean F1 score of 83% and 86% respectively. This research work also assesses the robustness and transferability of the machine learning model between these two diverse study areas and highlights the challenges encountered, arising mainly from the differences of distribution of the attributes and classes between the study areas. Adding a few samples from the test study area allows the model to learn some specificities of the test study area, and thus improves the results. Moreover, the study evaluates the individual contributions of each data source to the accuracy of predictions of the LU classes, providing insights concerning the relevance of each data source in enhancing the overall precision of the Land Use classification. The findings contribute to a validated LU classification workflow, identify valuable data sources, and enhance understanding of model transferability challenges.
La cartographie de l'usage des sols (LU) est cruciale pour le suivi et la gestion de l'évolution dynamique des activités humaines d'une zone donnée et de leurs impacts environnementaux consécutifs. Dans cette étude, un cadre d'apprentissage automatique multimodal, utilisant le classifieur XGBoost appliqué à des attributs construits à partir de sources de données spatiales hétérogènes, est défini et utilisé pour classifier automatiquement l'UD dans les deux départements français du Gers et du Rhône. Il atteint un score F1 moyen de 83% et 86% respectivement. Ce travail de recherche évalue également la robustesse et la transférabilité du modèle d'apprentissage automatique entre ces deux zones d'étude différentes et met en évidence les défis rencontrés, découlant principalement des différences de distribution des attributs et des classes entre les zones d'étude. L'ajout de quelques échantillons de la zone d'étude test permet au modèle d'apprendre certaines spécificités de la zone d'étude test, et donc d'améliorer les résultats. En outre, l'étude évalue les contributions individuelles de chaque source de données à la précision des prédictions des classes d'usage des sols, fournissant des indications sur la pertinence de chaque source de données dans l'amélioration de la précision globale de la classification de l'usage des sols. Les résultats contribuent à valider le flux de travail de la classification LU, à identifier les sources de données utiles et à améliorer la compréhension des défis liés à la transférabilité des modèles.
Fichier principal
Assessing the transferability of a multi-source land use classification workflow across two heterogeneous urban and rural areas.pdf (2.81 Mo)
Télécharger le fichier
Origine | Fichiers éditeurs autorisés sur une archive ouverte |
---|---|
licence |