Cartes
Avec Cosia, l’IA analyse la couverture des sols
ARTICLE EN ACCÈS LIBRE JUSQU'AU 15 OCTOBRE
Bien que ses lourdes conséquences sur l’environnement et sur la biodiversité soient désormais bien connues, l’artificialisation des sols continue de progresser en France. Pour l’enrayer, la loi climat et résilience d’août 2021 a inscrit l’objectif zéro artificialisation nette (ZAN) à l’horizon 2050. Dans ce contexte, l’Institut national de l’information géographique et forestière (IGN) a été chargé de produire le référentiel d’occupation du sol à grande échelle OCS GE, qui vise à faciliter les calculs de consommation d’espace. Parallèlement, l’institut a lancé dès août 2023 le prototype d’un démonstrateur en ligne permettant de découvrir les cartes de couverture du sol Cosia, obtenues directement par intelligence artificielle (IA). Les collectivités territoriales sont invitées à s’emparer de ces données ouvertes pour développer des applications au service de la gestion des sols, de l’urbanisme et de l’environnement.
Dans la stratégie open data de l’IGN
La construction du référentiel OCS GE s’appuie sur l’IA pour automatiser la télédétection d’objets à partir des prises de vues aériennes de la BD Ortho et des modèles numériques de terrain (MNT) et de surface (MNS) de l’IGN. Les données font ensuite l’objet de croisements avec d’autres bases de données (BD Topo, BD Forêt et RPG) et de corrections manuelles par photo-interprétation pour produire les données socles réglementaires destinées à la décision publique, détaillant l’occupation du territoire à la fois en termes de couverture du sol (bâti, eau, type de végétation...) et d’usage (agriculture, activités d’extraction, domaine routier, voies navigables...). Le projet Cosia va permettre de valoriser les cartes brutes produites par IA, qui constituent un produit intermédiaire lors de la fabrication de ce référentiel. «Ce projet s’inscrit dans la stratégie de l’IGN de diffuser des données en open data», souligne Boris Wattrelos, chef de projet numérique innovant à l’IGN. «Il ne s’agit pas du même type de carte, ni de la même utilisation finale, ajoute-t-il. Alors que la donnée OCS GE se suffit à elle-même, la donnée Cosia, qui est issue directement du traitement par IA, comporte encore pas mal de bruit et d’incertitudes et doit être consolidée avec d’autres informations.» Générées de manière 100% automatique, les cartes Cosia ont un coût de production peu élevé. Ce n’est d’ailleurs pas leur seul avantage. «Elles détectent tous les objets d’une taille supérieure à 1m2 et présentent une haute résolution spatiale de 20cm par pixel», souligne Boris Wattrelos. Ces cartes sont obtenues à partir d’un modèle numérique qui estime statistiquement l’appartenance de chaque pixel à une classe: il s’agit donc de cartes de prédiction, comportant des marges d’erreurs.
Les équipes de recherche de l’IGN ont développé un processus de production inédit, qui mobilise des technologies de traitement automatique par IA et s’appuie en particulier sur les capacités d’apprentissage profond (deep learning) d’algorithmes de type «réseaux de neurones» pour classifier les paysages selon seize genres de couverture du sol (bâtiment, surface d’eau, conifère ou feuillu, culture, broussaille, sol nu, zone imperméable, etc.). Des ortho-photographies couvrant 2500km2 à travers 63 départements ont d’abord été décrites manuellement pour générer un jeu de données annotées, qui a servi à entraîner des modèles numériques d’IA. On parle d’apprentissage supervisé, le modèle apprenant à exploiter les informations pertinentes pour prédire la probabilité d’appartenance de chaque pixel à l’une ou l’autre classe à partir de ces exemples annotés. Les chercheurs ont testé différents types d’architecture informatique de manière à obtenir des performances aussi proches que possible des annotations manuelles.
«Les compétences de l’IGN en termes d’intelligence artificielle ont bien progressé ces quatre dernières années et commencent à atteindre une certaine maturité, estime Boris Wattrelos. Nous en sommes à la version 1.2 du modèle utilisé et continuons en permanence à l’améliorer.» Les indicateurs de performances (métriques) fournis par l’GN montrent une détection globale de qualité satisfaisante, mais inégale selon la nature du couvert et les territoires. A l’échelle de la France, qui présente des paysages et des climats variés, une même classe sémantique peut en effet englober des caractéristiques de forme, de couleur ou de géométrie très différentes, susceptibles d’altérer les prédictions. Les zones cultivées, par exemple, n’offrent pas le même visage au nord et au sud du pays. Des changements saisonniers affectent aussi l’apparence de la végétation. Certains objets peu représentés peuvent aussi être plus difficiles à détecter.
Un exemple de carte Cosia. © IGN
Des classes supplémentaires pour l’outre-mer
L’institut a mis en place les défis Flair (French land cover from aerospace imagery), qui ont fait appel aux experts scientifiques pour optimiser le modèle numérique, quels que soient la zone géographique et la date de prise de vue aérienne. «Aujourd’hui, on arrive à 98% de bonne détection pour le bâti. En revanche, le sol nu n’est pas encore très bien détecté. Les galets, le sable ou les routes non pavées sont notamment sources de confusion», note le chef de projet. La neige ou les serres peuvent aussi être mal interprétées. L’incorporation de nouvelles données constitue une autre voie d’amélioration du modèle numérique. «Il fonctionne bien sur les données satellitaires Spot et Pléiades Neo. La fusion des prises de vues aériennes et de l’imagerie haute résolution Sentinel-2 constitue aussi une mise intéressante.» Des classes supplémentaires (bananeraies, canne à sucre) pourraient aussi être créées pour les outre-mer.
L’IGN teste les données Cosia pour produire des cartographies de la nature en ville pour le compte de la Direction générale de l’aménagement, du logement et de la nature (Dgaln). Suffisamment fines pour permettre la détection d’arbres isolés, elles offrent en outre une représentation des zones herbacées, ce qui constitue un autre avantage. En revanche, elles ne permettent pas de connaître la nature du sol sous la canopée. D’ores et déjà, ces données ouvertes sont aussi proposées aux utilisateurs des services de l’IGN. A eux d’en inventer l’usage! «Quarante-six départements sont déjà couverts, précise Boris Wattrelos. Les données raster initiales sont vectorisées au pixel (20cm x 20cm) et simplifiées au mètre pour être moins lourdes à traiter et à télécharger.» D’ici à fin 2024, ces cartes devraient être disponibles sur l’ensemble de la France.
«La plupart des agences d’urbanisme dans les départements test ont eu accès à la base Cosia en avant-première, courant 2023. Le but était de la tester, de la comparer avec nos référentiels locaux et de faire un retour à l’IGN», indique Antoine Chameau, assistant d’études foncière au sein de l’agence d’urbanisme Brest-Bretagne (Adeupa). Il souligne le caractère inédit de cette cartographie exhaustive et précise, uniforme sur le territoire national, qui donne accès à l’état de l’imperméabilisation des sols au niveau infra-parcellaire, y compris dans les espaces privés et les jardins. «Malgré quelques erreurs, la classification est précise et homogène», remarque-t-il. La plupart de ces erreurs se sont d’ailleurs avérées relativement faciles à corriger à l’aide de la BD Topo, de la BD Carto ou encore des données RPG de l’IGN. L’effet canopée ou les zones floutées sur les orthophotographies de la base militaire de Brest ont toutefois donné du fil à retordre aux spécialistes. «Mais, au final, le processus de correction n’est pas plus chronophage que le traitement d’autres données tout aussi conséquentes comme les fichiers fonciers ou la base Sirene!»
Un outil pour les documents d’urbanisme
«Au départ, c’était la possibilité d’accéder à des données sur la nature et le revêtement de sol en milieu urbain avec une récurrence de mise à jour qui nous intéressait», ajoute Antoine Chameau. Les cartes Cosia, qui seront actualisées tous les trois ans pour un même département, peuvent constituer des données d’entrée d’aide à la décision précieuses pour les études de renouvellement urbain et de nature en ville, ou encore pour la construction d’indicateurs de végétation ou d’imperméabilisation. En croisant les données avec le MOS (mode d’occupation du sol) foncier, l’Adeupa a par exemple produit une analyse détaillée de l’état d’imperméabilisation des unités foncières hors voirie en zone d’activité. «Nous allons poursuivre le travail sur la carte des paysages et utiliser ces données pour des analyses de l’espace urbain destinées à la réalisation des documents d’urbanisme (artificialisation, végétation, état de l’espace public, etc.).»
Les données Cosia pourraient également nourrir des études sur les îlots de chaleur ou la densité foncières, réalisées en interne ou en maîtrise d’œuvre par les collectivités territoriales. Des usages sont aussi envisageables en milieu rural, par exemple pour la mise en place de la trame verte et bleue. En Ille-et-Vilaine, l’IGN a aussi entrepris le suivi des haies et des bocages à partir des classes conifère, feuillu et broussaille. «Il semblerait que seuls les services SIG connaissent cette donnée, ce qui limite son utilisation aux collectivités ayant ces compétences en interne», estime Antoine Chameau. Toutefois, la notoriété des cartes Cosia progresse. «En 2024, il y avait déjà eu 811 visites en ligne sur le démonstrateur mi-février, contre seulement 1033 pour l’ensemble de l’année 2023», constate Boris Wattrelos.
Cosia en 8 étapes
1 Prises de vues aériennes
Les données ortho issues des prises de vues aériennes couvrent un tiers des départements chaque année.
2 Annotation du territoire
A partir des données ortho, on crée des groupes de pixels dont les couleurs sont proches (segmentation d’images) et on assigne manuellement à chaque groupe l’une des 16 classes de couverture du sol.
3 Génération d’un jeu de données
Les annotations au format raster sont regroupées avec les informations de la BD Ortho RVB IR, du MNT et du MNS pour obtenir un jeu de données.
4 Conception d’un modèle d’intelligence artificielle
Le modèle numérique, qui comporte un ensemble de règles, utilise l’intelligence artificielle et des méthodes d’apprentissage profond pour reconnaître automatiquement des objets sur un jeu de données.
5 Entraînement du modèle
Le modèle prédit pour chaque pixel du jeu de données la probabilité qu’il appartienne à chacune des classes. Il s’entraîne en testant et en affinant un très grand nombre de paramètres, jusqu’à produire un résultat au plus proche des annotations.
6 Inférence France entière
Le modèle paramétré est appliqué sur l’ensemble de la France. Le pourcentage le plus élevé détermine dans chaque cas la classe du pixel.
7 Vectorisation
Les cartes de de prédiction sous format raster, sont simplifiées et vectorisées (suppression des pixels isolés et lissage des contours des polygones). Ce qui réduit fortement le poids de la donnée.
8 Mise à diposition
Cosia est disponible depuis les sites de l’IGN. La donnée millésimée est mise à jour tous les trois ans pour un même département.