Un nouveau modèle informatique baptisé RingMo a été mis au point pour améliorer la précision de l’interprétation des images de télédétection.
C’est ce qu’indique l’Institut de recherche sur l’information aérospatiale (AIR) de l’Académie chinoise des sciences (CAS).
L’étude intitulée « RingMo : A Remote Sensing Foundation Model with Masked Image Modeling » a été publiée dans IEEE Transactions on Geoscience and Remote Sensing.
Images de télédétection
Les images de télédétection sont utilisées dans de nombreux domaines tels que la classification et la détection des changements. Par ailleurs, les approches d’apprentissage profond ont contribué au développement rapide de l’interprétation des images de télédétection. Le paradigme d’apprentissage le plus répandu consiste à utiliser les modèles pré-entraînés d’ImageNet pour traiter les données de télédétection pour des tâches spécifiques.
Cependant, il existe des problèmes tels que l’écart de domaine entre les scènes naturelles et de télédétection, et la faible capacité de généralisation des modèles de télédétection. Il est donc nécessaire de développer un modèle de base avec une représentation générale des caractéristiques de télédétection. Puisqu’une grande quantité de données non étiquetées est disponible, la méthode auto-supervisée est meilleure que la méthode entièrement supervisée en télédétection.
Caractéristiques de RingMo
L’étude vise à proposer un cadre de modèle de base de télédétection, qui peut tirer parti des avantages de l’apprentissage génératif auto-supervisé pour les images de télédétection. RingMo est un ensemble de données à grande échelle construit en collectant deux millions d’images de télédétection provenant de plates-formes satellitaires et aériennes, couvrant de multiples scènes et objets dans le monde entier. En outre, la méthode de formation du modèle de base de télédétection est conçue pour les objets denses et petits dans des scènes de télédétection complexes.
RingMo est le premier modèle de base génératif pour les données de télédétection multimodales. À l’avenir, ce modèle pourra être appliqué à la reconstruction 3D, à la construction résidentielle, au transport, à la conservation de l’eau, à la protection de l’environnement et à d’autres domaines.
Ce rapport a été publié pour la première fois par le CAS.