Intelligence artificielle

Le défi IA des villes ouvertes

Le défi IA des villes ouvertes


Il existe maintenant une abondance croissante de données cartographiques ouvertes validées localement et d'images de drones haute résolution dans divers environnements construits. Comment pourrions-nous au mieux surmonter ces obstacles et améliorer l'état des pratiques en matière d'apprentissage automatique pour soutenir la cartographie du développement urbain et la réduction des risques pour les villes africaines?

Base de données

En collaboration avec les partenaires Azavea et DrivenData, l'équipe des laboratoires du GFDRR a combiné l'excellent travail de nombreuses communautés de cartographie participative à travers l'Afrique, appliqué les meilleures pratiques dans le traitement des données géospatiales natives du cloud (c'est-à-dire en utilisant des GeoTIFF optimisés pour le cloud) [COG] et catalogues d'actifs spatio-temporels [STAC]) et normalisés dans la mesure du possible pour rendre les données plus facilement utilisables pour l'apprentissage automatique. Le résultat est un nouvel ensemble de données ouvert et complet de plus de 790 000 empreintes de bâtiments et 400 kilomètres carrés d'images de drones représentant 10 zones urbaines africaines diverses sous forme de ML.

Comparaison des empreintes de bâtiments étiquetées à la main superposées à des images de drones pour 10 zones urbaines africaines incluses dans l'ensemble de données de formation Challenge.

L'utilisation de COG et STAC pour les données géospatiales nous offre un accès efficace, rapide et interrogeable à la bande passante à nos images et étiquettes dans un format normalisé. La facilité d'accès aux fichiers et l'indexation des catalogues de données sont particulièrement importantes pour les données géospatiales qui peuvent atteindre rapidement des centaines de gigaoctets. Cela nous permet également d'exploiter l'écosystème croissant des outils COG et STAC, comme le navigateur STAC, pour visualiser rapidement et accéder à tout élément de données de formation dans un navigateur Web, malgré le fait que les fichiers d'image individuels peuvent atteindre plusieurs Go et que l'ensemble de données totalise plus de 70 Go. en taille:

Démonstration animée de l'utilisation du navigateur STAC pour visualiser les collections de données et les ressources de la formation Challenge.

PySTAC, une nouvelle bibliothèque Python d'Azavea, permet aux utilisateurs STAC de charger, parcourir, accéder et manipuler des données dans les catalogues par programme. Par exemple, en lisant un catalogue STAC:

train1_cat = Catalog.from_file ('https://drivendata-competition-building-segmentation.s3-us-west-1.amazonaws.com/train_tier_1/catalog.json') 
train1_cat.describe ()
*
*
*
*
*
*
*
*
*
*
*
*
...

Inspection des métadonnées d'un élément:

one_item = train1_cat.get_child (id = 'acc'). get_item (id = 'ca041a')
one_item.to_dict ()
{
"les atouts": {
"image": {
"href": "https://drivendata-competition-building-segmentation.s3-us-west-1.amazonaws.com/train_tier_1/acc/ca041a/ca041a.tif",
"title": "GeoTIFF",
"type": "image / tiff; application = géotiff; profil = optimisé pour le cloud"
}
},
"bbox":[[
-0,22707525357332697,
5.585527399115482,
-0.20581415249279408,
5.610742610987594
],
"collection": "acc",
"géométrie": {
"coordonnées":[[
[[
[[
-0,2260939759101167,
5.607821019807083
],
...
[[
-0,2260939759101167,
5.607821019807083
]
]
],
"type": "Polygone"
},
"id": "ca041a",
"liens":[[
{
"href": "../collection.json",
"rel": "collection",
"type": "application / json"
},
{
"href": "https://drivendata-competition-building-segmentation.s3-us-west-1.amazonaws.com/train_tier_1/acc/ca041a/ca041a.json",
"rel": "self",
"type": "application / json"
},
{
"href": "../../catalog.json",
"rel": "root",
"type": "application / json"
},
{
"href": "../collection.json",
"rel": "parent",
"type": "application / json"
}
],
"Propriétés": {
"zone": "acc",
"datetime": "2018-11-12 00: 00: 00Z",
"licence": "CC BY 4.0"
},
"stac_version": "0.8.1",
"type": "Fonction"
}

En savoir plus sur l'ensemble de données et les ressources STAC.

Compétition

Accompagner l'ensemble de données est un défi concurrentiel d'apprentissage automatique avec 15000 $ au total pour encourager les experts ML à l'échelle mondiale à développer des solutions open source plus précises, pertinentes et facilement utilisables pour soutenir la cartographie dans les villes africaines. Il y a 2 pistes de participation:

Piste de segmentation sémantique: 12 000 $ en prix pour les meilleurs modèles de segmentation sémantique open-source pour cartographier les empreintes de construction à partir d'images aériennes.

L'objectif de l'apprentissage automatique est de segmenter (classer) chaque pixel de chaque image en bâtiment ou sans bâtiment, les performances du modèle étant évaluées avec la métrique Intersection-over-Union (aka Jaccard Index):

La segmentation sémantique est utile pour la cartographie car ses sorties au niveau des pixels sont relativement faciles à interpréter visuellement, à vérifier et à utiliser telles quelles (par exemple dans le calcul de la surface bâtie) ou comme entrées pour les étapes en aval (par exemple, les bâtiments du premier segment et classer ensuite les attributs de chaque bâtiment segmenté, comme son état de construction ou le matériau du toit).

Les participants à la piste de segmentation doivent également soumettre au moins une fois à la piste IA responsable pour se qualifier pour 12 000 $ en prix de piste de segmentation.

Afficher plus

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer