CAILLET, M. Alexandre (2021) Conception d’une base de données multimodale et adaptation de domaine PRE - Projet de recherche, ENSTA.
Fichier(s) associé(s) à ce document :
| PDF 3164Kb |
Résumé
L’adaptation de domaine est une branche de l’apprentissage automatique permettant d’entraîner un modèle sur des données pour lesquelles on dispose d’annotations (typique- ment des images synthétiques) et que ce modèle soit suffisamment robuste pour fonctionner sur un autre jeu de données similaires mais différentes (typiquement des images capturées dans le monde réel). L’entraînement se sert des deux jeux de données mais tout l’intérêt est qu’on ne dispose pas des étiquettes sur le deuxième jeu de données. Nous avons donc créer une base de données multimodale des rues de Paris et du sud de l’Île de France comprenant des images couleurs, infrarouges et de profondeur pour pouvoir tester des solutions d’adap- tation de domaine. En parallèle, nous avons travaillé sur une nouvelle technique d’adapta- tion de domaine qui permettra normalement d’améliorer l’état de l’art dans cette branche de l’apprentissage automatique. Cette technique est basée sur l’utilisation d’un GAN pour transférer les images du domaine source vers le domaine cible, puis d’un entraînement d’un modèle de segmentation sémantique grâce à des images issues d’un mélange des images du domaine source transférées et des images du domaine cible.
Type de document: | Rapport ou mémoire (PRE - Projet de recherche) |
---|---|
Mots-clés libres: | Deep learning, Adaptation de domaine, GAN, Segmentation sémantique, Images infra- rouges |
Sujets: | Sciences et technologies de l'information et de la communication |
Code ID : | 8477 |
Déposé par : | alexandre Caillet |
Déposé le : | 16 mars 2022 16:56 |
Dernière modification: | 16 mars 2022 16:56 |