QUONIAM-BARRE, M. Valentin (2023) Etude de dictionnaires visuels à l'aide de modèles génératifs profonds PRE - Projet de recherche, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
1022Kb

Résumé

Les modèles génératifs profonds tels que les GANs (Réseau Génératif Antagonistes) et les modèles de diffusion (DDPMs) ont atteint un niveau de réalisme impressionnant pour la génération d'images. Ces méthodes récentes, notamment les modèles de diffusion, montrent des propriétés de composition prometteuses, c'est-à-dire la capacité à combiner différents éléments pour créer des images. Le but du stage est de s'intéresser à l'utilisation de ces modèles génératifs pour découvrir des "dictionnaires visuels" de manière non supervisée. L'objectif est double : premièrement, découvrir les motifs visuels qui sont présents dans les images étudiées, et deuxièmement, évaluer la capacité de contrôler le processus de génération en utilisant ces motifs. Pour mener à bien cette recherche, il est nécessaire de commencer par étudier des images simples, telles que celles de céramiques d'Iznik qui présentent des motifs bien distincts et facilement visibles. En explorant comment les modèles génératifs intègrent ces motifs dans leur représentation latente, nous chercherons à mieux comprendre comment les informations visuelles sont organisées et manipulées pour générer de nouvelles images de manière contrôlée. Le dataset et le code peuvent être trouvés ici : https://github.com/Valquoniam/Iznik-Pottery--Imagine

Type de document:Rapport ou mémoire (PRE - Projet de recherche)
Mots-clés libres:Réseau Génératif Antagoniste,Modèle de Diffusion, Espace latent, Tuiles d’Iznik
Sujets:Sciences et technologies de l'information et de la communication
Code ID :9237
Déposé par :Valentin QUONIAM-BARRÉ
Déposé le :25 août 2023 14:02
Dernière modification:25 août 2023 14:02

Modifier les métadonnées de ce document.