Bouguila, M. Khaled (2024) modélisation générative conditionnelle pour la transformation de layout PFE - Projet de fin d'études, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
6Mb

Résumé

Ce rapport présente le travail réalisé lors d’un stage de recherche chez Criteo, axé sur la modélisation générative conditionnelle pour la transformation de layout, une tâche novatrice dans le domaine de la traduction d’images. Les modèles tradition￾nels, tels que CycleGAN, rencontrent souvent des difficultés face à des différences significatives de mise en page entre les images d’entrée et de sortie, car ils tendent à converger vers des correspondances qui conservent des structures globales similaires. Ce travail explore des méthodes pour surmonter ce défi en utilisant des modèles génératifs de pointe, à savoir les modèles de diffusion et MaskGIT. Pour aborder la transformation de layout, l’étude introduit des approches novatrices, notamment la création d’un jeu de données synthétique et d’une nouvelle métrique d’évaluation adaptée à cette tâche. À travers des expériences approfondies et des améliorations architecturales, les résultats montrent à la fois les forces et les limites des modèles actuels, en proposant de nouvelles pistes pour la conception d’espaces latents afin de mieux gérer des mises en page diverses. Ce travail pose ainsi les bases de futures recherches visant à améliorer les modèles génératifs pour des transformations de layout.

Type de document:Rapport ou mémoire (PFE - Projet de fin d'études)
Mots-clés libres:Modélisation générative conditionnelle, Transformation de layout, Traduction d’images, Modèles de diffusion, MaskGIT, IA générative, Conception d’espace latent
Sujets:Mathématiques et leurs applications
Code ID :10432
Déposé par :Khaled BOUGUILA
Déposé le :11 oct. 2024 19:50
Dernière modification:11 oct. 2024 19:50

Modifier les métadonnées de ce document.