BEN NOOMEN, M. Mohamed Salim (2025) Modèles génératifs de diffusion : approche probabiliste, mémoire et processus à sauts PRE - Projet de recherche, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
2836Kb

Résumé

Ce rapport explore les fondements théoriques et les extensions des modèles génératifs de diffusion, utilisés pour la génération d’images à partir de bruit aléatoire. Après avoir introduit le principe forward–backward basé sur les équations différentielles stochastiques et la fonction de score, l’étude débute par l’analyse détaillée du processus d’Ornstein–Uhlenbeck, qui sert de modèle test gaussien. On y établit explicitement les propriétés statistiques, la loi stationnaire et l’équation backward exacte. Afin de dépasser les limites du bruit gaussien, le rapport introduit ensuite des modèles à mémoire, en considérant d’abord le mouvement brownien fractionnaire puis le drap brownien. Ces approches permettent de capturer des corrélations temporelles et spatio-temporelles, mieux adaptées à la structure des images, et offrent des formulations analytiques et des simulations numériques illustrant la cohérence du cadre. La partie suivante se concentre sur les processus de Lévy, qui généralisent le brownien en autorisant des sauts et des queues lourdes. L’exemple du processus de type Ornstein–Uhlenbeck avec sauts stables tronqués met en évidence l’existence d’une loi stationnaire, la divergence des moments d’ordre deux et la régularité assurée par le calcul de Malliavin. La dynamique backward obtenue montre l’apparition d’un terme de score enrichi, ouvrant la voie à des adaptations concrètes des modèles de génération au-delà du cadre gaussien classique. Enfin, le rapport replace ces développements théoriques dans une réflexion critique sur le contraste entre la richesse de la théorie stochastique et la pratique empirique dominante en intelligence artificielle. Alors que l’industrie privilégie l’efficacité computationnelle et l’expérimentation massive, la théorie reste essentielle pour garantir la rigueur, l’intelligibilité et la dimension éthique des modèles. Cette articulation souligne la nécessité de maintenir vivante la recherche théorique pour concevoir des modèles de génération plus réalistes, transparents et responsables.

Type de document:Rapport ou mémoire (PRE - Projet de recherche)
Mots-clés libres:modèles génératifs de diffusion, équations différentielles stochastiques, processus d’Ornstein–Uhlenbeck, brownien fractionnaire, drap brownien, processus de Lévy, score matching, intelligence artificielle.
Sujets:Sciences et technologies de l'information et de la communication
Mathématiques et leurs applications
Code ID :10588
Déposé par :Mohamed salim BEN NOOMEN
Déposé le :22 août 2025 11:27
Dernière modification:22 août 2025 11:27

Modifier les métadonnées de ce document.