Stylebot: Learning to imitate diverse human behaviors through offline reinforcement learning. - ENSTA

POTEL, M. Pierre (2023) Stylebot: Learning to imitate diverse human behaviors through offline reinforcement learning. PFE - Projet de fin d'études, ENSTA.

Fichier(s) associé(s) à ce document :

PDF
Restricted to Administrateur de l'archive uniquement
614Kb

Résumé

Le but de ce rapport est de présenter le problème de l’apprentissage par imitation de style, c’est-à-dire apprendre to capture la diversité des comportements présents dans un jeu de données de manière non supervisée tout en apprenant à les régénérer. Deux approches sont proposées pour résoudre ce problème, une fondée sur les autoencodeurs variationnels et une fondée sur les transformeurs de décision.

Type de document:	Rapport ou mémoire (PFE - Projet de fin d'études)
Mots-clés libres:	Apprentissage par renforcement, apprentissage par renforcement hors ligne, inférence variationnelle, apprentissage profond, modèles génératifs
Sujets:	Sciences et technologies de l'information et de la communication Mathématiques et leurs applications
Code ID :	9881
Déposé par :	Pierre Potel
Déposé le :	14 nov. 2023 14:46
Dernière modification:	14 nov. 2023 14:46

Modifier les métadonnées de ce document.

École Nationale Supérieure de Techniques Avancées

Résumé

École Nationale Supérieure de
Techniques Avancées