POTEL, M. Pierre (2023) Stylebot: Learning to imitate diverse human behaviors through offline reinforcement learning. PFE - Projet de fin d'études, ENSTA.

Fichier(s) associé(s) à ce document :

[img]PDF
Restricted to Administrateur de l'archive uniquement

614Kb

Résumé

Le but de ce rapport est de présenter le problème de l’apprentissage par imitation de style, c’est-à-dire apprendre to capture la diversité des comportements présents dans un jeu de données de manière non supervisée tout en apprenant à les régénérer. Deux approches sont proposées pour résoudre ce problème, une fondée sur les autoencodeurs variationnels et une fondée sur les transformeurs de décision.

Type de document:Rapport ou mémoire (PFE - Projet de fin d'études)
Mots-clés libres:Apprentissage par renforcement, apprentissage par renforcement hors ligne, inférence variationnelle, apprentissage profond, modèles génératifs
Sujets:Sciences et technologies de l'information et de la communication
Mathématiques et leurs applications
Code ID :9881
Déposé par :Pierre Potel
Déposé le :14 nov. 2023 14:46
Dernière modification:14 nov. 2023 14:46

Modifier les métadonnées de ce document.