POTEL, M. Pierre (2023) Stylebot: Learning to imitate diverse human behaviors through offline reinforcement learning. PFE - Projet de fin d'études, ENSTA.
Fichier(s) associé(s) à ce document :
PDF Restricted to Administrateur de l'archive uniquement 614Kb |
Résumé
Le but de ce rapport est de présenter le problème de l’apprentissage par imitation de style, c’est-à-dire apprendre to capture la diversité des comportements présents dans un jeu de données de manière non supervisée tout en apprenant à les régénérer. Deux approches sont proposées pour résoudre ce problème, une fondée sur les autoencodeurs variationnels et une fondée sur les transformeurs de décision.
Type de document: | Rapport ou mémoire (PFE - Projet de fin d'études) |
---|---|
Mots-clés libres: | Apprentissage par renforcement, apprentissage par renforcement hors ligne, inférence variationnelle, apprentissage profond, modèles génératifs |
Sujets: | Sciences et technologies de l'information et de la communication Mathématiques et leurs applications |
Code ID : | 9881 |
Déposé par : | Pierre Potel |
Déposé le : | 14 nov. 2023 14:46 |
Dernière modification: | 14 nov. 2023 14:46 |