POTEL, M. Pierre (2023) Stylebot: Learning to imitate diverse human behaviors through offline reinforcement learning. PFE - Projet de fin d'études, ENSTA.
Fichier(s) associé(s) à ce document :
| PDF Restricted to Administrateur de l'archive uniquement 614Kb |
Résumé
Le but de ce rapport est de présenter le problème de l’apprentissage par imitation de style, c’est-à-dire apprendre to capture la diversité des comportements présents dans un jeu de données de manière non supervisée tout en apprenant à les régénérer. Deux approches sont proposées pour résoudre ce problème, une fondée sur les autoencodeurs variationnels et une fondée sur les transformeurs de décision.
| Type de document: | Rapport ou mémoire (PFE - Projet de fin d'études) |
|---|---|
| Mots-clés libres: | Apprentissage par renforcement, apprentissage par renforcement hors ligne, inférence variationnelle, apprentissage profond, modèles génératifs |
| Sujets: | Sciences et technologies de l'information et de la communication Mathématiques et leurs applications |
| Code ID : | 9881 |
| Déposé par : | Pierre Potel |
| Déposé le : | 14 nov. 2023 14:46 |
| Dernière modification: | 14 nov. 2023 14:46 |