Beltaief, Student Nader (2019) Gestion des ressources radio par la programmation dynamique et par l'apprentissage par renforcement PRE - Projet de recherche, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
928Kb

Résumé

Grâce à la technologie DTM (Mode de transfert Dual) différents types d'appels et de sessions de données peuvent être établis par les terminaux. En effet, une cellule équipée d’un DTM peut transférer avec les mêmes ressources des appels vocaux et des sessions de données à plein débit et à demi débit. Dans le cadre de ce projet, on se propose de discuter la possibilité de transformer de façon optimale certaines utilisations à plein débit, que ce soit des appels ou des sessions de données, en utilisations à demi débit afin d’éviter les saturations. Ce problème de contrôle sera modélisé par un processus de décision Markovien (MDP) en définissant un système de récompense adapté. On essayera par la suite de déterminer la politique optimale associée à ce MDP par la programmation dynamique et on évaluera la performance de cette stratégie et sa capacité à minimiser le pourcentage d'appels perdus. Par ailleurs, étant applicables sur des situations plus sophistiquées, contrairement à la programmation dynamique, on essayera également d'appliquer des méthodes d'apprentissage par renforcement (Reinforcement Learning) dans la recherche d'une politique optimale, pour les tester et savoir s'il serait utile de les employer dans le cadre d'autres problèmes de télécommunications plus complexes.

Type de document:Rapport ou mémoire (PRE - Projet de recherche)
Sujets:Mathématiques et leurs applications
Code ID :7564
Déposé par :Nader Beltaief
Déposé le :09 juin 2021 15:00
Dernière modification:09 juin 2021 15:00

Modifier les métadonnées de ce document.