CHOR, M. Maxime (2018) Apprentissage de Représentation Multimodale PRE - Projet de recherche, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
1843Kb

Résumé

Aujourd’hui, avec les progrès remarquables des technologies de traitement des activités quotidiennes, la parole, les émotions et le langage, y compris l’expression du visage, ont élargi l’interaction des données multimodales entre les humains et les ordinateurs. L’interface d’interaction homme-machine joue un rôle important dans notre vie quotidienne. Ce travail se concentre sur une nouvelle application de deep learning pour apprendre la représentation de features en utilisant plusieurs modalités. Nous présentons différentes expérimentations et montrons comment former un réseau de neurones profond pour apprendre une bonne représentation de plusieurs modalités en utilisant un deep auto-encodeur. Nos résultats expérimentaux sont validés sur le jeu de données RECOLA du challenge de recherche AVEC 2015 sur la reconnaissance des émotions et prouvent que la méthode proposée est efficace et robuste pour produire une représentation partagée intéressante.

Type de document:Rapport ou mémoire (PRE - Projet de recherche)
Sujets:Sciences et technologies de l'information et de la communication
Code ID :7150
Déposé par :Maxime Chor
Déposé le :12 juin 2019 11:04
Dernière modification:12 juin 2019 11:04

Modifier les métadonnées de ce document.