ZGUERGUER, Amen Allah (2024) Building a large music dataset from existing datasets PRE - Projet de recherche, ENSTA.

Aucun fichier n'a encore été téléchargé pour ce document.

Résumé

La génération automatique des descriptions musicales est une tâche spécialisée dans le domaine de la recherche d’informations musicales qui consiste à générer un texte descriptif ressemblant à celui d’un humain pour un morceau musical. L’entraînement des modèles de génération automatique des descriptions musicales nécessite une grande quantité de données annotées de haute qualité, qui sont souvent rares. L’objectif de mon stage est de remédier à cette pénurie de données pour cette tâche en créant un grand ensemble de données musicales qui contient des paires musique-texte. Cet ensemble de données est construit à partir d’ensembles de données de balisage de musique existants, en exploitant une approche d’étiquette à description à l’aide d’un grand modèle de langage, Mistral. Nous avons procédé à une évaluation objective des descriptions générées à l’aide de métriques appropriées et notre méthode a obtenu de meilleurs résultats que d’autres méthodes.

Type de document:Rapport ou mémoire (PRE - Projet de recherche)
Mots-clés libres:Music captioning, Music Information Retrieval, Music Dataset, Music auto- tagging, Large Language Model, Metrics
Sujets:Sciences et technologies de l'information et de la communication
Code ID :10081
Déposé par :Amen allah ZGUERGUER
Déposé le :02 sept. 2024 18:03
Dernière modification:02 sept. 2024 18:03

Modifier les métadonnées de ce document.