Burthier, Mr Quentin (2021) Traduction Automatique de Contenu Généré par les Utilisateurs PFE - Projet de fin d'études, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
1001Kb

Résumé

La traduction automatique parvient, pour certaines paires de langues, à traduire correctement des textes écrits dans un langage conventionnel. Cependant, de nombreux textes produits par les utilisateurs de forums ou de réseaux sociaux ne sont pas écrits dans cette forme conventionnelle du langage, et les systèmes de traduction échouent à les traduire correctement. Dans ce rapport, nous décrivons les propriétés textes, appelés contenu généré par les utilisateurs (CGU). et présentons l'état de l'art de la tâche de rendre les systèmes de traduction automatique robustes aux phénomènes linguistiques présents dans le CGU. Nous menons ensuite des expériences montrant les difficultés que les systèmes de traduction automatique éprouvent avec le CGU. Enfin, nous montrons empiriquement que segmenter le texte en caractères – plutôt qu'en unités contenant plusieurs caractères – rend les systèmes de traduction automatique plus robustes à certains phénomènes présents dans le CGU.

Type de document:Rapport ou mémoire (PFE - Projet de fin d'études)
Sujets:Mathématiques et leurs applications
Code ID :8353
Déposé par :Quentin Burthier
Déposé le :26 janv. 2021 16:36
Dernière modification:26 janv. 2021 16:36

Modifier les métadonnées de ce document.