Burthier, Mr Quentin (2021) Traduction Automatique de Contenu Généré par les Utilisateurs PFE - Projet de fin d'études, ENSTA.
Fichier(s) associé(s) à ce document :
| PDF 1001Kb |
Résumé
La traduction automatique parvient, pour certaines paires de langues, à traduire correctement des textes écrits dans un langage conventionnel. Cependant, de nombreux textes produits par les utilisateurs de forums ou de réseaux sociaux ne sont pas écrits dans cette forme conventionnelle du langage, et les systèmes de traduction échouent à les traduire correctement. Dans ce rapport, nous décrivons les propriétés textes, appelés contenu généré par les utilisateurs (CGU). et présentons l'état de l'art de la tâche de rendre les systèmes de traduction automatique robustes aux phénomènes linguistiques présents dans le CGU. Nous menons ensuite des expériences montrant les difficultés que les systèmes de traduction automatique éprouvent avec le CGU. Enfin, nous montrons empiriquement que segmenter le texte en caractères – plutôt qu'en unités contenant plusieurs caractères – rend les systèmes de traduction automatique plus robustes à certains phénomènes présents dans le CGU.
Type de document: | Rapport ou mémoire (PFE - Projet de fin d'études) |
---|---|
Sujets: | Mathématiques et leurs applications |
Code ID : | 8353 |
Déposé par : | Quentin Burthier |
Déposé le : | 26 janv. 2021 16:36 |
Dernière modification: | 26 janv. 2021 16:36 |