CHAMPEIL, M. Nathan (2024) Attaques par Inférence d’Appartenance contre les Grands Modèles de Langage- Membership Inference Attacks against Large Language Models PRE - Projet de recherche, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
937Kb

Résumé

Le développement récent des grands modèles de langage pose des questions légales quant au respect du droit d’auteur. Les attaques par inférence d’appartenance pourraient être un moyen de trancher les procès en cours. Nous étudions le jeu de données utilisé par un article semblant avoir des résultats prometteurs en la matière, et nous montrons que celui-ci comporte des biais statistiques, que ces biais faussent les résultats de mesure, et qu’il est difficile d’éliminer les biais a posteriori.

Type de document:Rapport ou mémoire (PRE - Projet de recherche)
Mots-clés libres:Grand Modèle de Langage, Attaque par Inférence d’Appartenance, Jeu de Données, Biais
Sujets:Sciences et technologies de l'information et de la communication
Code ID :10266
Déposé par :M Nathan CHAMPEIL
Déposé le :09 sept. 2024 14:22
Dernière modification:09 sept. 2024 14:22

Modifier les métadonnées de ce document.