Attaques par Inférence d’Appartenance contre les Grands Modèles de Langage- Membership Inference Attacks against Large Language Models - ENSTA

CHAMPEIL, M. Nathan (2024) Attaques par Inférence d’Appartenance contre les Grands Modèles de Langage- Membership Inference Attacks against Large Language Models PRE - Projet de recherche, ENSTA.

Fichier(s) associé(s) à ce document :

Prévisualisation

PDF
937Kb

Résumé

Le développement récent des grands modèles de langage pose des questions légales quant au respect du droit d’auteur. Les attaques par inférence d’appartenance pourraient être un moyen de trancher les procès en cours. Nous étudions le jeu de données utilisé par un article semblant avoir des résultats prometteurs en la matière, et nous montrons que celui-ci comporte des biais statistiques, que ces biais faussent les résultats de mesure, et qu’il est difficile d’éliminer les biais a posteriori.

Type de document:	Rapport ou mémoire (PRE - Projet de recherche)
Mots-clés libres:	Grand Modèle de Langage, Attaque par Inférence d’Appartenance, Jeu de Données, Biais
Sujets:	Sciences et technologies de l'information et de la communication
Code ID :	10266
Déposé par :	M Nathan CHAMPEIL
Déposé le :	09 sept. 2024 14:22
Dernière modification:	09 sept. 2024 14:22

Modifier les métadonnées de ce document.

École Nationale Supérieure de Techniques Avancées

Résumé

École Nationale Supérieure de
Techniques Avancées