BEAUDOUIN, M Ulysse (2025) Modèles multimodaux séquence–structure pour la génération contrôlée de protéines PFE - Projet de fin d'études, ENSTA.
Fichier(s) associé(s) à ce document :
| PDF 3944Kb |
Résumé
La conception de protéines repose sur la compréhension du lien entre séquence, structure et fonction. Les approches récentes basées uniquement sur la séquence négligent l’information tridimensionnelle qui conditionne le repliement et l’activité biologique. Dans ce projet, nous avons développé un modèle multimodal combinant données de séquence et de structure afin de générer des protéines de manière contrôlée. Notre architecture s’appuie sur un autoencodeur basé sur ProtT5, enrichi par des représen- tations structurales issues de prédictions ESMFold et encodées via un Geometric Vector Per- ceptron (GVP). Les représentations de séquence et de structure sont intégrées dans un espace latent commun, permettant d’explorer de nouvelles séquences tout en préservant la conservation du type sauvage. Une attention particulière a été portée au contrôle de cet espace latent : nous avons mis en œuvre des techniques de perturbation dirigée et un module de type Emb2Emb, permettant de moduler les propriétés des protéines (par exemple la stabilité, mesurée par le ddG). Nos résultats montrent que l’ajout d’information structurale améliore la qualité et la contrôlabilité de la génération par rapport aux modèles fondés uniquement sur la séquence. Ce travail contribue à établir une base pour le design de protéines guidé par la structure, ouvrant la voie à des applications concrètes en biotechnologie.
| Type de document: | Rapport ou mémoire (PFE - Projet de fin d'études) |
|---|---|
| Mots-clés libres: | conception de protéines, modélisation séquence-structure, génération contrôlée, modèles de langage protéiques, espace latent, ESMFold, Emb2Emb. |
| Sujets: | Mathématiques et leurs applications Sciences de la vie et ingénierie du vivant |
| Code ID : | 10927 |
| Déposé par : | Ulysse BEAUDOUIN |
| Déposé le : | 23 févr. 2026 11:39 |
| Dernière modification: | 23 févr. 2026 11:39 |