COSTA WERNECK, M. André (2024) Tirer parti de l'apprentissage automatique pour les soins de santé : Une étude sur les encodages de codes médicaux PFE - Projet de fin d'études, ENSTA.

Fichier(s) associé(s) à ce document :

[img]
Prévisualisation
PDF
4074Kb

Résumé

Dans ce travail, nous avons cherché à améliorer les approches locales existantes utilisées chez Qantev pour analyser la cohérence des codes ICD en développant un modèle d'embedding général bas sur l'apprentissage contrastif. Ce modèle visait à capturer les relations entre les codes ICD et les appliquer à des cas d'usage comme la détection de fraude (principalement) et l'analyse du parcours patient, améliorant ainsi les méthodes spécifiques aux clients déjà en place. Nous avons abordé le problème comme une tâche de classification, en utilisant la précision, le rappel et le score F1 pour évaluer les performances, et en analysant également les distributions de similarité sur les données de validation pour évaluer l'impact de l'apprentissage. Bien que le modèle ait appris efficacement les relations structurelles et sémantiques entre les codes ICD, ses performances ont eu du mal à se généraliser à divers ensembles de données cliniques et clients en raison des différences importantes entre les données d'entraînement et les données cliniques. Cette disparité a limité la capacité du modèle à remplacer l'analyse locale. Nous avons conclu que bien que le modèle soit prometteur, il ne peut actuellement pas surpasser les méthodes spécifiques aux clients. Cependant, avec des données meilleures et plus représentatives, il a le potentiel d'améliorer la détection de la fraude et l'optimisation des soins aux patients. Les travaux futurs se concentreront sur l'amélioration du modèle et l'exploration de nouvelles stratégies, telles que le renforcement des relations croisées entre les codes de diagnostic et de procédure.

Type de document:Rapport ou mémoire (PFE - Projet de fin d'études)
Mots-clés libres:Codes ICD, Modèle d'embedding général, Détection de fraude, Analyse de cohérence, Tâche de classification, Amélioration des approches locales, Apprentissage contrastif
Sujets:Sciences et technologies de l'information et de la communication
Code ID :10398
Déposé par :André COSTA WERNECK
Déposé le :30 oct. 2024 11:56
Dernière modification:30 oct. 2024 11:56

Modifier les métadonnées de ce document.