Apprentissage par renforcement

en collaboration avec S. Allassonnière, R. Besson, F. Logé-Munerel, T. Levent, P. Clavier, H. Castel, E. Hyon et O. Forghieri

Avec S. Allassonnière et R. Besson, nous avons travaillé sur une optimisation d’arbre de décision pour accélerer la détection des anomalies foetales. Cet outil combine un modèle expert avec assimiliation de données et apprentissage par renforcement. Il est maintenant exploité par Sonio.

Avec F. Logé-Munerel, nous avons utilisé une idée similaire pour optimiser des questionnaires de santé et appliqué de l’apprentissage par renforcement pour contrôler des pompes à insuline.

Avec T. Levent, nous avons montré comment utiliser de l’apprentissage par renfocement pour optimiser un mix énergétique.

Avec S. Allassonnière et P. Clavier, nous travaillons sur des versions robustes de l’apprentissage par renforcement et leur application à des parcours de soins.

Avec H. Castel, E. Hyon et O. Forghieri, nous étudions des agrégations adaptatives d’état permettant d’accélérer la résolution de MDP.

Publications

Exposés