Chaire Modélisation Mathématique et Biodiversité

École Polytechnique, Muséum national d'Histoire naturelle
Fondation de l'École Polytechnique
VEOLIA Environnement

Logo du CMAP

Logo du MNHN

Logo du MNHN

Rencontre de la chaire

6 mai 2025 matin

Amphithéâtre Becquerel

(Ecole polytechnique, Palaiseau)

.

Programme:


9h30 -10h : Accueil café

10h00-10h40
Julien Chiquet (INRAE AgroParisTech) - Modèles Poisson lognormaux pour l'analyse de données de comptages multivariés

10h45-11h25Renaud Rincent (INRAE Le Moulon) - La modélisation de la relation génotype – phénotype à l’ère du changement global

11h25-11h55 : pause

11h55-12h35 : Anne Auger (INRIA, Ecole Polytechnique) - CMA-ES : Une méthode d'optimisation sans dérivées pour des problèmes difficiles


----------------------------------

Résumé de J. Chiquet : L'analyse de données de comptage à haute dimension est un défi dans divers domaines d'application (écologie et génomique notamment) et les approches basées sur des modèles statistiques fournissent un cadre adéquat et efficace qui préserve l'explicabilité. Le modèle Poisson-Log-Normal multivarié (PLN) est l'un de ces modèles : il suppose que les données de comptage sont régies par une variable gaussienne latente structurée sous-jacente, de sorte que les dépendances entre les comptages découlent uniquement des dépendances latentes.  Le modèle PLN s'avère être un cadre polyvalent, dans lequel une variété d'analyses peut être effectuée, y compris la régression multivariée, la comparaison d'échantillons, le regroupement de sites ou d'échantillons, la réduction de la dimension à des fins de visualisation, ou l'inférence de réseaux d'interaction. En écologie, il correspond à ce qu'on appelle un JSDM (joint-species distribution models).

Nous avons développé divers algorithmes et outils (en R et Python) pour ajuster efficacement cette famille de modèles, dans un cadre statistique et d'optimisation maîtrisé. Nous les présenterons lors de cet exposé sur des exemples en génomique et en écologie. Si le temps le permet, nous présenterons plus en détail la dernière extension en date qui intègre une composante de zéro inflation permettant de décrire finement l'excès de zéro, sur la base de covariables environnementales ou selon les espèces.

**Quelques liens référençant les articles et codes associés**

<https://pln-team.github.io/>

<https://github.com/PLN-team>


Résumé de R. Rincent : Je vous propose un petit voyage dans le monde de la génétique quantitative et de la génétique des systèmes, et notamment autour de la question de la modélisation de la relation génotype – phénotype : pourquoi et comment une variété donnée se développe de telle manière dans un environnement particulier ? J’introduirai comment le changement global pose des questions cruciales en amélioration des plantes, et comment différentes données et méthodes peuvent être combinées de manière originale et efficace pour tenter d’y répondre. J’aborderai, en tant que biologiste collaborant avec des statisticiens, deux questions essentielles que sont la compréhension du déterminisme génétique et la prédiction des phénotypes.


Résumé d'A. Auger : CMA-ES (Covariance Matrix Adaptation Evolution Strategy) est un algorithme d’optimisation stochastique adaptatif, conçu pour résoudre des problèmes numériques complexes sans recourir aux dérivées de la fonction. Il est particulièrement efficace sur des fonctions non convexes, bruitées, irrégulières ou mal conditionnées. Développé à partir des années 2000, CMA-ES est aujourd’hui largement utilisé dans les milieux académiques et industriels, avec plus de 70 millions de téléchargements de ses principales implémentations Python.

Dans cette présentation, j’introduirai de manière intuitive les concepts clés de l’algorithme et les raisons de son efficacité — notamment sa capacité à converger rapidement tout en restant robuste face aux irrégularités locales de la fonction. Je présenterai également quelques aspects pratiques pour son utilisation concrète, avant de conclure sur les axes de recherche actuels visant à améliorer ou étendre CMA-ES dans des sous-domaines de l’optimisation numérique.