[IA] des talents
One minute to discover some of PRAIRIE’s doctoral and post-doctoral students.
Doctorant [Université Paris Dauphine-PSL]
Antoine Luciano
Sujet de recherche : L’inférence bayésienne vise à mettre à jour nos connaissances sur des paramètres inconnus à partir de données, en calculant ou en échantillonnant la distribution a posteriori. Dans de nombreux modèles complexes, la vraisemblance est difficile, voire impossible, à calculer explicitement. Elle peut être intractable ou trop coûteuse à estimer. On parle alors d’inférence «likelihoodfree» ou «simulation-based», où l’on s’appuie sur la capacité à simuler des données plutôt qu’à évaluer la vraisemblance. Parmi ces approches, on trouve notamment l’Approximate Bayesian Computation (ABC), une méthode d’approximation largement étudiée, et des techniques plus récentes comme la Neural Ratio Estimation (NRE), qui repose sur l’apprentissage supervisé. Dans ce travail, nous combinons les forces de ABC et NRE pour proposer une méthode hybride, robuste et efficace.
Doctorante [Institut Imagine – Inserm – Université Paris Cité]
Emma Le Priol
Mes travaux portent sur l’étude de données de vie réelles de patient·es issues des forums en ligne et réseaux sociaux, dans le cadre des maladies rares, et plus spécifiquement des encéphalopathies épileptiques et développementales. Je collabore avec l’association de patient·es KCNB1 France. Une première partie porte sur la détection parmi un large corpus de messages contenant une expérience vécue de la maladie. Cela a permis de récupérer parmi les messages de l’association des messages à analyser plus en profondeur, notamment grâce au clustering. La deuxième partie porte sur la détection automatique de phénotypes, de maladies, de traitements et d’indicateurs temporels, avec pour objectif de pouvoir retracer une histoire naturelle de la maladie, et la comparer aux données hospitalières.
Doctorant [Inria]
Jakob Mayer
Les données structurelles sont omniprésentes, des réseaux sociaux à la géométrie moléculaire des protéines. Etant donné plusieurs structures du même type, il est souvent question de les comparer ou d’extraire des informations distribuées entre elles. À cette fin, nous cherchons des alignements entre nuages de points ou entre graphes qui visent à retrouver des correspondances cachées entre points ou sommets. Ces correspondances peuvent aider à la dés-anonymisation de bases de données, à l’analyse d’IRM cérébrales ou à la comparaison de fake news.
Nos contributions visent à rendre les cadres statistiques actuels plus réalistes en considérant des modèles asymétriques, des algorithmes efficaces, des métriques d’évaluation pertinentes, et des données issues des sciences sociales.
Post-Doctorante [Institut Imagine – Inserm – Université Paris Cité]
Carole Faviez
Je travaille à l’institut Imagine dans l’équipe d’Anita Burgun. Mes travaux portent sur l’utilisation de l’intelligence artificielle et de l’informatique médicale pour améliorer le diagnostic et la prise
en charge des patients atteints de maladies rares. L’objectif de ma thèse, était de développer un système d’aide au diagnostic utilisant l’IA pour un groupe de maladies rares et complexes, les ciliopathies, à partir des phénotypes extraits automatiquement à partir de dossiers médicaux électroniques. Ces méthodes doivent prendre en compte les spécificités du domaine des maladies rares et complexes. L’objectif est aujourd’hui de les étendre et adapter à d’autres maladies rares.
Doctorant [Inria – ENS-PSL]
Sachan Braun
La prediction conformelle est un cadre statistique permettant de construire des ensembles de prédiction avec des garanties de couverture valides en échantillon fini. Nous proposons une
méthode pour la prédiction d’espace de confiance en regression multivariée qui apprend directement des ensembles de prédiction de volume minimal tout en garantissant une couverture valide.
Notre approche repose sur une nouvelle fonction de perte et un score de non-conformité adaptatif, optimisant à la fois la précision du modèle et l’incertitude prédictive. Cette méthode est flexible et performante sur des jeux de données réels et synthétiques.
Doctorant [ENS-PSL – CNRS – Sorbonne Université – Université Paris Cité]
Gabriel Athène
Our research topic is the development of machine learning algorithms for the discovery and design of therapeutic proteins and in particular monoclonal antibodies. Designing antibodies that are useful as a drug is a multi-objective optimization problem. The drug candidate must satisfy many properties of interest (affinity to the antigen, solubility, thermostability). Paul focuses on energy-based generative methods of sequences and structures to identify diverse optimized candidates along the Pareto front defined by these properties. Once
a good candidate has been generated, its properties are tested, and targeted amino acid mutations can be engineered to modify the
drug properties as desired. Gabriel develops deep learning tools to support and accelerate this refinement process by predicting the key amino acids involved in antigen binding.
Post-Doctorante [Institut Imagine – Inserm – Université Paris Cité]
Xiaomeng Wang
Je travaille à l’Institut Imagine dans l’équipe d’Anita Burgun. Mes recherches portent sur l’analyse de la progression longitudinale des maladies rares à partir de données de vie réelle, telles que les
dossiers médicaux électroniques et les cohortes observationnelles.
Je me concentre particulièrement à l’évolution de la fonction rénale dans des sous-groupes génétiques, afin de mieux comprendre l’histoire naturelle, d’orienter la conception des essais
cliniques et de développer des outils pronostiques. En raison de la rareté des données, des méthodes d’IA sont utilisées pour l’analyse et l’extraction d’informations à partir de notes cliniques non
structurées.
Post-Doctorant [Inria – ENS-PSL]
Yann De Mont-Marin
La robotique moderne repose sur deux piliers : la simulation physique pour l’apprentissage de politiques de mouvement, et l’optimisation pour le contrôle et la planification de trajectoires.
Malgré l’existence de nombreux outils, le passage à l’échelle reste limité par deux défis majeurs :
– Respecter la géométrie des espaces de configuration : Il faut travailler dans les bons espaces mathématiques (groupes de Lie avec métriques finslériennes) pour capturer fidèlement le mouvement robotique.
– Rendre la simulation différentiable : Pour exploiter les méthodes d’optimisation basées sur les gradients, il faut calculer efficacement les dérivées des simulations physiques.