Sujet de thèse
Apprentissage de requêtes optimales en présence de fortes incertitudes


Type de financement : Allocation ministère

Laboratoire d’accueil : Unité de recherche : UMR CNRS HEUDIASYC 7253 Equipe de recherche : DI Site web : www.hds.utc.fr

Directeurs de thèse : Sébastien Destercke, Marie-Hélène Masson (HDR)

Domaines de compétence : Informatique, technologies de l’information, Mathématiques


Description du sujet de thèse :

La gestion des incertitudes est une composante importante dans beaucoup d’applications dans le domaine de l’apprentissage statistique, de l’intelligence artificielle et de l’ingénierie des systèmes : diagnostic médical, conception de systèmes sur la base de nouvelles technologies, dimensionnement d’ouvrages capables de faire face aux changements climatiques, etc. Dans tous ces cas, il est primordial de savoir déterminer quelles sont les requêtes optimales à adresser à un « expert » (où à un modèle) qui vont permettre de réduire le plus possible l’incertitude. Les probabilités imprécises, qui sont des modèles génériques regroupant à la fois la théorie des probabilités et la théorie des ensembles, sont un outil idéal pour cela. Jusqu’à ce jour, il n’y a que peu de travaux qui ont étudié comment de tels modèles pouvaient être utilisés pour déterminer ces requêtes optimales. Dans le cadre de cette thèse, on abordera notamment les questions suivantes, étudiées depuis longtemps dans le cadre classique des probabilités :

  • Comment extraire efficacement et de manière cohérente une information auprès d’utilisateurs ou de modèles (possiblement de manière séquentielle) ?
  • Comment évaluer la qualité de des réponses (imprécises) fournies par l’utilisateur ou le modèle lorsque la vraie valeur est connue ? Ces questions pratiques et théoriques sont essentielles dans de nombreux domaines comme l’analyse de risque et de fiabilité, ou l’apprentissage statistique.

Suivant les compétences et les préférences du candidat, la thèse s’orientera sur l’un des deux sujets suivants :

Sujet 1 : Apprentissage actif pour des applications en apprentissage statistique Les techniques d’apprentissage actif consistent à acquérir de nouvelles données (par exemple des labels) pour améliorer la qualité de prédiction du modèle. Cependant, la plupart des techniques cherchent à réduire l’ambiguïté de la probabilité a posteriori ou à accroitre une valeur précise de performance. Lorsque l’information disponible est pauvre, les approches fondées sur les probabilités imprécises produisent des ensembles de probabilités conduisant à des mesures de performance imprécises. Dans ce cas, il serait intéressant de chercher à réduire l’imprécision de la prédiction. Le candidat devra explorer comment revisiter l’apprentissage actif en exploitant les possibilités des probabilités imprécises.

Sujet 2 : Elicitation d’avis d’experts pour l’analyse de risques Une question centrale lorsque l’on utilise les probabilités imprécises, par exemple dans le domaine de l’analyse de risques, est de pouvoir réduire l’incertitude efficacement pour atteindre rapidement une décision. Cette question a suscité de nombreux travaux dans le domaine de l’élicitation d’avis d’experts. Le candidat sera chargé d’explorer comment des idées issues notamment de l’optimisation robuste peuvent être mises en œuvre dans le cadre de la théorie des probabilités imprécises. Le but est de recommander des questions ou requêtes optimales à poser à une expert.

Mots clés : Apprentissage statistique, analyse de risque, apprentissage actif, elicitation d’expert, probabilités imprécises.


Profil et compétences du candidat : Le candidat devra justifier de solides compétences soit en mathématiques soit en informatique. Nous cherchons notamment d’excellents compétences dans au moins un des domaines suivants : apprentissage statistique, probabilités/statistiques, optimisation, intelligence artificielle. Toute candidature devra inclure les éléments suivants :

  • Une lettre de motivation expliquant l’intérêt du candidat pour le sujet
  • Un C.V. montrant clairement comment le candidat correspond au profil recherché
  • Les coordonnées d’au moins un référent.


Date de début de la thèse : Octobre 2015

Lieu de travail de thèse : Université de Technologie de Compiègne, UMR CNRS 7253 HEUDIASYC   Durée : 36 mois

Possibilité missions complémentaires : Possibilité de faire des vacations en enseignement à l’Université de Technologie de Compiègne

Moyens matériels : Mise à disposition d’un bureau collectif (4 étudiants) et d’un PC fixe ou portable.

Moyens humains : Effectif total : 182 Personnel administrative et technique : 14 Enseignants-chercheurs, chercheurs : 47 Etudiants en thèse : 66

Moyens financiers : Crédits d’équipe, possibilité de financement sur projet UML-NET et LABEX MS2T

Modalités de travail : Réunions de travail régulières avec les superviseurs

Projet de recherche lié à cette thèse  : UML-NET, Labex MS2T

Collaboration internationale : UML-NET

Thèse en cotutelle internationale : non


Coordonnées des personnes à contacter : Sébastien Destercke, sebastien.destercke@utc.fr, Marie-Hélène Masson, mmasson@hds.utc.fr

Contacter d’abord le directeur de thèse avant de renseigner un dossier de candidature en ligne sur : https://webapplis.utc.fr/admissions/doctorants/accueil.jsf


PDF - 30.3 ko