Thèses soutenues
Thèses soutenues en 2026
Christina ALHACHEM
Le 31 mars 2026 à 9h30, à l’université de technologie de Compiègne, GI-042
Membres du jury :
- M. Yassine Hadjadj-Aoul, professeur des universités, réseaux, informatique, IRISA/INRIA, Rennes (rapporteur)
- M. Hassine Moungla, professeur des universités, réseaux, informatique, Université Paris Descartes, laboratoire LIPADE, Paris (rapporteur)
- Mme Valérie Loscri, directeur de recherche INRIA, INRIA Lille, Villeneuve‑d’Ascq (examinatrice)
- M. Mounir Kellil, ingénieur de recherche, CEA List (examinateur)
- M. Aziz Moukrim, professeur des universités, Université de technologie de Compiègne, laboratoire Heudiasyc (examinateur)
- M. Abdelmadjid Bouabdallah, professeur des universités, Université de technologie de Compiègne, laboratoire Heudiasyc (directeur de thèse)
Résumé :
Les réseaux de communication de nouvelle génération — réseaux Beyond 5G/6G, infrastructures IoT massives, environnements de réalité étendue — font face à une complexité croissante : des topologies distribuées à grande échelle, des flux de trafic hétérogènes et imprévisibles, et des exigences de qualité de service (latence, débit, fiabilité) de plus en plus strictes. Cette complexité rend la gestion traditionnelle du trafic, essentiellement réactive et statique, insuffisante pour garantir des performances optimales en temps réel. L’intelligence artificielle distribuée, et en particulier l’apprentissage par renforcement multi-agents (MARL), offre une voie prometteuse : plutôt que de réagir aux incidents après coup, les agents apprennent en interagissant directement avec l’environnement réseau, sans nécessiter de modèle explicite ni de données étiquetées, et ce de manière coordonnée et décentralisée.
Dans ce cadre, nos travaux proposent un système complet de gestion distribuée et intelligente du trafic, articulé autour de plusieurs contributions complémentaires :Nous avons conçu et évalué un cadre MARL de contrôle de congestion pour les réseaux complexes, dans lequel des agents distribués apprennent à ajuster dynamiquement les poids des liens et à répartir le trafic sur des chemins multiples, en optimisant conjointement latence, débit et taux de perte. Cette contribution a mis en évidence les compromis entre scalabilité et overhead de coordination selon le nombre d’agents déployés [IWCMC 2025].
Nous avons proposé une approche de relaxation dynamique des contraintes de latence de bout en bout dans les environnements Système de Systèmes (SoS) sur 5G, où chaque sous-système dispose d’un agent capable de décider de manière autonome et binaire s’il doit assouplir ou maintenir ses exigences de latence selon les conditions réseau observées localement. Ce mécanisme léger permet d’éviter la sur-allocation de ressources tout en préservant la qualité de service pour les tâches critiques [SoSE 2025].
Nous avons conduit une étude empirique comparative sur les stratégies de déploiement des agents MARL dans un réseau opérationnel, en confrontant un placement aléatoire à un placement guidé par la topologie (noeuds à forte connectivité). Les résultats montrent que le placement basé sur le trafic accélère la convergence et réduit significativement la congestion normalisée par rapport au déploiement aléatoire, fournissant ainsi des lignes directrices pratiques pour l’opérationnalisation de solutions MARL dans des réseaux réels [CCNC 2026].
Nous avons proposé Fed-MARL, un cadre fédéré multi-agents intégrant trois innovations complémentaires : une récompense pondérée par empathie qui incite chaque agent à tenir compte des performances de ses pairs afin d’éviter que certains noeuds monopolisent les ressources au détriment des autres, une fédération événementielle déclenchée par un indice de congestion composite, et une agrégation adaptative via FedAdam pour gérer l’hétérogénéité des données locales. Évalué sur une topologie Fat-Tree représentative des réseaux de centres de données, Fed-MARL atteint une réduction majeure de la latence, une livraison parfaite des paquets et un overhead de coordination quasi nul comparé aux approches de l’état de l’art [WCNC 2026, CCNC 2026].
L’ensemble de ces contributions forme un système cohérent, allant de la conception de l’agent individuel jusqu’à la coordination fédérée à grande échelle, en passant par les stratégies de déploiement opérationnel, et couvre ainsi le cycle complet de mise en oeuvre d’une intelligence distribuée pour la gestion des réseaux de nouvelle génération.
Estia MALIQARI
Le 3 mars 2026 à 14h30, à l’université de technologie de Compiègne, Amphithéâtre du centre d’innovation
Membres du jury :
- M. Stéphane Dauzere-Pres, professeur des universités, membre rapporteur Ecole des Mines de Saint Etienne, Gardanne
- Mme Simona Sacone, professeur, membre rapporteur Université de Genova, Genova, Italie
- Mme Corinne Lucet, professeur des universités, membre examinateur Université de Picardie Jules Vernes, Amiens
- M. Jean-Paul Boufflet, maître de conférences, membre examinateur Université de technologie de Compiègne, Compiègne
- Mme Elinda Mece, professeure, membre examinateur Université Polytechnique de Tirana, Tirana, Albanie
- Mme Giuliana Barbarino, docteure, membre examinateur SNCF Réseau, Saint-Denis
- M. Dritan Nace, professeur des universités, codirecteur de thèse Université de technologie de Compiègne, Compiègne
- M. Antoine Jouglet, professeur des universités, codirecteur de thèse Université de technologie de Compiègne, Compiègne
Résumé :
La planification ferroviaire consiste à équilibrer une capacité d’infrastructure limitée avec les besoins de service et la disponibilité du matériel roulant. En France, l’horaire de service annuel constitue la base en réservant des sillons pour les trains à grande vitesse, régionaux, de fret et autres, tout en respectant les marges de sécurité et les fenêtres de maintenance prévues. Mais une fois ces sillons fixés, les entreprises ferroviaires doivent s’assurer que les trains adéquats sont disponibles aux bons dépôts et aux bons moments. Cette étape révèle souvent des conflits cachés : certains sillons théoriquement exploitables ne peuvent pas être assurés faute de matériel, des plages de maintenance perturbent les circulations prévues ou de longs trajets à vide deviennent inévitables.
Cette thèse propose une approche d’aide à la décision qui traite simultanément la construction de l’horaire et la planification du matériel roulant. En modélisant conjointement l’utilisation de l’infrastructure et les mouvements du parc, la méthode résout les conflits, favorise la réutilisation locale des trains et limite les trajets à vide coûteux. Elle part d’un horaire préliminaire et l’améliore de façon itérative pour s’assurer que les circulations respectent à la fois la disponibilité des voies et les stocks des dépôts. Une étape finale d’ajustement s’appuie sur une simulation détaillée afin de vérifier la faisabilité opérationnelle et de corriger les dernières incompatibilités sans remettre en cause l’ensemble du plan.
Le résultat est un cadre intégré permettant de produire des horaires à la fois sans conflits et économes en ressources. Un tel outil peut aider les gestionnaires d’infrastructure et les entreprises ferroviaires à mieux coordonner leurs décisions, réduire les perturbations de dernière minute et optimiser l’utilisation du réseau et du matériel roulant existants.
Thèses soutenues en 2025
Fadel Tarhini
Le 17 décembre 2025 à 14h00, amphi du centre d’innovation de l’UTC
Membres du jury :
- SENAME Olivier, Professeur des universités, Spécialité : Automatique Gipsa-lab, Grenoble INP / Univ Grenoble Alpes, Saint-Martin‑d’Hères
- BASSET Michel, Professeur des universités, Spécialité : Automatique IRIMAS, Université de Haute Alsace (UHA), Mulhouse
- NOUVELIERE Lydie, Professeure des universités, Spécialité : Automatique LASPI, Université Jean Monnet St Etienne, Roanne
- RABHI Hamid, Professeur des universités, Spécialité : Automatique MIS, Université de Picardie Jules Verne, Amiens
- VICTORINO Alessandro, Maître de conférences, HDR, Spécialité : Automatique Heudiasyc UMR CNRS 7253, Université de technologie de Compiègne, Compiègne
- TALJ Reine, Directrice de recherche CNRS, Spécialité : Automatique Heudiasyc UMR CNRS 7253, Université de technologie de Compiègne, Compiègne
- DOUMIATI Moustapha, Enseignant-chercheur, Spécialité : Automatique, Génie électrique ESEO – IREENA UR 4642, Angers
Membre invité :
- M. Franck Guillemard, Stellantis
Résumé :
Autonomous mobility has matured beyond isolated algorithmic advances, exposing a fundamental challenge in maintaining coherence, efficiency, and robustness across the autonomy hierarchy. Despite substantial progress in decision-making, trajectory planning, and control, energy efficiency remains largely confined to individual layers, with limited coordination or consistent propagation across the system. This fragmentation is particularly restrictive for in-wheel vehicles, whose tightly coupled nonlinear dynamics demand unified objectives across all autonomy levels. This thesis addresses this challenge by proposing a unified framework in which safety and energy efficiency constitute shared principles from high-level reasoning to in-wheel actuation, advanced through coordinated multi-objective formulations that ensure real-time feasibility.
Within this unified structure, advanced vehicle control constitutes the dynamic backbone through which intent is translated into physically consistent behavior. A progressive synthesis of control frameworks is developed, including adaptive look-ahead regulation grounded in vehicle dynamics, hierarchical coordination strategies spanning decentralized robust control to centralized adaptive optimal control, and energy-aware torque allocation under constrained actuation. These elements culminate in a holistic minimum-order MPC formulation that dissolves the conventional separation between coordination and actuation, embedding stability, performance, and energy efficiency within a single optimization entity.
Trajectory planning is formulated as a spatiotemporal construct in which geometric structure and temporal smoothness directly condition feasibility, control effort, and energy demand. A hybrid planning paradigm is established, combining deterministic sampling with continuous optimization over a corridor manifold defined by dynamically constructed safety bounds. On the temporal axis, speed planning formalizes the relationship between jerk regulation and energy dissipation, yielding smooth, bounded, and explicitly energy-optimal profiles through constrained optimization over feasible space-speed domains.
At the cognitive layer, decision-making is formulated as an interpretive substrate in which safety and energy coexist within a unified spatial field. Surrounding agents are represented through anisotropically propagating super-twisted risk fields evolving with relative motion and uncertainty, while a complementary energy field reconstructs the local energy topology of feasible motion from geometric invariants. Their coupling enables integrated lateral and longitudinal maneuver synthesis through structured field evaluation, ensuring robust and generalizable decision-making in dynamic environments.
Culminating in a unified intent-to-control paradigm, the proposed architecture embeds safety and energy as governing principles across the entire autonomy hierarchy. Its validity is established through high-fidelity co-simulation and evaluation on real-world datasets using a full nonlinear vehicle model. The analyses demonstrate sustained gains in energy efficiency, safety, control performance, comfort, and computational tractability, confirming the coherence, robustness, and practical relevance of the developed framework for energy-aware autonomous in-wheel mobility.
Shan HE
Le 16 décembre 2025 à 13h30, amphi du centre d’innovation de l’UTC
Membres du jury :
- Mme Nadine Piat, professeur des universités, membre rapporteur FEMTO-ST, laboratoire AS2M, Besançon
- M. Olivier Simonin, professeur des universités, membre rapporteur INSA Lyon, City Lab, Villeurbanne
- M. Pedro Castillo-Garcia, directeur de recherche CNRS, membre examinateur Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Youcef Mezouar, professeur des universités, membre examinateur Institut Pascal, SIGMA-Clermont, Aubière
- M. Vincent Fremont, professeur des universités, membre examinateur LS2N, Nantes
- M. Lounis Adouane, professeur des universités, directeur de thèse Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
Résumé :
Connected Autonomous Vehicles (CAVs), equipped with cooperative decision-making capabilities, are regarded as a future development trend in intelligent urban transportation systems. Studies show that CAVs offer significantly greater applicability and effectiveness in managing complex situations such as unsignalized intersections or roundabout crossing, primarily due to their ability to perform cooperative decision-making and intelligent coordination, which enhance both traffic efficiency and safety.
The objective of this PhD thesis is to develop a CAV-based cooperative multi-risk assessment and management architecture for unsignalized intersections to optimize traffic flow at both the microscopic-level (interactions between several local vehicles) and macroscopic-level (interactions of CAV according to global road flows).
At the microscopic level, a Multi-Risk Management Cooperative Optimization approach based on a Predicted Inter-Distance Profile (MRMCO-PIDP) is developed to efficiently manage the risk of collision between CAVs. This method is further extended to enhance the negotiation mechanism and optimization process by enabling adaptation to distributed decision-making. To address uncertainties arising from various environmental factors—such as localization errors, communication delays, and, more critically, communication loss—a PIDP-based Probabilistic Uncertainty Interval (PIDP-PUI) method is proposed to support robust collaborative decision-making mainly under degraded communication conditions.
At the macroscopic level, due to the large volume of vehicles often leading to an exponential increase in computational complexity, a conflict-path-checking and risk management graph method is introduced to substantially reduce the computational burden of intersection management, thereby making the approach viable for real-world implementation. Building on this foundation, in complex traffic scenarios, effectively mitigating the congestion remains a critical challenge. To this end, a Congestion-Sensitive Flow Fusion (CSFF) model is proposed to analyze the causes of congestion from a traffic-flow perspective and to provide target speeds for different directions to alleviate it.
By integrating the macroscopic and the microscopic levels, the MRMCO-PIDP method and the proposed CSFF model are fused to achieve both collision avoidance and congestion mitigation, ultimately reducing average waiting delays and congestion rates. Further, in order to intensively validate the proposed decision-making architectures and optimization processes, a precise simulator has been developed, and a series of stochastic scenarios have been generated for evaluation. The simulation results demonstrate the effectiveness and the robustness of the proposed methods in handling complex and uncertain traffic conditions.
Keywords: Multi-Vehicle Systems (MVS), Connected Autonomous Vehicles (CAV), Cooperative Navigation, Cooperative Risk-Assessment and Management, Hybrid Centralized–Decentralized Control Architecture, Decision-Making under Uncertainty, Traffic Flow Management in Localized Intersections.
.
Asma ARAB
Le 15 décembre 2025 à 9h30, amphi du centre d’innovation de l’UTC
Membres du jury :
- M. Lyes KHOUKHI, Professeur des Universités, cybersécurité, membre rapporteur Conservatoire National des Arts et Métiers (CNAM Paris)
- M. Pascal LORENZ, Professeur des Universités, réseaux, membre rapporteur Université Haute-Alsace, IUT de Colmar
- Mme. Valeria LOSCRI, Directrice de Recherche INRIA, membre examinateur
nria Lille - M. Youcef IMINE, Maître de Conférences, membre examinateur Université Polytechnique Hauts-de-France
- M. Aziz Moukrim, Professeur des universités, membre examinateur Université de Technologie de Compiègne
- Mme. Ghada Jaber, Maître de Conférences, codirectrice de thèse Université de Technologie de Compiègne
- M. Abdelmadjid BOUABDALLAH, Professeur des universités, codirecteur de thèse Université de Technologie de Compiègne
Résumé :
The Internet of Things (IoT) is transforming modern society by enabling seamless connectivity between physical and digital worlds. However, the growth of mobile IoT devices introduces significant security challenges, particularly due to their mobility, resource constraints, and exposure to untrusted environments. Traditional security mechanisms are often static and energy-intensive, making them unsuitable for mobile IoT deployments where energy efficiency and adaptive security are critical.
This area has received increasing attention in recent years. In the first part of this thesis, we present our first contribution to the security of mobile IoT. We provide a deep study and analysis of the most recent approaches in this field. The second part includes two key contributions: First, we propose a risk-based Adaptive Authentication Model for mobile IoT (AAM-mIoT), which dynamically selects authentication mechanisms based on real-time risk assessments and device-specific constraints. Leveraging an SDN-based architecture, AAM-mIoT optimizes the trade-off between security assurance and energy efficiency, ensuring continuous protection across varying threat environments.
Second, we introduce a mobility-based energy optimization solution that uses Deep Reinforcement Learning (DRL) to proactively manage device energy consumption during security operations. By formulating the problem as a Markov Decision Process (MDP), our model decides whether to relocate a device to a safer zone, put it to sleep, or maintain its current state, thereby preventing energy exhaustion without compromising security. We further provide a comparative analysis of four DRL algorithms which are: DQN, A2C, TRPO, and PPO.
Through extensive simulations, both contributions show significant improvements in security compliance, energy savings, and network lifetime compared to benchmark strategies. This work provides a comprehensive, adaptive security framework tailored for the unique demands of mobile IoT, paving the way for more resilient and sustainable IoT ecosystems.
.
Kristina Kumbria
Le 12 décembre 2025, amphi du centre d’innovation de l’UTC
Membres du jury :
- Mme Claire Hanen, professeure émérite, membre rapporteur Université Paris Nanterre, laboratoire Segmi, Nanterre
- M. Emmanuel Neron, professeur des universités, membre rapporteur Université de Tours, Polytech Tours, Tours
- M. Jacques Carlier, professeur émérite, membre examinateur Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Dritan Nace, professeur des universités, membre examinateur Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Eric Pinson, professeur, membre examinateur Université catholique de l’Ouest, Angers
- Mme Tifenn Rault, maîtresse de conférences, membre examinateur Université de Tours, Polytech Tours, Tours
- M. Antoine Jouglet, professeur des universités, co-directeur de thèse Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Abderrahim Sahli, maître de conférences, co-directeur de thèse Université Gustave Eiffel, ESIEE Paris, Marne-la-Vallée
Résumé :
Cette thèse propose une extension du raisonnement énergétique appliqué au problème d’ordonnancement cumulatif et explore son intégration dans le problème d’ordonnancement de projets sous contraintes de ressources. Les approches classiques de raisonnement énergétique, bien qu’efficaces, reposent sur des relaxations continues qui négligent la nature discrète des capacités de ressources. Cette approximation limite leur aptitude à détecter certaines infaisabilités et à produire des bornes inférieures précises. Afin de pallier cette limite, nous redéfinissons le bilan énergétique en tenant compte des portions de tâches exécutées en dehors des intervalles temporels considérés et en intégrant explicitement les contraintes d’intégralité des ressources. Cette évolution conceptuelle conduit à un test de faisabilité plus puissant et à des bornes inférieures significativement renforcées.
L’une des contributions majeures de ce travail réside dans la formulation d’un nouveau problème de tripartition, résolu par programmation dynamique. Ce modèle transforme l’évaluation énergétique en une optimisation de type problème du sac à dos, permettant de capturer la véritable structure combinatoire de l’utilisation des ressources. Nous proposons également plusieurs stratégies avancées de calcul de bornes inférieures (notamment des approches destructives et constructives), ainsi qu’une analyse des ressources redondantes, prolongeant les travaux fondateurs de Carlier et Néron afin d’obtenir des estimations du makespan plus serrées et plus réalistes.
Les expérimentations numériques menées démontrent l’efficacité pratique du cadre développé : le vérificateur énergétique enrichi détecte des infaisabilités ignorées par les méthodes existantes, fournit des bornes inférieures plus fortes et améliore les performances des solveurs lorsqu’il est intégré à des systèmes industriels de programmation par contraintes. Au-delà du contexte de l’ordonnancement cumulatif, ces résultats illustrent la portée générale du raisonnement énergétique amélioré pour les problèmes d’optimisation sous contraintes de ressources, établissant ainsi cette approche comme un outil à la fois rigoureux, performant et polyvalent pour la recherche théorique et appliquée en ordonnancement.
Emmanuel ALAO
Le 5 décembre 2025 à 9h00, amphi du centre d’innovation de l’UTC
Membres du jury :
- Mme Emilia Silvas, associate professor, membre rapporteur Université technique d’Eindhoven, Pays-Bas
- M. Maan El Badaoui El Najjar, professeur des universités, membre rapporteur Centre de recherche en informatique, signal et automatique de Lille, Villeuneuve‑d’Ascq
- M. Michel Basset, professeur des universités, membre examinateur Université Haute-Alsace, ENSISA, Mulhouse
- M. Philippe Bonnifait, professeur, membre examinateur Université de technologie de Compiègne, Heudiasyc, Compiègne
- M. Jean-Christophe Popieul, professeur, membre examinateur Université polytechnique Hauts-de-France, LAMIH, Valenciennes
- Mme Anne Spalanzani, professeure des universités, membre examinateur Université de Grenoble Alpes, IUT2 Grenoble, Grenoble
- M. Lounis Adouane, professeur des universités, codirecteur de thèse Université de technologie de Compiègne, Heudiasyc, Compiègne
- M. Philippe Martinet, directeur de recherche, codirecteur de thèse Inria Sophia-Antipolis Méditerranée, Sophia-Antipolis
Résumé :
Modern transportation is being transformed by autonomous vehicles (AVs), which promise enhanced safety, efficiency, and convenience. These vehicles rely on complex algorithms to perceive their environment, make decisions, and control motion in real time. A critical component is the risk assessment and management unit, which analyzes traffic scenarios for potential hazards and determines the safest control outputs. This process requires predicting and simulating multiple road scenarios, leading to various hypotheses and algorithms for estimating the future states of surrounding road users.
The emergence of Personal Light Electric Vehicles (PLEVs), such as electric scooters and bikes, has increased uncertainty on the road. These vehicles exhibit multi-modal behavior—moving like pedestrians at low speeds and accelerating rapidly—and their small size complicates detection. Two main challenges arise: uncertainty in predicting the states (position, velocity, size) of surrounding agents, and managing multi-modal motion predictions without overly conservative control actions. This PhD thesis, conducted under the ANNAPOLIS (AutoNomous Navigation Among Personal mObiLity devIceS) project, addresses these challenges to ensure safe and comfortable AV navigation in dynamic and constrained urban environments. The research aims to design and validate a Multi-Risk Assessment and Multi-level Motion Optimization \& Control (MiRA-MOC) architecture as a comprehensive multi-risk assessment and management system.
Specifically, the thesis addresses autonomous driving challenges posed by uncertainties in the dynamic, possibly erratic motion of surrounding agents, including PLEVs. It introduces a decision-making and control strategy based on a multi-level motion optimization framework that handles motion uncertainties using a Fusion of stochastic Predictive Inter-Distance Profiles (F‑sPIDP). This continuous multi-risk assessment metric projects uncertainty in agents’ motion onto the predicted inter-distance between the AV and its surroundings.
To address the first challenge, F‑sPIDP extends the Predictive Inter-Distance Profile (PIDP) concept to a stochastic version (sPIDP) that captures uncertainty in predicted states. The second challenge in multi-modal prediction is handled by fusing multiple sPIDPs. An optimal trajectory is then selected from possible maneuvers using a combination of safe global trajectory sampling and F‑sPIDP. Finally, local control optimization computes control actions that minimize collision risk while respecting vehicle dynamics. The proposed strategy has been validated through extensive simulations and real-vehicle experiments.
Jérôme GAIGNE
Le 28 novembre 2025 à 10h, amphi du centre d’innovation de l’UTC
Membres du jury :
- M. Sébastien Konieczny, directeur de recherche, membre rapporteur Université d’Artois, CRIL, Lens
- Mme Meltem Öztürk Escoffier, professeure des universités, membre rapporteur Université Paris Dauphine, Lamsade, Paris
- M. Sébastien Destercke, directeur de recherche, membre examinateur Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- Mme Raida Ktari, maîtresse de conférences, membre examinateur Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Nicolas Maudet, professeur des universités, membre examinateur Sorbonne Université, LIP6, Paris
- M. Ramin Pino Perez, professeur des universités, membre rapporteur Université de Los Andes, Venezuela
- M. Sylvain Lagrue, professeur des universités, co-directeur de thèse Université de technologie de Compiègne, Heudiasyc, Compiègne
- M. Khaled Belahcène, maître de conférences, co-directeur de thèse Université de technologie de Compiègne, Heudiasyc, Compiègne
Résumé :
Ordered structures are central to Artificial Intelligence, particularly in modeling reasoning, decision-making, and preference representation. While total preorders provide a straightforward way to rank alternatives, they fail to capture the nuances of real-world scenarios where incomparability or hesitation may arise. Partial orders offer greater flexibility but at the cost of increased complexity. This thesis explores the spectrum of ordered structures, with a focus on their role in belief revision, which is the process by which an agent integrates new information into their existing beliefs while maintaining consistency.
Belief revision operators are traditionally linked to ordered structures over possible worlds, where minimal elements represent the agent’s most plausible beliefs. However, existing frameworks, such as AGM or revision of partially ordered information, often rely on restrictive total preorders or overly permissive partial orders. To address this, we introduce decisive revision operators, which guarantee a unique outcome for the revision process by refining total preorders with tie-breaking mechanisms.
We then turn to more expressive models to capture complex preference patterns. For real-world scenarios, such as career choices where alternatives may be incomparable yet locally ordered, we propose two novel classes of ordered structures: partitioned linear orders and forest orders. Partitioned linear orders correspond to the idea of disjoint locally ordered groups while forest orders organize possible worlds into trees, either rooted at the most or least plausible elements. These structures provide a nuanced way to represent situations where alternatives are divided into groups based on degrees of similarity or levels of preference, while remain incomparable across distinct groups.
For each class, we develop a set of rationality postulates that characterize their corresponding revision operators. We also provide constructive methods to build these operators, demonstrating their coherence and applicability. We expand belief revision theory by introducing new operators that reflect the need of clear outcome for decision-making, and some nuances and incomparability inherent to human reasoning.
.
Nicolas Urbani
Le 8 juillet 2025 à 14h, L102, bâtiment Pierre Guillaumat
Membres du jury :
- Mme Florence Alberge, professeure des universités, membre rapporteur – ENS Paris Saclay, laboratoire SATIE, Gif-sur-Yvette
- M. Alain Rakotomamonjy, principal researcher, membre rapporteur – Criteo AI Lab, Paris
- Mme Edith Grall, enseignante-chercheuse, membre examinateur – Université de technologie de Troyes, laboratoire Informatique et Société Numérique (LIST3N), Troyes
- M. Sébastien Destercke, directeur de recherche CNRS, membre examinateur – Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Yves Grandvalet, directeur de recherche CNRS, directeur de thèse – Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Sylvain Rousseau, maître de conférences, co-encadrant de thèse – Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
Résumé :
Ces dernières années, les classificateurs à réseaux de neurones sont rapidement devenus un élément fondamental et omniprésent d’une vaste gamme de systèmes automatisés. Leur succès dans des tâches telles que la reconnaissance d’images, le traitement du langage naturel et le diagnostic médical a entraîné leur adoption généralisée. Néanmoins, un défi de taille demeure : la nature intrinsèquement « boîte noire » de ces modèles. Cette opacité complique la compréhension complète du processus de décision, rendant plus difficile la garantie de leur fiabilité. Le manque de transparence rend également ardu, voire impossible, de prédire avec confiance la réaction d’un modèle face à des échantillons inattendus dans la nature, ou la manière dont sa performance peut être affectée lorsqu’il est confronté à des exemples hors de sa distribution d’entraînement. Cette imprévisibilité est particulièrement préoccupante dans les applications critiques pour la sécurité, où des classifications erronées peuvent avoir des conséquences graves, par exemple dans le diagnostic médical ou les décisions administratives automatisées. Ce défi majeur pour assurer un comportement prévisible et fiable a catalysé de nombreuses recherches visant à comprendre et à améliorer la robustesse des modèles de réseaux de neurones.
Cette thèse contribue à l’objectif essentiel d’amélioration de la fiabilité des réseaux de neurones en se concentrant sur deux approches distinctes mais complémentaires. Premièrement, nous explorons l’intégration d’informations structurelles supplémentaires, sous la forme d’une hiérarchie de classes, durant l’entraînement afin d’atténuer l’impact et la gravité des erreurs de classification, avec pour objectif de réaliser de « meilleures erreurs ». Deuxièmement, nous développons et étudions des méthodes permettant de détecter si un échantillon provient de la distribution d’entraînement connue ou s’il est hors du cadre de la tâche de classification définie, indiquant ainsi qu’il devrait potentiellement être écarté ou traité différemment pour éviter des prédictions erronées. Ces deux axes représentent des moyens alternatifs de répondre aux défis posés par les modèles boîte noire et d’améliorer la confiance envers les classificateurs à réseaux de neurones.
Alors que les classes dans la plupart des jeux de données de classification d’images sont considérées comme équidistantes, cette supposition peut ne pas être valable pour certains ensembles. Par exemple, dans un jeu de données de races de chats, il est intuitif de supposer que ces classes partagent des similarités. De même, ajouter d’autres types d’animaux domestiques comme classes suggère une parenté sémantique reflétée par leur position sur des branches plus éloignées d’une hiérarchie de classes. De nombreuses méthodes ont été proposées pour exploiter de telles hiérarchies existantes afin d’améliorer la performance de classification ou de permettre des tâches plus complexes, comme la prédiction sur des super-classes plutôt que sur des classes fines.
Les classificateurs supervisés sont entraînés pour discriminer entre des classes prédéfinies à l’aide de jeux de données soignés, et leur comportement devient imprévisible lorsqu’ils traitent des données hors de cette distribution d’entraînement ce qui est problématique pour la fiabilité et peut engendrer des conséquences inattendues. La détection Hors-Distribution (Out-of-Distribution, OOD) cible spécifiquement les classificateurs entraînés sur une tâche multi-classe où des échantillons aberrants représentant un changement sémantique doivent être détectés au moment du test. Les méthodes de détection post-hoc opèrent sur des classificateurs pré-entraînés en analysant des sous-produits de la classification tels que les distributions de scores de prédiction, les activations de caractéristiques et les représentations latentes. Ces méthodes sont particulièrement intéressantes car elles ne nécessitent aucune modification de l’architecture ou de la procédure d’entraînement du modèle, préservant ainsi la performance de classification principale tout en ajoutant des capacités de détection OOD. Cependant, la plupart des études existantes n’examinent pas en profondeur comment la performance du modèle de classification sous-jacent influence l’efficacité des méthodes de détection OOD post-hoc.
Un domaine connexe est la détection d’anomalies (AD). Ici, l’objectif est d’entraîner des classificateurs binaires nominal/anormal dédiés à la détection d’échantillons anormaux d’une classe par exemple l’inspection visuelle automatisée de chaînes de production industrielles, vérifiant si les vis et écrous produits sont conformes ou défectueux. La principale différence avec la détection OOD est que les étiquettes de la distribution OOD ne se recouvrent pas avec celles de la distribution In-Distribution (ID). La difficulté majeure réside dans la rareté
intrinsèque des anomalies, les méthodes de détection d’anomalies doivent donc s’entraîner sans ou avec très peu de données anormales.
Nous présentons notre étude de la première approche, utilisant la classification hiérarchique. Certaines méthodes se sont concentrées sur la création de pipelines de modèles pour prendre en compte la hiérarchie ou sur la création de pertes d’entraînement alternatives intégrant directement ces hiérarchies. Nous proposons deux nouvelles méthodes reposant sur une perte d’entraînement inédite et une nouvelle technique de lissage d’étiquettes (label smoothing). Nous nous comparons aux méthodes existantes de la littérature.
Nous analysons la détection OOD, et plus particulièrement l’évaluation de ces méthodes. Nous proposons une étude approfondie de l’impact de la performance de classification ID du modèle sous-jacent. Nous formulons une critique de certains aspects de la littérature existante sur l’évaluation des performances OOD. Nous présentons également une nouvelle méthode post-hoc de détection OOD basée sur l’analyse de l’espace de caractéristiques.
De plus, cette thèse comprend une méthode exploratoire en détection d’anomalies, visant à fournir de meilleures frontières de décision pour détecter les outliers et à apprendre, de manière non supervisée, à différencier plusieurs types d’anomalies en introduisant plusieurs classes de rejet, appelées « classes soeurs ». Bien que ce cadre ait montré des résultats prometteurs sur des données artificielles synthétiques, la méthode n’a pas été efficace sur des données d’images. Notre investigation a révélé des limitations fondamentales, suggérant un conflit inhérent entre l’optimisation de la classification binaire inlier-outlier et l’apprentissage simultané de représentations significatives pour une catégorisation non supervisée des outliers.
.
Vitor Martin Bordini
Le 3 juin 2025 à 9h, GI042, bâtiment Blaise Pascal
Membres du jury :
- Mme Violaine Antoine, maîtresse de conférences HDR, rapporteur
- Université Clermont Auvergne, laboratoire LIMOS, Aubière
- M. David Mercier, professeur des universités, rapporteur
- Université d’Artois, laboratoire LGI2A, Béthune
- M. Christophe Marsala, professeur des universités, examinateur
- Sorbonne Université, laboratoire LIP6, Paris
- Mme Véronique Cherfaoui, professeure des universités, examinatrice
- Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Sébastien Destercke, directeur de recherche CNRS, co-directeur de thèse
- Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Benjamin Quost, professeur des universités, co-directeur de thèse
- Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
Résumé :
Machine learning classifiers have achieved impressive success in a wide range of domains such as natural language processing, image recognition, medical diagnosis, and financial risk assessment. Despite their remarkable accomplishments, their application to real-world problems still entails challenges.
One of the most common problems is the large amount of labels necessary to train a classifier. Labelling data is a time-consuming process that is prone to inconsistency because it is done by humans. In some domains (e.g. the medical domain), this process also requires specialists, which are expensive to hire and have little time to work on these activities.
These issues are the main motivation to the so-called Weakly supervised learning, a field of study in machine learning that proposes to reduce the amount of labels necessary by gathering information of unlabeled data. Among the three most studied paradigms in this field, we focus on incomplete supervision, i.e. more than one label is a possibly correct label for each sample in the dataset.
In this thesis, we focus on semi-supervised learning, where it is supposed that, for a given instance, only one (unknown) label is the correct answer. More specifically, we consider the self-supervised learning approach, where the model predicts the labels for the unlabeled part of the dataset, called pseudo-labels. The model is retrained using those pseudo-labels after, in an interactive manner.
This approach has the downside of biasing the model, since the pseudo-labels are mere guesses and have no guarantee to be correct. This problem is mitigated in the literature by selecting which pseudo-labels are the most probably correct and thus used on the next iteration for the training. In this thesis, we advocate that this correction might not be enough to avoid bad pseudo-labels and the performance is better when we apply uncertainty quantification on the pseudo-labels. Additionally, a good property we want to ensure is the probability calibration, where the model probability estimation is guaranteed to be closer to the real probability of the data.%talk about calibration
We propose to apply Inductive Venn Predictor(IVP) and Inductive Venn-Abers Predictor(IVAP) to better quantify the uncertainty while calibrating the model. Our experiments indicate that we achieve a better calibration with comparable accuracy in binary sets and pairwise approach, but fails to generalize well in a multi-class approach.
.
Dany Ghraizi
Le 29 avril 2025 à 9h30, GI042, bâtiment Blaise Pascal
Membres du jury :
- M. Paul Honeine, professeur des universités, membre rapporteur Laboratoire LITIS, Université de Rouen, Rouen
- M. Michel Basset, professeur des universités, membre rapporteur Laboratoire IRIMAS, Université de Haute Alsace, Mulhouse
- M. Ali Charara, professeur des universités, membre examinateur Laboratoire Heudiasyc, Université de technologie de Compiègne, Compiègne
- M. Hassan Noura, professeur des universités, membre examinateur Laboratoire d’information et des systèmes, Université Aix-Marseille, Marseille
- Mme Reine Talj, chargée de recherche, co-directrice de thèse Laboratoire Heudiasyc, Université de technologie de Compiègne, Compiègne
- M. Clovis Francis, professeur des universités, co-directeur de thèse Ecole nationale supérieurs d’Arts et Métiers, Châlon-en-Champagne
Résumé :
The rapid advancement of autonomous vehicles (AVs), through Advanced Driver Assistance Systems (ADAS), has accelerated research into intelligent decision-making systems that ensure safety, efficiency, and adaptability in complex driving environments. One of these systems handles longitudinal motion through Adaptive Cruise Control (ACC). Ideal ACC systems can decelerate to low speeds in stop-and-go traffic, maintain a safe following distance, minimize rear-end collision risks, and lessen the driver’s need to continually adjust vehicle’s speed to match traffic flow. As for lateral motion, lane-change maneuvers, though essential, pose challenges due to their complexity and safety risks.
This thesis presents a Hierarchical Decision Architecture for autonomous vehicles, leveraging Deep Reinforcement Learning (DRL) and risk assessment to integrate high-level strategic planning with trajectory planning and low-level control execution. The proposed framework addresses both lateral and longitudinal decision-making, encompassing tasks such as speed regulation, lane changes, risk asessemnt, and obstacle avoidance. The main objective is to develop a unified decision-making framework for autonomous vehicles that integrates longitudinal and lateral actions, incorporates dynamic risk assessment, and seamlessly integrates with trajectory planning, ensuring safety, efficiency, and comfort in diverse and dynamic driving environments.
The proposed architecture consists of three main components: a high-level decisionmaking module that generates strategic decisions based on the vehicle’s perception of the environment, a mid-level trajectory planning module that generates feasible paths and speed profiles based on the high-level decisions, and a low-level control module that executes the planned trajectories while ensuring safety and comfort.
The first part of the thesis focuses on the development of a DRL-based ACC decisionmaking module within a discrete-action Markov Decision Process (MDP) framework that learns safe, flexible, and responsive car-following policies agents while also being aware of the surrounding traffic conditions and reacting accordingly. This is achieved by designing a comprehensive, easy-to-interpret multi-objective reward function that reflects safe, responsive, and rational traffic behavior.
The second part focuses on the development of a risk assessment module that establishes a function for dynamic risk assessment, considering both longitudinal and lateral aspects of the environment. By incorporating various factors such as velocity and relative position, the proposed function enables the vehicle to anticipate and respond to potential hazards proactively. This is done by proposing a high-level risk-aware decision-making module integrated into the trajectory planner of autonomous vehicles. Additionally, it builds upon the DRL-based ACC decision-making module to include risk awareness and allows coherent longitudinal and lateral decision-making simultaneously.
The third part focuses on the unification of longitudinal and lateral decision-making and the integration of this module with the trajectory planner. The proposed architecture builds upon the previous parts to create a unified decision-making policy that combines longitudinal and lateral actions with environmental awareness, enabling the vehicle to navigate complex scenarios safely and efficiently.
Simulation results demonstrate the architecture’s ability to outperform traditional rulebased and heuristic approaches, achieving higher safety margins, smoother trajectories, and improved responsiveness to dynamic traffic conditions. The integration of DRL techniques enables the system to adapt to diverse driving contexts and learn from real-time feedback, offering a pathway to more autonomous, human-like driving behaviors. Tested in a joint Simulink/MatLab and SCANeR™ Studio simulation, the proposed models demonstrated successful high-level behaviors with the ability to execute car-following maneuvers, avoiding rear-end collisions with awareness for following vehicle behavior, lane changes, overtaking, adaptability to cut-in and cut-out scenarios, maneuver abortion, and dynamic trajectory re-planning in response to unexpected behaviors, obstacles, or anticipated risks.
This work contributes to the field of autonomous driving by introducing a scalable, learning-based hierarchical framework that combines advanced decision-making capabilities with practical implementation for real-world AV systems. It provides insights into the synergy
between reinforcement learning, trajectory planning, risk assessment, and control theory, paving the way for future innovations in autonomous vehicle technology.
Mohammad Beyrouti
Le 28 avril 2025 à 9h30, GI042, bâtiment Blaise Pascal
Membres du jury :
- Mme Kinda Khawam, maîtresse de conférences, membre rapporteur Université de Versailles St-Quentin, Versailles
- M. Omar Mawloud, professeur des universirés, membre rapporteur Université Bretagne Sud, laboratoire IRISA, Vannes
- Mme Maryline Laurent, professeur, membre examinateur Télécom SudParis, Institut Polytechnique de Paris, laboratoire Samovar, Paris
- Mme Sara Berri, maîtresse de conférences, membre examinateur Cergy Paris Université, ENSEA, Cergy
- M. Nace Dritan, professeur des universités, membre examinateur Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Abdelmadjid Bouabdallah, professeur des universités, co-directeur de thèse Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- M. Abed Ellatif Samhat, professeur, co-directeur de thèse Université Libanaise, faculté de génie – CRSI, Liban
- M. Ahmed Lounis, enseignant chercheur, co-encadrant Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
- Membre invité : M. Benjamin Lussier, enseignant chercheur, co-encadrant
Université de technologie de Compiègne, laboratoire Heudiasyc, Compiègne
Résumé :
The Internet of Things (IoT) connects devices to exchange data over the internet, enabling proactive monitoring and early-warning systems of incidents in various applications such as healthcare and railway. Short-range wireless protocols such as Bluetooth Low Energy (BLE), Zigbee, Z‑wave, and others are predominantly employed by IoT devices in the Sensing and Controlling domain of the IoT architecture. These devices exchange sensitive data that back-end services rely on for processing and decision-making. However, this surge in connectivity has induced various security challenges, including a broad spectrum of vulnerabilities and threats that expose these networks to a wide range of attacks, jeopardizing the security and safety of IoT applications. Hence, the main goal is to achieve secure computing in IoT networks by ensuring security and safety in the Sensing and Controlling domain. In order to achieve this, we should study the problem from both offensive and defensive perspectives. Security risk assessment serves as a useful method to analyze vulnerabilities and threats from the offensive perspective, while Intrusion Detection Systems (IDS) can serve as efficient methods for mitigating threats from the defensive perspective. Existing research, including traditional methods designed for IT systems and methods tailored for IoT, suffers from various limitations due to the heterogeneous and dynamic nature of IoT networks from both perspectives. To address these challenges, a vulnerability-oriented security risk identification method have been proposed for identifying realistic vulnerabilities and threats on IoT and a Security-Bag IDS mechanism for detecting and tolerating attacks using security rules for IoT systems. These mechanisms have been thoroughly validated through a use case study on an IoT smart healthcare application. The research findings highlight the effectiveness of the proposed methods in addressing the security challenges and achieving secure computing in IoT.
Mathieu Cocheteux
Le 4 avril 2025 à 13h30, amphi du centre d’innovation de l’UTC
Membres du jury :
- M. Cédric Demonceaux, professeur des universités, membre rapporteur Laboratoire ICB UMR 6303 Ub-CNRS, Université de Bourgogne, Le Creusot
- M. Damien Vivet, professeur, membre rapporteur ISAE-Supaero, Toulouse
- M. Sébastien Destercke, directeur de recherche CNRS, membre examinateur Laboratoire Heudiasyc, Université de technologie de Compiègne, Compiègne
- Mme Samia Ainouz, professeur des universités, membre examinateur Laboratoire d’informatique, du traitement et de l’information et des Systèmes (LITIS), INSA Rouen Normandie, Saint-Etienne-du-Rouvray
- M. Franck Davoine, directeur de recherche CNRS, co-directeur de thèse Laboratoire d’informatique en image et systèmes d’informations (LIRIS), INSA Lyon, Villeurbanne
- M. Julien Moreau, maître de conférences, co-directeur de thèse Laboratoire Heudiasyc, Université de technologie de Compiègne, Compiègne
Résumé :
Le calibrage des capteurs est une étape essentielle pour garantir une perception robuste dans les systèmes autonomes. Cette thèse explore des approches basées sur l’apprentissage profond pour le calibrage automatique des capteurs multimodaux, notamment le calibrage extrinsèque entre les caméras et les LiDARs, ainsi qu’entre les caméras événementielles et les LiDARs. Les méthodes traditionnelles de calibrage reposent généralement sur des environnements contrôlés, des cibles statiques ou des estimations initiales des paramètres, limitant leur applicabilité aux scénarios dynamiques du monde réel. Pour surmonter ces limitations, cette recherche propose des méthodes innovantes de calibrage, automatiques et prenant en compte l’incertitude, capables de s’adapter aux configurations des capteurs et aux conditions environnementales changeantes.
Nous introduisons PseudoCal, une méthode limitant la dépendance à une initialisation précise, en utilisant des représentations pseudo-LiDAR pour réaliser un calibrage automatique entre caméras et LiDARs directement dans l’espace 3D. Contrairement aux approches conventionnelles qui s’appuient sur des projections 2D et des correspondances de caractéristiques, notre méthode permet un calibrage avec une initialisation minimale des paramètres, ce qui la rend plus robuste face aux désalignements importants. Nous présentons également MULi-Ev, la première méthode de calibrage en ligne et en temps réel pour les systèmes caméra événementielle-LiDAR. Cette approche comble une lacune de plus en plus importante dans le domaine des véhicules autonomes et de la robotique, où cette combinaison de capteurs devient de plus en plus populaire pour gérer les environnements dynamiques et à fort contraste.
Enfin, nous proposons la première méthode de calibrage avec estimation de l’incertitude, qui quantifie la confiance dans les paramètres estimés grâce aux techniques de prédiction conforme et d’apprentissage profond bayésien. Cette modélisation probabiliste renforce la fiabilité des systèmes autonomes en fournissant des estimations calibrées et quantifiées, essentielles pour les applications critiques en matière de sécurité. Cette méthode pourrait permettre une prise en compte de l’incertitude pour décider de la mise à jour des paramètres de calibrage, ainsi que de transmettre cette information aux autres modules du système pour une prise de décision plus robuste.
Des expériences approfondies sur des jeux de données réels démontrent l’efficacité de nos approches, mettant en évidence des gains en précision, en robustesse et en adaptabilité. Les contributions de cette thèse jettent ainsi les bases pour de futures avancées en fusion de capteurs, permettant aux systèmes autonomes d’atteindre une perception plus fiable et évolutive dans des contextes opérationnels variés.


