Requested profiles and work conditions
Doctorant en réseaux neuronaux ultra-basse précision pour la vision événementielle embarquée
PhD in ultra-low precision neural neworks for embedded event vision
Stages de fin d'études : 3 offres en vision basée événements
Master Internship: 3 positions in event-besed vision

Requested profiles and work conditions

Profil recherché / Requested profile:

[Souhaité] Vision par ordinateur / [Desired] Computer vision background
[Requis] Codage C++ ou python (opencv, numpy, pytorch pour l'apprentissage profond) / [Required] C++ or python coding (opencv, numpy, pytorch for deep learning…)
[Requis] Autonomie, fort engagement, et participation dans l'équipe (y compris la vie de l'équipe) / [Required] Autonomy, strong commitment, and participation in the team (also team life)
[Requis] Capacité à assimiler et à proposer de nouveaux concepts / [Required] Ability to assimilate and to propose new concepts
[Souhaité] Anglais, capacité à synthétiser des articles scientifiques pointus / [Desired] English, ability to synthesize scientific articles
[Souhaité] Une expérience avec ROS / [Desired] Experience with ROS middleware

Consignes pour postuler / How to apply:
Merci répondre aux demandes suivantes / Please fulfill these requests:

Le ou les sujets visés / Aimed position(s)
Tout élément tangible démontrant des acquis sur les compétences que nous recherchons / Any concrete element showing knowledge on our requirements
Vos relevés de notes aux études universitaires / Your grades from University
Les coordonnées de référents que nous pourrions contacter / Coordinates of referees to contact

Laboratoire d'accueil / Welcome laboratory:
Heudiasyc UMR CNRS 7253 (Compiègne, France)

Le laboratoire Heudiasyc est localisé à Compiègne dans l'Oise, ville de taille humaine et au cadre verdoyant tout en étant à proximité de la région parisienne. L'équipe SyRI est spécialisée dans les applications pour la mobilité des robots, tels que des voitures et des drones intelligents. Nous nous focalisons sur les problèmes de décision, de commande, de localisation, de communication, de perception, et de réalité virtuelle. Le laboratoire dispose de véhicules robotisés équipés de nombreux capteurs, d’une piste d’essais, de simulateurs, et d’une volière. Notre équipe est également impliquée dans le laboratoire commun SIVALab entre UTC, CNRS et Renault (Ampere).
En vision par ordinateur, nous avons développé des compétences fortes en vision événementielle depuis 2020, avec des résultats sur des applications de calibrage, de flot optique, d'estimation des profondeurs, et de segmentation des objets mobiles.
Note : En tant que Zone à Régime Restrictif (ZRR), l’accès à Heudiasyc est conditionné par la validation des autorités.

Heudiasyc lab is located in Compiègne, a small and verdant city close to Paris. SyRI team is specialized in applications for robots mobility, such as intelligent cars and drones. We focus on decision, command, localization, communication, perception, and virtual reality problems. The laboratory has robotized vehicles equipped with various sensors, a track, simulators, and an aviary. Our team is also involved in the SIVALab common laboratory between UTC, CNRS and Renault (Ampere).
In computer vision, we developed strong knowledge in event-based perception since 2000, with results on applications such as calibration, optical flow, depth estimation, and mobile objects segmentation.
Note: As a restricted area (ZRR), Heudiasyc access is determined by the validation from authorities.

Doctorant en réseaux neuronaux ultra-basse précision pour la vision événementielle embarquée

PhD in ultra-low precision neural neworks for embedded event vision

Cette thèse vise à concevoir une nouvelle génération de réseaux de neurones binarisés ou fortement quantifiés pour le traitement de données issues de caméras à événements sur plateformes embarquées. Contrairement aux caméras conventionnelles, les caméras événementielles produisent des flux asynchrones et parcimonieux décrivant les variations locales de luminance, offrant une latence minime robuste aux mouvements très rapides et une grande dynamique. Ces propriétés sont particulièrement adaptées à la robotique, aux drones, aux véhicules autonomes et aux systèmes de perception basse consommation.

L’objectif de la thèse est de dépasser l’approche consistant à convertir les événements en pseudo-images traitées par des réseaux classiques. Il s’agira de co-concevoir les représentations événementielles, les architectures neuronales ultra-basse précision, binarisés (BNN) ou quantifiés (QNN), les stratégies d’apprentissage et les contraintes de déploiement matériel. Les modèles étudiés combineront potentiellement couches binaires, quantification mixte, mémoire temporelle, récurrence légère, attention parcimonieuse, focalisation dynamique et inférence partielle.

Les contributions attendues pourront porter sur :

l’étude des représentations événementielles compatibles avec la binarisation ;
la conception de blocs BNN/QNN adaptés aux flux asynchrones ;
le développement de méthodes d’entraînement robustes par distillation, quantization-aware training et apprentissage progressif ;
l’évaluation conjointe en précision, latence, mémoire, énergie et robustesse ;
la validation sur benchmarks publics et plateformes robotiques embarquées.

Les architectures proposées seront évaluées sur des jeux de données de référence en vision événementielle, notamment pour la classification, la reconnaissance de gestes, la détection d’objets, le suivi ou la perception robotique. Une attention particulière sera portée aux benchmarks réalistes comme Gen1 Automotive Detection, MVSEC ou DSEC, ainsi qu’à la comparaison avec des modèles événementiels récents non quantifiés.

Cette thèse contribuera ainsi à rapprocher la vision neuromorphique, l’apprentissage profond frugal et l’intelligence artificielle embarquée, avec pour ambition de produire des modèles capables d’exploiter la nature asynchrone des événements tout en respectant des contraintes strictes de temps réel et de consommation énergétique.

References:
Vision événementielle, neuromorphique, frugalité et edge AI

Gallego, G. et al. Event-based Vision: A Survey, IEEE TPAMI, 2022.
Zheng, X. et al. Deep Learning for Event-based Vision: A Comprehensive Survey and Benchmarks, 2024.
Rebecq, H. et al. Events-to-Video: Bringing Modern Computer Vision to Event Cameras, CVPR 2019.
Gehrig, M., Scaramuzza, D. Recurrent Vision Transformers for Object Detection with Event Cameras, CVPR 2023.
Peng, Y. et al. GET: Group Event Transformer for Event-Based Vision, ICCV 2023.
Gehrig, D. et al. Low-latency automotive vision with event cameras, Nature, 2024.
Cordova-Cardenas, R. et al. Edge AI in Practice: A Survey and Deployment Framework, 2025.
Cazzato, D. et al. An Application-Driven Survey on Event-Based Neuromorphic Vision, 2024.
Cimarelli, C. et al. Hardware, Algorithms, and Applications of the Neuromorphic Vision Sensor: a Review.

Binarisation, quantification et compression

Courbariaux, M. et al. Binarized Neural Networks: Training Deep Neural Networks with Weights and Activations Constrained to +1 or -1, 2016.
Rastegari, M. et al. XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks, ECCV 2016.
Liu, Z. et al. Bi-Real Net: Enhancing the Performance of 1-bit CNNs With Improved Representational Capability and Advanced Training Algorithm, ECCV 2018.
Liu, Z. et al. ReActNet: Towards Precise Binary Neural Network with Generalized Activation Functions, ECCV 2020.
Jacob, B. et al. Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference, CVPR 2018.

Stages de fin d'études : 3 offres en vision basée événements

Master Internship: 3 positions in event-besed vision

Niveau / Grade:
Master ou ingénieur
Master of Science

Dates (flexible):
6 mois à partir de février 2026
6 months starting from February 2026

Possibilité de poursuite en thèse / Possibility of continuing in PhD:
oui
yes

Bourse de stage / Legal internship Grant:
~ 620 € / Month

Sujet 1) : Réseaux de neurones légers pour la vision basée événements

Position 1): Lightweight neural networks for event-based vision

Projet / Project:
ANR REVE-BNN

Le projet REVE-BNN vise à créer des réseaux de neurones binarisés (BNN) pour traiter efficacement les données des caméras événementielles (neuromorphiques) dans le contexte d'applications robotique mobile. Contrairement aux caméras classiques, les caméras à événements ne transmettent pas des images trames à fréquence fixe, mais transmettent en continu tous changements de luminosité détectés par un ou plusieurs pixels (appelés événements) [Gallego20]. Elles offrent ainsi 3 avantanges par rapport aux caméras classiques :

plus économe en énergie et bande passante
latence et réactivité équivalente à une fréquence > à 10000Hz
dynamique du capteur non limitée par un temps d'exposition global et supérieure aux caméras HDR

Les réseaux de neurones profonds dominent l'état de l'art de nombreuses applications liées à la robotique mobile (ex : véhicules autonomes, bras manipulateurs…). Utiliser des réseaux binarisés devrait ouvrir la porte à des traitements des événements économes, rapides, implémentables sur les systèmes embarqués actuels avec des architectures de processeurs classiques [Yuan23]. Ces qualités permettront de mieux exploiter la caméra événementielle en robotique mobile et intelligente.

REVE-BNN project goal is to propose Binarized Neural Networks (BNN) to efficiently process event camera data (neuromorphic) in the context of mobile robotics applications. In opposition to standard cameras, event cameras do not emit frame images at a fixed rate, but they send a continuous flow of the luminosity changes detected by one or several pixels (called events) [Gallego20]. Hence, they offer 3 advantages over standard cameras:

more parsimonious in energy and bandwidth
latency and reactivity equivalent to a frequency > 10000Hz
sensor dynamics not bounded by a global shutter time and better than HDR cameras

Deep neural networks prevail the state-of-the-art for numerous mobile robotics applications (eg: autonomous vehilces, arm-robots…). The usage of binarized neural networks shall open the door to methods to process events that are parsimonious, fast, implementable on current embedded systems with standard processor architectures [Yuan23]. These qualities will allow to make the most of event camera for mobile and intelligent robotics.

Description:
Le but du stage est de contribuer aux BNN (Binarized Neural Networks) appliqués aux données événements. Pour cela, nous chercherons d'une part à construire des architectures BNN légères, avec capacités de focalisation et d'inférence partielle. Et d'autre part, à valider différentes manières de représenter les événements sous forme de tenseur en entrée du réseau, avec et sans capacité de mémoire. Les architectures proposées seront validées et évaluées sur différents jeux de données afin de les comparer à l'état de l'art. Des expérimentations réelles avec les véhicules du laboratoire pourront pêtre envisagées. Le stagiaire pourra d'ailleurs éventuellement profiter de déplacements scientifiques (séminaire ou visite).

The goal of this internship is to contribute to BNN (Binarized Neural Networks) applied to event data. To this end, we are looking first to build light BNN architectures, with abilities such as focalisation and partial inference. Second, to validate various manners to represent the events as an input tensor for the network, with and without memory abilities. Proposed architectures will be validated and evaluated on several dataset in order to compare them with the state-of-the-art. Real experiments with lab's vehicles can be done. The intern can also benefits of scientific trips (seminar or visit).

Encadrants et personnes à contacter / Supervisors and persons to contact:
Julien MOREAU (first_name.last_name@hds.utc.fr), associate professor, UTC, Heudiasyc UMR CNRS 7253
Franck DAVOINE (first_name.last_name@cnrs.fr), CNRS senior researcher, LIRIS UMR CNRS 5205
Sylvain ROUSSEAU (first_name.last_name@hds.utc.fr), associate professor, UTC, Heudiasyc UMR CNRS 7253

References:

[Gallego20] Gallego, Guillermo et al., “Event-based Vision: A Survey”, in Transactions on Pattern Analysis and Machine Intelligence, 2020, https://doi.org/10.1109/TPAMI.2020.3008413.
[Yuan23] Yuan, Chunyu and Agaian, Sos S., “A comprehensive review of Binary Neural Network”, in Artificial Intelligence Review, 2023, https://doi.org/10.1007/s10462-023-10464-w.

Sujet 2) : Localisation et estimation d'état à partir de vision basée événements

Position 2): Localization and state estimation using event-based vision

Description:
This internship aims to develop a new motion estimation system based on ground observation using an event-based camera embedded on the robot. The Inertial Measurement Unit (IMU) is an electronic system consisting of accelerometers and gyroscopes. In the odometry context, the mathematical integration of these sensors outputs suffer from accumulated errors leading to a drift over time. Visual odometry techniques based on motion tracking between two images have proved their efficiency for localizing robots. New approaches in visual odometry used different methods to be robust to various and poor light levels such as event-based techniques. Event-based cameras offer promising advantages over conventional cameras: microsecond-level latency, operation under challenging lighting conditions, and robustness in very low-light environments. For this type of application, lighting could even be omitted when using an event-based camera instead of a high-frame-rate conventional one.
The objective is to apply a fast optical flow method on event data, such as [Brebion22], and to localize the robot through a state estimation approach [Boyle25], [Hage18]. The fusion with IMU data will also be considered. Since optical flow data may contain errors, a robust state estimation framework incorporating fault detection and exclusion could be added.
The internship will start with a state-of-the-art review of existing state estimation methods based on optical flow. Then, a strategy will be proposed. Experiments may be conducted using the laboratory’s ground vehicle and drone platforms.

Encadrants et personnes à contacter / Supervisors and persons to contact:
Joëlle AL HAGE (first_name.last_name@hds.utc.fr), associate professor, UTC, Heudiasyc UMR CNRS 7253
Julien MOREAU (first_name.last_name@hds.utc.fr), associate professor, UTC, Heudiasyc UMR CNRS 7253

References:

[Hage18] Joelle Al Hage, Stefano Mafrica., Maan. E. B El Najjar, Franck Ruffier,. (2018). Informational framework for minimalistic visual odometry on outdoor robot. IEEE Transactions on Instrumentation and Measurement, 68(8), 2988-2995.
[Brebion22] Vincent Brebion, Julien Moreau, Franck Davoine, Real-Time Optical Flow for Vehicular Perception with Low- and High-Resolution Event Cameras, IEEE Transactions on Intelligent Transportation Systems, 23 (9), pp.15066-15078, 2022.
[Boyle25] L. Boyle, J. Kühne, N. Baumann, N. Bastuck and M. Magno, Planar Velocity Estimation for Fast-Moving Mobile Robots Using Event-Based Optical Flow, IEEE Robotics and Automation Letters, vol. 10, no. 7, pp. 7318-7325, July 2025.

Sujet 3) : Détection multimodale du regard pour l'évaluation de l'attention du conducteur dans une conduite partagée

Position 3): Multimodal gaze detection to monitor the driver attention in the context of a shared driving

Description:
Dans les véhicules hautement automatisés, la sécurité repose sur une interaction fluide entre le conducteur humain et le système automatisé. Lors des transitions de contrôle, le véhicule doit s’assurer que le conducteur est attentif et prêt à reprendre la main [Li17]. L’analyse du regard constitue alors un indicateur essentiel pour évaluer l’état d’attention, la compréhension de la situation et l’intention du conducteur.
Les méthodes reposant uniquement sur des caméras RGB ou infrarouges présentent des limites tel que la sensibilité aux variations d’éclairage, la latence élevée et dégradation des performances lors de mouvements rapides de tête ou d’occlusions partielles [Fridman19]. Les caméras événementielles offrent une alternative prometteuse : elles capturent les changements de luminosité à très haute fréquence avec une faible latence et une excellente dynamique [Gallego22]. Ces propriétés les rendent particulièrement adaptées à la capture de micro-mouvements oculaires, de clignements ou de transitions rapides du regard — éléments critiques pour détecter les états d’attention ou de distraction.
De plus, la littérature récente souligne que la relation entre conducteur et automatisation doit évoluer vers un modèle de coopération et non de simple supervision : le conducteur et le système doivent partager la situation, s’adapter mutuellement et échanger leurs intentions [Lee22]. Pour rendre ce “teaming” efficace, il est nécessaire de mesurer en continu l’état cognitif du conducteur, notamment à travers le regard, la direction de la tête et la charge visuelle. Ce stage vise à développer une approche de fusion multimodale (RGB + événementielle) pour estimer la direction du regard du conducteur et évaluer son attention. L’objectif est de concevoir un modèle robuste capable de fonctionner dans des conditions réalistes de conduite (variations d’éclairage, mouvements rapides, occlusions), en exploitant les complémentarités entre signaux RGB et événementiels.

Encadrants et personnes à contacter / Supervisors and persons to contact:
Insaf SETITRA (first_name.last_name@hds.utc.fr), associate professor, UTC, Heudiasyc UMR CNRS 7253
Julien MOREAU (first_name.last_name@hds.utc.fr), associate professor, UTC, Heudiasyc UMR CNRS 7253

References:

[Li17] R. Li, Y. Li, S. E. Li, E. Burdet and B. Cheng, “Driver-automation indirect shared control of highly automated vehicles with intention-aware authority transition,” 2017 IEEE Intelligent Vehicles Symposium (IV), Los Angeles, CA, USA, 2017, pp. 26-32, doi: 10.1109/IVS.2017.7995694.
[Fridman19] Fridman, L. et al. (2019). Driver Gaze Region Estimation Without Use of Eye Movement. IEEE Intelligent Vehicles Symposium.
Nikan, S. & Upadhyay, D. Appearance-Based Gaze Estimation for Driver Monitoring. Proceedings of The 1st Gaze Meets ML workshop 2023, 210:127
[Gallego22] G. Gallego et al., “Event-Based Vision: A Survey” in IEEE Transactions on Pattern Analysis & Machine Intelligence, vol. 44, no. 01, pp. 154-180, Jan. 2022, doi: 10.1109/TPAMI.2020.3008413.
[Lee22] J. Lee et. al. Teaming with Your Car: Redefining the Driver-Automation Relationship in Highly Automated Vehicles. Journal of Cognitive Engineering and Decision Making. 17. 10.1177/15553434221132636.
G. Zhao, Y. Shen, C. Zhang, Z. Shen, Y. Zhou and H. Wen, “RGBE-Gaze: A Large-Scale Event-Based Multimodal Dataset for High Frequency Remote Gaze Tracking,” in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 47, no. 1, pp. 601-615, Jan. 2025, doi: 10.1109/TPAMI.2024.3474858.
[] Ortega, J. D., Kose, N., Cañas, P., Chao, M.-A., Unnervik, A., Nieto, M., Otaegui, O., & Salgado, L. (2020). DMD: A large-scale multi-modal driver monitoring dataset for attention and alertness analysis. arXiv preprint arXiv:2008.12085
AAAI25-DriveGazen : https://github.com/tooyoungalex/aaai25-drivegazen https://www.kaggle.com/datasets/tooyoungalex/drivegaze

UMR CNRS 7253

Sidebar

Table of Contents

Requested profiles and work conditions

Doctorant en réseaux neuronaux ultra-basse précision pour la vision événementielle embarquée

PhD in ultra-low precision neural neworks for embedded event vision

Stages de fin d'études : 3 offres en vision basée événements

Master Internship: 3 positions in event-besed vision

Sujet 1) : Réseaux de neurones légers pour la vision basée événements

Position 1): Lightweight neural networks for event-based vision

Sujet 2) : Localisation et estimation d'état à partir de vision basée événements

Position 2): Localization and state estimation using event-based vision

Sujet 3) : Détection multimodale du regard pour l'évaluation de l'attention du conducteur dans une conduite partagée

Position 3): Multimodal gaze detection to monitor the driver attention in the context of a shared driving

UMR CNRS 7253

Site Tools

Sidebar

Table of Contents

Requested profiles and work conditions

Doctorant en réseaux neuronaux ultra-basse précision pour la vision événementielle embarquée

PhD in ultra-low precision neural neworks for embedded event vision

Stages de fin d'études : 3 offres en vision basée événements

Master Internship: 3 positions in event-besed vision

Sujet 1) : Réseaux de neurones légers pour la vision basée événements

Position 1): Lightweight neural networks for event-based vision

Sujet 2) : Localisation et estimation d'état à partir de vision basée événements

Position 2): Localization and state estimation using event-based vision

Sujet 3) : Détection multimodale du regard pour l'évaluation de l'attention du conducteur dans une conduite partagée

Position 3): Multimodal gaze detection to monitor the driver attention in the context of a shared driving

Page Tools

User Tools