Ce travail a été développé en association avec le Projet PREDIM P@ssITS, déposé avec ALSTOM Transport et TRANSDEV (Octobre 2003 – Avril 2005)
L’objectif du projet P@ssITS est de développer et expérimenter un Serveur d’Information Voyageurs (SIV), situé au centre d’exploitation d’un réseau tramway afin de pouvoir diffuser, en temps réel, des informations nécessaires aux clients pour préparer puis effectuer leur déplacement, notamment lorsque les conditions d’exploitation sont dégradées.
Le projet consiste donc à préciser et valider les attentes et besoins d’information multimodale ou intermodale des clients d’un réseau de tramways, définir l’architecture et développer le SIV, l’intégrer au système actuel de communication et de transmission d’informations et l’expérimenter sur un site réel.
Le travail de thèse s’est concentré sur la partie relative à l’étude des besoins des usagers en matière d’information voyageur. Il s’agissait de développer une méthode expérimentale de recueil des informations qui décrivent ces besoins, une méthode objective d’analyse des données retenues, et enfin un formalisme de représentation des informations décrivant ces besoins sous une forme calculable et implémentable.
La première phase du travail a été de mettre en place un protocole de recueil de données usagers et d’acquérir effectivement ces données. Ce travail préliminaire s'est appuyé sur des méthodes ergonomiques pour définir des plans d’expérience et sur des méthodes de représentation et de traitement de l’information pour l’exploitation des données. Cette partie expérimentale a été développée en collaboration avec les membres de l’équipe ODIc du département Génie Mécanique de l’UTC, Alstom et Transdev, sur le site de la ville d’Orléans.
Nous avons ensuite développé les premiers outils de traitement de ces données pour les mettre sous forme de tableaux de données exploitables. Ces tableaux contiennent des représentations caractéristiques des chronologies de trajets, des actions et des profils utilisateurs, de recherche et d’utilisation d’information, et des incidents relatifs à la diffusion d’information (contenu, support, fréquence de rafraîchissement, etc.). L’étude des sites d’Orléans et de Grenoble nous a permis également de constituer de représentations schématiques et formelles des différents parcours de circulation de l’information et des ressources mobilisées par les Systèmes d’Aide à l’Exploitation (SAE). Nous avons distingué d’une part les schémas génériques de diffusion dans le cas d’événements programmables (manifestations, travaux, …) et d’autre part dans le cas de requêtes spontanées (demande d’itinéraire, recherche d’objet, de personne, etc.).
La troisième étape de ce travail a porté sur la définition d’un formalisme objet, qui permet de représenter différents modèles descriptifs des activités de déplacement d’un usager des transports en commun. On a pu en exhiber essentiellement deux. Un modèle statique, qui représente les différents objets en interaction (l’usager, les lieux, les titres de transport, les modalités de transport, les médias de diffusion, les services et institutions, etc.). Un modèle dynamique, qui représente les différentes actions relatives à la recherche et à la production d’information (recherche d’itinéraire, émission de message, changement de modalité, planification de trajet, affichage, etc.). Ce modèle a été représenté dans le formalisme UML particulièrement bien adapté à ce domaine.
Nous sommes actuellement dans la dernière phase qui consiste à implémenter une partie représentative de ces modèles dans un langage de programmation. Nous pourrons ainsi montrer qu’on peut reconstituer les actions des usagers qui ont été observées pendant la phase expérimentale, mais aussi générer des situations qui n’avaient pas été observées dans la phase expérimentale. Cette possibilité permettra d’apporter une information plus complète dans le processus de conception d’un système d’information voyageur.
L'objectif de cette thèse consiste à proposer des méthodes de construction de similarités à partir de représentations sous différentes formes : graphe décrivant ontologie du domaine, modèle probabiliste d'une séquence, etc. Quand ces représentations sont complètes, le problème consiste à quantifier et à combiner les similarités obtenues sur chaque description ; quand elles sont incomplètes, il faut alors en induire des contraintes sur le résultat final. Ce travail méthodologique trouve des applications dans de nombreux domaines. Nous privilégierons ceux de la fouille de textes et de la bioinformatique. L'application à la fouille de texte est plus sûre, car les problèmes y sont déjà bien formalisés. L'application à la bioinformatique est plus risquée, mais son aspect pluridisciplinaire et ses retombées sociétales nous paraissent d'un intérêt supérieur.
Dans le problème de classement de documents textuels, l'ontologie sur les documents conditionne la notion de similarité sur les mots. Cette dernière, tirée d'une ontologie généraliste comme WordNet, doit être adaptée au problème considéré. Selon l'application, les arcs reliant certains mots doivent être renforcés ou supprimés : chats et chiens devront être fortement différenciés dans des documents vétérinaires, alors que la distinction sera sans doute moins pertinente dans un contexte sociologique. Des problèmes similaires se posent dans un tout autre domaine, pour la classification de toxines sanguines (réponse à l'appel d'offre de l'axe prospectif UTC Système et vivant). En génomique, au-delà des données expérimentales d'expression de gènes, nous disposons de connaissances formalisées sous diverses formes, comme la séquence de nucléotides formant les gènes, la position de ces gènes sur des chromosomes (particulièrement pertinente pour les bactéries comme Yersinia pestis), ou des ontologies incomplètes, comme les voies métaboliques liées à l'expression de certains gènes. Dans ce domaine, nous bénéficions d'une collaboration avec l’Institut Pasteur, ce qui permet d'envisager l'établissement de similarités biologiquement motivées. Cette application s’inscrit également dans le cadre de notre réponse à l'appel d'offre masse de données de l'ANR sur le thème de la génomique fonctionnelle.
Les technologies numériques multimédias ont largement fait leur intrusion dans le contexte documentaire. Les pratiques d’écriture et de lecture autour de ces « nouvelles » technologies sont encore largement en structuration et encore largement à instrumenter.
L’objectif du projet est d’étudier, de réaliser, de mettre en œuvre et d’évaluer un dispositif informatique pour l’aide à l’écriture et à la lecture de contenus numériques multimédias structurés en contexte d’enseignement et de recherche. L’enjeu thématique du projet est centré sur les nouvelles méthodes et les conditions sociales de l’enseignement et de la formation. L’enjeu épistémologique se situe principalement sur les sciences et technologies de l’information et de la communication (en particulier l’ingénierie des connaissances et l’ingénierie documentaire), et les sciences humaines associées (en particulier la philosophie de la technique). L’enjeu applicatif du projet est l’évaluation et la diffusion de pratiques innovantes et pertinentes dans l’enseignement, du primaire au supérieur, ainsi qu’en formation tout au long de la vie.