Adaptation des systèmes d’information multimédia aux utilisateurs

Un des objectifs des systèmes hypertextes est de fournir aux utilisateurs une information enrichie, par l’association des différentes sources disponibles. Selon les besoins des utilisateurs, les enjeux sont de leur proposer des parcours de navigation adaptés à leur recherche d’information et de répondre directement à leurs requêtes par une sélection de l’information appropriée. Pour satisfaire ces attentes, on peut soit chercher à construire un modèle de représentation de l’utilisateur, soit mettre en évidence comment les ressources et les données qu’il doit manipuler s’articulent pour apporter les réponses souhaitées. C’est cette seconde approche qui a été suivie. Il s’agit, à partir de l’observation de parcours de navigation, d’analyser les ressources d’information mobilisées et la circulation de celles-ci pour construire une réponse, et de proposer des modèles de données et de connaissances qui possèdent les caractéristiques et fonctions adéquates.

Dans le cadre d’un problème d’aide à la définition de trajet dans un réseau de transport multimodal, à partir du recueil expérimental de données usagers, nous avons proposé un modèle qui, pour différentes étapes d’une chronologie de trajets, représente les actions des utilisateurs relatives à la recherche et l’utilisation d’information pour la réalisation d’un objectif. Il s’appuie sur un formalisme objet qui représente deux modèles descriptifs des activités d’un usager : un modèle statique des différents objets en interaction, un modèle dynamique des différentes actions relatives à la recherche et à la production d’information. L’implantation de ces modèles dans un outil de simulation a montré qu’on pouvait reconstituer les actions des usagers qui ont été observées pendant la phase expérimentale, mais aussi engendrer des situations qui n’avaient pas encore été observées.

Lecture intensive, écriture structurée et gestion de contenus numériques multimédia

Les pratiques d’écriture, de lecture et de gestion des documents numériques multimédia sont encore largement en structuration et encore à instrumenter. La lecture critique se caractérise par la double nécessité de discrétiser des contenus existants et d’en construire de nouveaux, c’est-à-dire d’élaborer de nouvelles configurations documentaires à partir des fragments résultant de la discrétisation des ressources. Si, dans le cas des contenus textuels, la lettre joue le rôle d’opérateur de discrétisation, les contenus sonores, graphiques et audiovisuels opposent une résistance au développement d’un appareillage critique allant au-delà de leur simple consommation, recherche ou archivage. De plus, les documents multimédia se caractérisent souvent par l’existence de plusieurs transcriptions graphiques et plusieurs interprétations sonores. Nous avons travaillé, d’une part, sur l’élaboration d’un modèle documentaire qui rend possible les opérations critiques fondamentales de la lecture savante et, d’autre part, nous avons commencé un travail sur des méthodes de description de l’objet audiovisuel dès son acquisition afin de mieux servir sa production et son archivage.

Le modèle documentaire s’appuie sur une couche d’entités sémantiques génériques qui rendent possibles les opérations critiques fondamentales de la lecture savante, indépendamment de la nature des documents concernés. La généricité sur laquelle repose ce modèle permet alors de disposer, d’une part, d’un socle commun sur lequel différents outils de représentation et de manipulation des fragments viennent se greffer et, d’autre part, d’un « ciment » sémantique tout au long de la chaîne lectoriale assurant l’inscription de l’interprétation et, non plus seulement, l’inscription du contenu. Les fragments unitaires des fichiers de ressources brutes sont représentés par une classe abstraite Sample, admettant d’être dérivée pour représenter les spécificités de localisation de portions propres à chaque média. Ces Samples peuvent alors être agrégés dans des Material Entities, qui permettent leur manipulation comme une entité unique. La critique repose sur la possibilité d’identifier des zones pertinentes au sein des documents. On peut décrire ces sélections avec du contenu ou des métadonnées textuelles, les typer à l’aide d’une catégorie préalablement explicitée ou encore les mettre en relation par des objets de type Links avec d’autres sélections ou documents. Ces entités peuvent être enrichies et combinées de sorte que l’arbre logique créé par l’imbrication des unités structurelles articule autant d’unités matérielles identifiées en tant que telles, permettant ainsi d’exploiter un même fragment de contenu dans différents contextes interprétatifs.

En ce qui concerne les documents audiovisuels, nous avons débuté une recherche sur le développement de méthodes qui tiennent compte d’une description de l’objet audiovisuel dès son acquisition, afin de mieux servir sa production et son archivage. L’objectif est également d’en faciliter l’accès au contenu. Ces méthodes s’appuieront sur la modélisation USE (Unique Semantic Entity), l’écriture d’une grammaire de l’audiovisuel et la modélisation de l’OSB (Open Semantic Bus). La validation se fera sur la construction d’une étude de cas de production collaborative entre professionnels et amateurs au sein d’un canal de production.

Préservation des contenus documentaires

La préservation des contenus bute sur deux difficultés : le fossé d’intelligibilité qui se creuse entre le contexte d’origine du contenu et le contexte courant d’interprétation où il devient progressivement inintelligible, le fossé d’obsolescence qui se crée quand le format technique du contenu exige des outils qui ne sont plus opérationnels. Pour assurer la lisibilité technique (fossé d’obsolescence) et la lisibilité culturelle (fossé d’intelligibilité) à travers le temps, il faut développer des outils et méthodes appropriés. En se fondant sur la norme OAIS, nous avons développé une approche de la préservation par l’accès, qui repose tant sur une pratique documentaire de l’archivage menée dans des centres de conservation (INA notamment) que sur un modèle philosophique de la mémoire. Le principe de base est que la préservation d’un contenu est davantage assurée par son usage et son exploitation que par son stockage. En effet, si un contenu est utilisé, on s’assure par ce fait même de sa lisibilité technique, mais on vérifie également son intelligibilité, sa lisibilité culturelle. Quand un défaut de compréhension est constaté, une glose est alors produite et doit être intégrée au contenu pour transmettre cette élucidation aux futures lectures. Par conséquent, l’instrumentation de la préservation par l’accès rejoint les préoccupations du thème précédent concernant la lecture intensive et l’agrégation des productions de lecture dans le contenu à préserver.

Cette approche renvoie à de nombreux problèmes qui se font prégnants aujourd’hui : l’authenticité des contenus, qui doit être assurée même quand ils sont transformés pour rester lisibles, et qu’il faut relier au problème, l’identité qu’il faut établir alors qu’il y a de multiples exemplaires voisins, qui, sans être complètement identiques, se disputent l’authenticité. L’enjeu reste alors l’instrumentation de l’agrégation des élucidations des contenus et donc le développement de l’ingénierie documentaire correspondante. Cela se traduit par plusieurs types de travaux : l’annotation dans les documents techniques, notamment dans le contexte de Product Life Management System, le projet C2M en cours, qui porte sur l’écriture collaborative et donc la difficulté de confronter différentes versions d’un « même » contenu à dégager et préserver à travers ses multiples avatars.

Ontologies, méthodes de construction et utilisation d’ontologies

Les ontologies sont des représentations formalisées des concepts d’un domaine donné. Elles dégagent et modélisent les primitives qui expriment les connaissances de ce domaine dans le langage formel de représentation qui sera utilisé pour exploiter ces connaissances dans des applications informatiques. La construction d’ontologies est un problème difficile, la mise à disposition de méthodes peut en faciliter la résolution. De telles méthodes doivent tenir compte du contexte de construction. Une fois l’ontologie construite, il est nécessaire d’en proposer des usages adaptés.

Parmi les nombreuses difficultés que pose la construction d’ontologies, nous nous sommes intéressés à celles relatives à leur structuration. Nous avons développé une méthodologie s’appuyant sur la sémantique différentielle (sémantique de la langue naturelle) qui permet de dégager, à partir de leur expression en langue, les notions que l’on caractérise de manière à en faire des primitives. Cette méthode a été utilisée dans de nombreux domaines, dont la médecine et le droit.

Nous travaillons à l’élaboration d’une méthode fondée sur les ontologies catégoriales pour guider la formalisation des ontologies différentielles. Une ontologie catégoriale se définit, dans ce contexte, comme l’ensemble des notions caractérisant les manières de penser et de structurer le monde : rôle, substances, propriétés, etc. Autrement dit, on peut caractériser une catégorie comme une primitive de modélisation, c’est-à-dire comme un outil ou une manière de s’exprimer pour représenter le domaine dans lequel on est.

Nous nous sommes également intéressés à la conceptualisation des ontologies. De nombreuses ressources peuvent être exploitées pour construire une ontologie. Certaines offrent une structuration qui peut servir de point de départ pour identifier les concepts et relations d’une ontologie. Ainsi, à partir de la structure XML du standard LOM (Learning Object Metadata), nous avons établi un ensemble de règles de construction permettant d’en obtenir un modèle ontologique. Nous travaillons actuellement à la généralisation de telles règles pour tout type de ressource structurée au format XML.

Nous avons également établi une méthode, adaptée des méthodes assez génériques, au domaine particulier du e-gouvernement. Les éléments principaux concernent la multi-utilisabilité d’une même ontologie, les aspects multiculturels et multilingues à prendre en compte dès l’étape de conceptualisation. Pour aider à la reconnaissance des concepts, nous avons exploité en amont des procédés utilisés en analyse de langue naturelle puis différentes collaborations avec des experts ; en aval, nous avons pris en compte les problèmes d’interaction avec les utilisateurs. Nous avons également proposé le formalisme de représentation des connaissances SOL (Simple Ontology Language) qui a été intégré à la plateforme OMAS.

Les ontologies sont évaluées à partir de leur structure mais aussi par leur utilisation. Les usages que nous avons considérés sont :

  • L’indexation sémantique de documents dans un contexte distribué. Il s’agit de concevoir des descriptions sémantiques de documents et de les répartir dans un index distribué sur plusieurs sites. Les méthodes de recherche sont alors à adapter.
  • La description sémantique de services Web et leur indexation. Le problème est complexe puisque l’objectif est de retrouver dynamiquement un service répondant à un besoin. Nous avons proposé SPARQL comme langage formel pour décrire des services et les buts des agents les recherchant. Le fondement théorique de nos travaux repose sur une logique modale hybride combinant la composante dynamique de la logique des propositions avec des patrons de graphes SPARQL.
Pages 1 | 2


Actualités
Vidéothèque
Téléchargements
Annuaire



FR SHIC 3272

Collegium UTC/CNRS