UMR CNRS 7253

Outils du site


fr:hiron

HIRON

Analyse automatique de textes sur la conjoncture économique

Intéressés

Jean-Christophe Planès, Philippe Trigano

Objectif du projet

Le projet concerne la réalisation d'un système d'analyse et de génération automatique de textes de synthèse pour les enquêtes de conjonctures mensuelles de la Banque de France

Contexte

Ce travail s'inscrit dans le cadre du projet HIRON-DELLE du CIA (Centre d'Intelligence Artificielle) de la Banque de France. Le but est d'analyser automatiquement des formulaires de synthèse sur l'activité économique des entreprises sur le court terme, dans les secteurs du bâtiment, de l'industrie, du commerce et des services. Ces formulaires sont envoyés régulièrement par des services régionaux à la direction de la conjoncture. Ce projet est constitué de deux systèmes intelligents indépendants :

- HIRON (Harmonisation et Interprétation des Résultats d'Observations Nationales) est consacré à l'analyse des commentaires libres des formulaires ainsi qu'à la génération de textes de synthèse résumant les résultats de l'analyse.

- DELLE (Dépouillement d'Enquêtes par Logiciel Expert) est un système expert d'ordre O+ dont l'objectif est l'analyse des données chiffrées et leur transformation en données qualitatives afin de produire par génération automatique un texte de synthèse.

Notre travail a porté uniquement sur la partie HIRON (analyse automatique des commentaires de l'ensemble des formulaires, et génération d'un texte de synthèse).

Caractéristiques

Nous nous sommes penchés plus spécifiquement sur la réalisation de l'analyseur des textes, et la représentation du contenu sémantique de ces derniers. Cependant, une maquette de générateur a été ébauchée, afin de valider les inférences effectuées, dans le cadre d'un raisonnement sur ces textes. Lors de l'analyse, notre recherche porte essentiellement sur une étude des formes syntaxiques utilisées, ainsi que sur les prédicats sémantiques pouvant être décelés à travers notre corpus de textes. L'analyseur doit alors extraire des concepts typiques, en se basant notamment sur la sémantique des verbes, et gérer des références temporelles assez nombreuses.

Une représentation interne sous forme de réseaux sémantiques a d'abord été utilisée, puis a été étendue aux graphes conceptuels. Une modélisation des connaissances pragmatiques a été effectuée sous forme de règles. Un système d'inférence permet ainsi de trouver des faits nouveaux, et de résoudre certaines ambiguïtés liées essentiellement à l'implicite. Rappelons qu'il s'agit d'un domaine ciblé (notre système est en cours de validation dans le domaine du commerce de détails, et plus précisément dans celui du commerce de la chaussure). Ainsi, une phrase telle que “Forte demande des ajourés mais baisse des lacets” signifie que 'les chaussures d'été, de type sandalettes, ont été beaucoup vendues, alors qu'il y a eu moins de ventes de chaussures à lacets'.

Références

Planès JC. : “Un système d'anamyse et de génération automatique de textes de synthèse pour les enquêtes de conjonctures de la Banque de France”, Thèse de doctorat de l'Université de Technologie de Compiègne, décembre 1993.

Planès JC., G. Védrenne : “Un système d'analyse en langage naturel et de génération automatique de textes de synthèse pour les enquêtes de conjoncture de la Banque de France”; 11th International Conference on Expert Systems and theirs Applications, Avignon, 1991.

Planès JC., P. Trigano : “Object oriented representation in a natural language understanding system of economic surveys”, Applications of Artificial Intelligence X, SPIE Intelligent Information Systems, Orlando Floride USA, Avril 1992.

Planès JC., P. Trigano : “Semantic Analysis of Economic Surveys”, publié dans la revue Applied Artificial Intelligence, Vol 7, issue 3, septembre 1993.


Outils pour utilisateurs