Séminaire (Organisé par l’Equipe de recherche DI)

Antoine BORDES

Chargé de Recherche CNRS, Heudiasyc


Traiter de grandes masses de données relationnelles grâce à l’apprentissage automatique


Mardi 15 octobre 2013 à 14h en salle C221


Résumé :

D’innombrables quantités de données complexes peuvent êtres représentées comme des graphes dont les nœuds représentent les concepts mis en jeu et les arcs les relations entre eux. Ces données, communément appelées données relationnelles (ou "relational data"), sont au cœur de nombreux systèmes de gestion de l’information en bio-informatique, fouille de données ou marketing par exemple. Cette présentation va traiter de deux directions de recherche concernant ces données qui sont actuellement en plein essor. En premier lieu, comment manipuler (c’est-à-dire résumer visualiser, fusionner, réparer) aisément ces bases de données, sachant que leurs dimensions peuvent être énormes, et que la qualité de leurs données peut être incertaine ?

En second, comment organiser automatiquement des données non-structurées dans de tels schémas ? Ces problématiques seront illustrées dans le contexte des bases de connaissances (comme WordNet et Freebase par exemple) et de leur relation au texte brut par le biais d’extraction d’information automatique. Nous présenterons les résultats de travaux que nous menons au CNRS et à l’Université de Technologie de Compiègne, conjointement avec l’INRIA, l’Université de Montréal, Xerox et Google.



Actualités
Vidéothèque
Téléchargements
Annuaire



FR SHIC 3272

Collegium UTC/CNRS