Classification croisée et sélection de modèle

Résumé

ClasSel est un projet ANR de recherche académique qui vise à développer des méthodes de transformation de données en connaissances. Les données en question se présentant sous la forme d’une matrice individus-variables, nous cherchons à produire de la connaissance sous la forme de groupes homogènes de données associant conjointement les individus et les variables. C’est le problème de classification croisée. Nous envisageons d’attaquer ce problème formellement à travers une modélisation probabiliste. Notre projet vise à adapter cette modélisation aux problèmes spécifiques de la classification croisée pour les données de grande taille, des algorithmes d’estimation adapté du type EM. une attention particulière étant mise sur le problème, fondamental, du choix du nombre de groupes. C’est la question de la sélection de modèle. À cette fin, nous comptons nous placer dans un cadre statistique nouveau et particulièrement bien adapté. Nous nous proposons aussi de mettre en œuvre nos solutions sur des exemples concrets, comme le challenge Netflix sur les systèmes de recommandation, et de traiter des applications en analyse automatique de texte et en marketing.

Documents

 
fr/accueil.txt · Dernière modification: 10/09/2009 13:55 par ggovaert
Recent changes RSS feed Creative Commons License Donate Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki