Séminaire (organisé par l’équipe de recherche DI)

Massih-Reza AMINI

Centre de Recherche National du Canada (CRNC/NRC)


Apprentissage multi-vues de fonctions de classification dans un environnement multi-langues


Mardi 14 décembre 2010 à 14h en C221


Résumé :

Nous avons formalisé le problème de la classification dans un corpus comparable (où chaque document du corpus est au préalable traduit dans toutes les autres langues présentes dans la collection) comme l’apprentissage multi-vues de fonctions de classification. Dans ce cas, une observation est considérée comme une séquence de vues où la vue observée correspond à un document initial du corpus, écrit dans une langue donnée, et où les autres vues correspondent aux traductions de ce document dans toutes les autres langues disponibles dans le corpus.

La comparaison d’une borne de l’erreur en généralisation d’un classifieur multi-vues, appris en utilisant les vues (documents) initiales ainsi que celles générées par la traduction, avec une borne de l’erreur en généralisation d’un classifieur appris uniquement avec les vues initiales, révèle un compromis entre la taille de la base d’entraînement, le nombre de vues ainsi que la qualité des traductions. Ce compris permet d’identifier les situations où il serait plus intéressant d’utiliser le cadre multi-vues pour apprendre au lieu du cadre classique d’apprentissage avec des données mono-vues. Une extension naturelle de ce cadre permet d’inclure des données multi-vues non-étiquetées dans le processus de l’apprentissage (apprentissage semi-supervisé).

Des résultats expérimentaux sur un sous-ensemble de la base de Reuters RCV1/RCV2 (publiquement disponible http://multilingreuters.iit.nrc.ca/ReutersMultiLingualMultiView.htm) confirment nos résultats précédents.

Seminars


Lundi 6 novembre 2017

Séminaire à 14 h 00 en GI042 (Bâtiment Blaise Pascal de l’UTC) présenté par Cheng-Lin LIU, Professeur et Directeur du laboratoire NLPR à Pékin.
« Research in CASIA, Beijing »


Mardi 20 juin 2017

Séminaire à 14h en GI042 (bâtiment Blaise Pascal), présenté par Patrice Perny, LIP6.
« Décision interactive sur domaine combinatoire par élicitation incrémentale de préférences ».


Jeudi 11 mai 2017

Séminaire à 14h en GI042 (bâtiment Blaise Pascal), présenté par Nicolas Maudet, LIP6 (Equipe SMA).
« Current issues in argumentation ».


Mardi 4 avril 2017

Séminaire à 14 h dans l’amphi du Centre d’Innovation de l’UTC, présenté par Xavier LAGORCE, PhD, Head of Computer Vision, Chronocam.
« Chronocam : Event-based cameras for machine vision »


Pages 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ...




Actualités
Vidéothèque
Téléchargements
Annuaire



FR SHIC 3272

Collegium UTC/CNRS