Séminaire (organisé par l’équipe de recherche DI)

Vincent BRAULT

Post-doctorant, AgroParisTech


Une méthode rapide de segmentation des lignes et des colonnes pour des matrices de grande taille


Jeudi 9 mai 2016 à 14 h en salle GI042

Résumé :

Dans certains cas, comme pour les données Hi-C, l’objectif est de partitionner les lignes et les colonnes d’une matrice pour former un quadrillage de blocs homogènes sans effectuer de permutations. Toutefois, ce problème peut être compliqué pour plusieurs raisons : les méthodes utilisées en segmentation unidimensionnelle comme l’algorithme de programmation dynamique ne s’appliquent pas dans ces cas là et la taille des données impose de proposer des algorithmes performants.

En réalité, nous montrons que ce problème peut être ramené à celui d’un modèle linéaire parcimonieux de grande dimension pour lequel nous proposons une méthode de sélection de variables rapide et efficace.

Dans cet exposé, nous montrerons comment notre méthode fournit un quadrillage pour des matrices de grandes tailles (10 000x10 000). Nous montrerons également comment la structure bidimensionnelle permet d’obtenir une bonne estimation du nombre et des emplacements des ruptures. Nous illustrerons nos résultats à l’aide de figures et de films et appliquerons nos méthodes sur des données simulées et réelles.



Actualités
Vidéothèque
Téléchargements
Annuaire



FR SHIC 3272

Collegium UTC/CNRS