JdS2012


 English   -  Français  

Résumé de communication



Résumé 59 :

Un protocole de simulation de données pour la classification croisée
LOMET, Aurore ; Govaert, Gérard ; GRANDVALET, Yves
UTC, Heudiasyc

Les données simulées sont intéressantes pour l'étude des algorithmes d'apprentissage. Cependant, en classification croisée, leur génération pose des problèmes qui n'ont pas d'équivalents en classification simple (sur une dimension du tableau). En particulier, la quantification de la difficulté intrinsèque du problème d'apprentissage, définie par l'erreur de Bayes en classification, est problématique. Nous revenons aux principes fondateurs de l'apprentissage statistique en définissant des fonctions coûts, règles de Bayes et risques pour la classification croisée. Puis, nous décrivons les difficultés liées à l'estimation de ces quantités. Pour finir, nous proposons un processus de génération de données simulées par le modèle de blocs latents.