JdS2012


 English   -  Français  

Résumé de communication



Résumé 277 :

Prise en compte des données manquantes en analyse exploratoire des données
josse, julie
Agrocampus

Dans cette présentation, nous nous intéressons à la prise en compte des données manquantes en analyse exploratoire des données, en particulier en analyse en composantes principales pour les variables quantitatives et en analyse des correspondances multiples pour les variables qualitatives. Nous nous focalisons dans un premier temps sur l'estimation ponctuelle des paramètres à savoir les axes et composantes principales. Nous présentons les méthodes existantes dans un cadre unitaire en insistant sur le fait que les principaux algorithmes peuvent être vus comme des algorithmes EM associés à des modèles particuliers (souvent implicites) d'analyse de données. Nous mettons aussi en avant le fait que l'estimation ponctuelle des paramètres s'accompagne d'une imputation plus ou moins explicite des données. Puis nous développons un nouvel algorithme, qui s'apparente à des techniques de décomposition en valeurs singulières seuillées itérative pour pallier le problème majeur du surajustement. L'estimation ponctuelle est enfin enrichie par la construction de zones de confiance. Une méthode non paramétrique d'imputation multiple est développée pour prendre en compte l'incertitude supplémentaire due aux données manquantes.