JdS2012


 English   -  Français  

Résumé de communication



Résumé 282 :

Impact de la dépendance dans les procédures de tests multiples en grande dimension
Friguet, Chloé
Univ. de Bretagne Sud - CNRS - UMR 6205, Laboratoire de Mathématiques de Bretagne Atlantique

Les données générées par les biotechnologies haut-débit sont caractérisées par leur grande dimension et leur hétérogénéité. L’analyse statistique de ces données remet en cause y compris les approches les plus éprouvées, comme les méthodes usuelles d'inférence statistique. Motivé par des applications dans le domaine de l'analyse de données génomiques, mon travail de thèse porte sur l'étude de l'impact de la dépendance sur les propriétés des procédures de tests multiples en grande dimension. Cet exposé a pour objectif de présenter les principaux résultats : après une description introductive des principales problématiques liées à la présence de dépendance, les mesures de risques d’erreurs et les algorithmes permettant de contrôler ces risques lors de la mise en ?"uvre de procédures de tests multiples sont plus particulièrement étudiés. Cette étude analytique aboutit à la définition d’un cadre général de la prise en compte de l’hétérogénéité des données, grâce à la modélisation de la structure de dépendance par Analyse en Facteurs. L’instabilité des procédures induite par la présence de dépendance est alors réduite, procurant à la fois une augmentation de la puissance des tests et une diminution de la variabilité des taux d'erreurs. La mise en ?"uvre de cette méthode est également évoquée (estimation des paramètres du modèle en grande dimension, choix du nombre de facteurs), et les résultats méthodologiques sont illustrés à partir de données génomiques analysées à l'aide du package FAMT du logiciel libre R.