JdS2012


 English   -  Français  

Résumé de communication



Résumé 239 :

Construction et comparaison de modèles bayésiens à composantes spatiales partagées pour combiner des données épidémiologiques éparses et hétérogènes et détecter l'occurrence de biais.
Ancelet, Sophie ; Abellan, Juanjo ; Richardson, Sylvia ; Del Rio Vilas, Victor ; Birch, Colin
IRSN - Laboratoire d'épidémiologie & Imperial College - Department of Epidemiology and Public He

Nous proposons plusieurs modèles bayésiens à effets aléatoires spatiaux partagés pour l'analyse géographique du risque de maladie, informé par de multiples sources de surveillance dont les données sont éparses et hétérogènes. Nous considérons le cas d'une maladie puis de deux maladies susceptibles de partager des facteurs de risque environnementaux communs. Notre travail est motivé par l'analyse des variations spatiales du risque de deux formes de tremblante du mouton au Pays de Galles à partir de trois sources de surveillance hétérogènes pour chaque maladie. L'objectif est de formuler des hypothèses quant au caractère infectieux/sporadique de chaque forme de tremblante et de détecter et discuter d'éventuelles différences dans l'information apportée par chaque source de surveillance. Nous considérons également le problème de la comparaison des différents modèles hiérarchiques bayésiens proposés. Nous appliquons notamment une technique récente de validation prédictive a posteriori mixte, comparons différents scores prédictifs ainsi que des histogrammes PIT non-randomisés afin de sélectionner le meilleur modèle prédictif. Notre cas d'étude montre qu'utiliser les modèles à composantes spatiales partagées proposés améliore l'estimation du risque de maladie par rapport à une analyse séparée de chaque source d'information. Cela permet de détecter des biais spatialement structurés et de les corriger afin d'extraire la vraie surface de risque d'intérêt. Nous observons également qu'un écart entre les données observées et les hypothèses de modélisation conduit à sous-prédire le risque de maladie. Enfin, lorsque les données sont très éparses, l'ajout d'effets aléatoires résiduels non-spatiaux peut ne pas être un choix de modélisation optimal.