JdS2012


 English   -  Français  

Résumé de communication



Résumé 94 :

Décorrélation de variables en régression linéaire par modèles de sous-régressions
Théry, Clément ; Biernacki, Christophe ; Loridant, Gaétan
Université Lille 1, Inria, CNRS, ArcelorMittal

Les bases de données issues de la sidérurgie sont souvent de grande dimension (process très long avec de nombreux paramètres) et contiennent de fortes corrélations entre variables. Certaines variables s'écrivent parfois directement en fonction des autres via des modèles physiques ou sont liées par nature. Enfin la route métallurgique, qui est propre au type de produit fini, conditionne l'essentiel du process et induit donc des fortes corrélations entre variables. L'idée maîtresse est de considérer que certaines variables forment des sous-régressions, en s'exprimant les unes en fonction des autres. On peut alors supprimer momentanément une partie des variables pour s'affranchir des problèmes de conditionnement inhérents à la régression linéaire et ensuite réinjecter l'information supprimée, en s'appuyant sur la structure qui relie les variables. Le modèle final tient donc compte de toutes les variables mais sans subir les conséquences des corrélations entre variables ou du manque d'individus. Cette recherche se place dans un contexte sidérurgique (ArcelorMittal Dunkerque).