JdS2012


 English   -  Français  

Résumé de communication



Résumé 208 :

Cross-Validation for the $k$NN algorithm in classification: some theoretical results
CELISSE, Alain ; Mary-Huard, Tristan
UMR 518 AgroParisTech/INRA MIA

Dans le cadre de la classification binaire supervisée, nous considérons le classifieur des $k$ plus proches voisins ($k$NN) pour lequel une question importante est celle du choix de $k$ le nombre de voisins. Pour choisir ce paramètre, nous envisageons l'algorithme de validation-croisée (CV) appelé \emph{Leave-$p$-Out} (L$p$O) pour lequel des formules explicites ont été établies. Dans ce travail, nous étudions les propriétés théoriques du L$p$O en tant que : $(i)$ procédure d'estimation du risk, puis $(ii)$ procédure de choix du paramètre $k$. % Dans le premier cas, nous démontrons qu'à $p$ fixé, l'estimateur L$p$O est universellement consistant. % Dans le deuxième cas, la performance de la stratégie est garantie \textit{via} des bornes de déviation uniforme avec grande probabilité pour le risque du classificateur $k$NN résultant.