Apprentissage, Classification et prévision.
L'objectif
de ce cours est de fournir aux étudiants les bases géométriques
nécessaires à la compréhension de la plupart des méthodes de
classification. Nous abordons également la notion d'apprentissage en
statistique au travers de différents modèles de classification /
régression (arbre, analyse discriminante) et des techniques de
prévision associées (taux de mauvaise classification, erreur de
prévision, modèles aggrégés, bagging). Le dernier tiers des
enseignements est effectué sur machine avec l'objectif de mettre en
oeuvre l'ensemble des développement théoriques proposés en cours à
partir de données réelles en océanographie.
Introduction (document pdf)
Contient le document pdf qui permet de motiver ce cours au travers de différents exemples pris en océanographie
exemples en R
Ce
lien pointe vers les programmes réalisés en R et qui permettent
d'illustrer les notions abordées dans le cours (inertie, k-means)
Prevision avec R
Ce
lien pointe vers un script en R qui teste differente qualite de
prevision entre arbres de classification et analyse discriminante sur
des donnees de l'etang de Berre de la rubrique 'Data Mining'. On
utilise a la fin une version agregee des predicteurs.
dataset
Ce
lien pointe vers un jeu de donnees berre.txt.
Analyse discriminante et classification
- Ici, une analyse factorielle discriminante en 3 groupes avec regle de decision bayesienne construite sur le premier facteur
- Les
fichiers suivants permettent d'effectuer une ACP des données de
pollution sur l'etang de BErre. Une AFD est ensuite realise pour voir
si la granulometrie est un facteur iscriminant de la pollution par les
metaux lourds.
Fichier R : berre.r
Données : berrre_76.txt, bercont.dat