<< knnda (X->Y_classes) Classification (X1-X2…Xk) Multitableaux >>

fact >> (X->Y_classes) Classification > plsda

plsda

analyse discriminante PLS avec validation croisée: des PLS-1 calculent des scores sur la matrice disjonctive des classes (autant de PLS que de classes), ensuite une FDA ou LDA prédit l'appartenance des observations aux différentes classes en utilisant ces scores

Séquence d'appel

function [model] = plsda(x,y_class,split,lv,(classif_metric),(scale),(threshold))

Paramètres

x:

une matrice (n x q) ou une structure Div

y_class:

classification des observations; une matrice disjonctive (n x nclass) ou un vecteur conjonctif (n x 1) ou une structure Div

split:

pour la validation croisée; le nombre de blocs, ou un vecteur de dimensions (n x 1) identifant par un numéro le groupe de validation croisée de chaque observation

lv:

le nombre maximum de variables latentes ou de vecteurs-propres utilisés pour la construction du modèle

(classif_metric):

la métrique utilisée pour mesurer la distance des coordonnées (scores) d'un individu à une classe

metric=0: distance de Mahalanobis (par défaut)

metric=1: distance Euclidienne usuelle

(scale):

scale='c': centrage

scale='cs': centrage + standardisation: division des colonnes de x par leur écart-type (par défaut)

(threshold):

le seuil minima d'affectation à une classe; par défaut 1/nclass

model.conf_cal_nobs:

la matrice de confusion sur les modèles d'étalonnage, exprimée en nombre d'observations

model.conf_cal_nobs.d est une hyper-matrice de dimensions (nclass x nclass x lv)

model.conf_cal:

la matrice de confusion sur les modèles d'étalonnage, exprimée en pourcentage

model.conf_cal.d est une hyper-matrice de dimensions (nclass x nclass x lv)

model.conf_cv:

la matrice de confusion sur les validations croisées,exprimée en pourcentage

model.conf_cv.d est une hyper-matrice de dimensions (nclass x nclass x lv)

model.err:

les pourcentages d'erreur de classification des étalonnages (1° colonne) et de la validation croisée (2° colonne)

model.err.d est une matrice (lv x 2)

model.errbycl_cal:

le pourcentages d'erreur de classification des étalonnages, par classe

model.errbycl_cal.d est une matrice (lv x nclass)

model.errbycl_cv:

pourcentages d'erreur de classification des validations croisées, par classe

model.errbycl_cv.d est une matrice (lv x nclass)

model.notclassed:

le pourcentages d'échantillons non classés (prédictions inférieures au seuil)

model.notclassed.d est un vecteur (lv x 1)

model.notclassed_bycl:

le pourcentages d'échantillons non classés (prédictions inférieures au seuil), pour chaque classe

model.notclassed_bycl.d est une matrice (lv x nclass)

model.method:

la méthode utilisée pour l'analyse discriminante; ici:'plsda'

model.loadings:

les vecteurs-propres

model.loadings.d est une matrice de dimensions (q x lv)

model.model_metric:

la métrique associée aux loadings; pour 'plsda': inv(x'x)

model.model_metric.d est une matrice de dimensions (q x q)

model.classif_metric:

la métrique utilisée sur les scores des individus pour le calcul des distances individus / groupes

model.scale:

la standardisation appliquée

model.threshold:

le seuil appliqué pour l'appartenance à une classe

Exemples

[result1]=plsda(x,y,30,20)
[result1]=plsda(x,y,30,20,1,'cs',0.01)

Auteurs


Report an issue
<< knnda (X->Y_classes) Classification (X1-X2…Xk) Multitableaux >>