Variables latentes

Discrimination des saumons suivant leur provenance

Classifaction

ACP

PLS-DA

Published

March 1, 2024

Apprentissage supervisé par une approche PLS

Discrimination des saumons suivant leur provenance et leur mode de production sur la base de données de caractérisation chimique.

Vous avez la possibilité de télécharger le document ici :) 📥 Télécharger le fichier PDF

Présentation du code

Je vous présente ci-dessous, le code utilisé pour mener à bien ce projet, avec les étapes et explications correspondantes.

Librairies

suppressPackageStartupMessages({
library(caret)
library(corrplot)
library(ggplot2)
library(FactoMineR)
library(factoextra)
library(mixOmics)
library(tidyr)
library(here)
})

saumon <- read.csv(here("data", "ICPMS_raw_data.csv"))

Préparation du jeu de données

Les 20 éléments restants ont été sélectionnés à partir des données brutes de ICP-MS; Li, B, Al, V, Cr, Mn, Fe, Co, Ni, Cu, Zn, As, Se, Rb, Sr, Nb, Mo, Cd, Cs, Ta’

str(saumon)

'data.frame':   521 obs. of  38 variables:
 $ Class             : chr  "Alaskan" "Alaskan" "Alaskan" "Alaskan" ...
 $ X7..Li....No.Gas..: num  41.7 26.2 29.1 27.4 48.3 ...
 $ X9..Be....No.Gas..: num  0.36 0.13 0.18 0.26 0.2 0.13 0.09 0.14 0.14 0.13 ...
 $ X11..B....No.Gas..: num  895 714 630 637 1135 ...
 $ X23..Na....He..   : num  3515111 1972504 2215578 2146019 2613561 ...
 $ X24..Mg....He..   : num  1367207 1043805 1038513 1059030 1236369 ...
 $ X27..Al....He..   : num  942 953 1548 897 988 ...
 $ X28..Si....He..   : num  15274 13080 12523 12792 13179 ...
 $ X31..P....He..    : num  8489171 6068584 6473927 6611607 7205997 ...
 $ X39..K....He..    : num  6669882 4515977 5007307 4953765 5337876 ...
 $ X44..Ca....He..   : num  60213 34519 45423 43136 63616 ...
 $ X47..Ti....He..   : num  145 254 179 184 177 ...
 $ X51..V....He..    : num  14.34 3.33 9.47 11.57 8.88 ...
 $ X52..Cr....He..   : num  17.9 10.4 30.5 28.6 37.9 ...
 $ X55..Mn....He..   : num  299 302 236 164 249 ...
 $ X56..Fe....He..   : num  11212 8978 8687 9740 14683 ...
 $ X59..Co....He..   : num  8.16 5.04 5.56 4.49 5.49 4.6 3.51 4.63 4.86 3.5 ...
 $ X60..Ni....He..   : num  38.2 79.3 90.5 39.3 95.8 ...
 $ X63..Cu....He..   : num  1506 1192 1377 1049 1435 ...
 $ X66..Zn....He..   : num  22574 12049 13794 11922 16469 ...
 $ X71..Ga....He..   : num  0 0.74 0 0.75 0.76 0.36 0 0 0.37 0.35 ...
 $ X72..Ge....He..   : num  0 0.43 0.43 0 0 0.44 0 0.48 0.46 0 ...
 $ X75..As....He..   : num  1235 1129 1047 1224 1435 ...
 $ X78..Se....He..   : num  1741 1673 1332 1503 1686 ...
 $ X85..Rb....He..   : num  3757 2723 2900 2746 3071 ...
 $ X88..Sr....He..   : num  1604 747 999 1095 1935 ...
 $ X93..Nb....He..   : num  10.75 7.05 6.93 5.56 10.56 ...
 $ X95..Mo....He..   : num  14.75 7.11 7.78 8.93 10.21 ...
 $ X107..Ag....He..  : num  0.73 0.29 1.64 0.46 0.83 0.57 1.24 0.39 0.86 1.22 ...
 $ X111..Cd....He..  : num  5.55 4.4 9 9.19 6.6 ...
 $ X133..Cs....He..  : num  93.4 66.5 69.4 61 68.2 ...
 $ X135..Ba....He..  : num  11.7 243.4 25.6 21.9 20 ...
 $ X181..Ta....He..  : num  18.3 10.5 13.3 59.3 15.9 ...
 $ X182..W....He..   : num  1.07 0.67 0.96 1.38 1.02 0.72 0.73 0.49 0.54 0.82 ...
 $ X205..Tl....He..  : num  3.21 2.21 2.32 1.15 2.18 2.13 1.56 3.82 1.44 2.15 ...
 $ X206...Pb.....He..: num  2.56 5.78 3.33 1.45 3.33 1.65 6.22 1.62 3.8 3.97 ...
 $ X207...Pb.....He..: num  1.95 6.34 3.47 1.82 3.64 2.03 5.51 1.13 4.01 4.99 ...
 $ X208..Pb....He..  : num  2.19 6.11 3.25 1.77 3.33 1.83 5.69 1.38 3.85 4.49 ...

saumon <- saumon[c(1, 2, 4, 7, 13, 14, 15, 16, 17, 18, 19, 20, 23, 24, 25, 26, 27, 28, 30, 31, 33)]
names(saumon) <- c("pays", "Li", "B", "Al", "V", "Cr", "Mn", "Fe", "Co", "Ni", "Cu", "Zn", "As", "Se", "Rb", "Sr", "Nb", "Mo", "Cd", "Cs", "Ta")