suppressPackageStartupMessages({
library(readxl)
library(writexl)
library(outliers)
library(dplyr)
library(VIM)
library(car)
library(MASS)
library(ggplot2)
library(EnvStats)
library(pander)
library(corrplot)
library(PerformanceAnalytics)
library(tidyverse)
library(questionr)
library(leaps)
library(stats)
library(lmtest)
library(AER)
library(here)
})
Économétrie linéaire avancée
Analyse du temps d’écran chez les français de plus de 18 ans
(sur un échantillon de 98 personnes en 2023)
Résumé
L’objectif de notre étude est d’identifier les facteurs influençant la consommation numérique hebdomadaire chez les adultes Français, à partir de 18 ans, à l’échelle nationale. Nous avons fait appel à la méthode des moindres carrés (MCO) qui nous a permis d’obtenir un modèle fiable validant toutes les conditions requises pour son application. Pour ce faire, nous avons opté pour l’utilisation d’un jeu de données se rapprochant le plus possible de la réalité. Par conséquent, nous avons directement interrogé la population à l’aide d’un questionnaire se basant sur la modélisation faite au préalable à partir de la littérature. Nous avons obtenu un échantillon non représentatif de 98 individus dû à un ratio femmes/hommes élevé.
Le modèle nous a donné d’une part des résultats attendus. En effet, les personnes ayant une vie sociale importante ou ne travaillant pas toute la journée sur un écran ont une consommation numérique hebdomadaire moindre par rapport aux casaniers et à ceux exerçant un métier pour lequel l’écran est le seul outil de travail. Puis, d’autre part, des résultats inattendus. En effet, une personne possédant un nombre d’appareils moindre a une consommation plus importante que celle ayant plus d’appareils, ou encore les personnes n’ayant pas la fibre passent plus de temps sur les écrans que ceux ayant la fibre.
Vous avez la possibilité de télécharger le document ici :) 📥 Télécharger le fichier PDF
Présentation du code
Je vous présente ci-dessous, le code utilisé pour mener à bien ce projet, avec les étapes et explications correspondantes.
Préparation des données
- Librairies
- Vecteur de couleur
<- c("#9DBBA4", "#395948")
couleurs_genre <- c("#9DBBA4", "#395948") couleurs
Préparation et visualisation des données
- Téléchargement et visualisation du fichier, à l’aide de la librairie “readxl”
- Supprimer la colonne “horodateur” qui est inutile
<- read_excel(here("data", "BDD_propre.xlsx"))
ecran
head(ecran)
# A tibble: 6 × 21
Horodateur A quelle catégorie d’âge apparten…¹ A quel genre vous id…²
<dttm> <chr> <chr>
1 2023-11-30 16:40:29 25 - 49 ans Femme
2 2023-11-30 16:54:37 50- 69 ans Femme
3 2023-12-01 08:30:35 50- 69 ans Femme
4 2023-12-02 14:14:23 50- 69 ans Homme
5 2023-12-07 10:21:15 25 - 49 ans Femme
6 2023-12-07 11:30:43 70 ans et plus Femme
# ℹ abbreviated names: ¹`A quelle catégorie d’âge appartenez-vous ?`,
# ²`A quel genre vous identifiez-vous ?`
# ℹ 18 more variables:
# `Quelle est votre catégorie socioprofessionnelle ?` <chr>,
# `Où habitez-vous ?` <chr>,
# `Avec combien de personnes vivez-vous dans votre logement principal ? (Par exemple si vous êtes en couple répondez 1)` <dbl>,
# `Quel est votre revenu fiscal après impôt du foyer auquel vous êtes rattaché (par an) ? \r\nSi vous dépendez de vos parents mettez celui de vos parents.` <chr>, …
<- ecran[,-1] ecran
Renommer les colonnes
colnames(ecran) <- c("age", "genre", "csp", "lieu_de_vie", "nb_personnes", "revenu", "temps_ecran", "nb_appareils", "internet", "fibre", "forfait_tel", "telephone_pro", "ecran_travail", "sommeil", "stress", "loisir", "vie_sociale", "ecran_jour", "reseaux_sociaux", "nb_abonnements")
Mettre en numérique les variables
str(ecran)
tibble [98 × 20] (S3: tbl_df/tbl/data.frame)
$ age : chr [1:98] "25 - 49 ans" "50- 69 ans" "50- 69 ans" "50- 69 ans" ...
$ genre : chr [1:98] "Femme" "Femme" "Femme" "Homme" ...
$ csp : chr [1:98] "Cadres et professions intellectuelles supérieures" "Professions intermédiaires" "Cadres et professions intellectuelles supérieures" "Cadres et professions intellectuelles supérieures" ...
$ lieu_de_vie : chr [1:98] "Ville" "Campagne" "Périurbaine/ Banlieue" "Ville" ...
$ nb_personnes : num [1:98] 1 2 2 1 5 0 1 3 1 3 ...
$ revenu : chr [1:98] "30 000 - 40 000" "40 000 - 50 000" "70 000 - 80 000" "70 000 - 80 000" ...
$ temps_ecran : num [1:98] 35 35 30 60 64 28 28 35 25 21 ...
$ nb_appareils : chr [1:98] "3" "5" "4" "4" ...
$ internet : chr [1:98] "Oui, avec la fibre" "Oui, avec la fibre" "Oui, avec la fibre" "Oui, avec la fibre" ...
$ fibre : chr [1:98] "Oui" "Oui" "Oui" "Oui" ...
$ forfait_tel : chr [1:98] "10 et 15 €" "10 et 15 €" "15 et 20 €" "0" ...
$ telephone_pro : chr [1:98] "Oui" "Non" "Oui" "Oui" ...
$ ecran_travail : chr [1:98] "Toute la journée" "Fréquemment (Plus de la moitié du temps)" "Fréquemment (Plus de la moitié du temps)" "Toute la journée" ...
$ sommeil : chr [1:98] "5h – 7h" "7h et 9h" "7h et 9h" "5h – 7h" ...
$ stress : chr [1:98] "Parfois" "Parfois" "Rarement" "Fréquemment" ...
$ loisir : num [1:98] 3 10 1 6 12 2 6 21 30 20 ...
$ vie_sociale : num [1:98] 14 15 2 8 8 7 10 20 80 10 ...
$ ecran_jour : chr [1:98] "Le soir" "L’après midi" "Le matin" "Le soir" ...
$ reseaux_sociaux: chr [1:98] "5" "2" "1" "0" ...
$ nb_abonnements : chr [1:98] "0" "1" "3" "0" ...
$loisir <- as.numeric(ecran$loisir)
ecran$vie_sociale <- as.numeric(ecran$vie_sociale)
ecranstr(ecran)
tibble [98 × 20] (S3: tbl_df/tbl/data.frame)
$ age : chr [1:98] "25 - 49 ans" "50- 69 ans" "50- 69 ans" "50- 69 ans" ...
$ genre : chr [1:98] "Femme" "Femme" "Femme" "Homme" ...
$ csp : chr [1:98] "Cadres et professions intellectuelles supérieures" "Professions intermédiaires" "Cadres et professions intellectuelles supérieures" "Cadres et professions intellectuelles supérieures" ...
$ lieu_de_vie : chr [1:98] "Ville" "Campagne" "Périurbaine/ Banlieue" "Ville" ...
$ nb_personnes : num [1:98] 1 2 2 1 5 0 1 3 1 3 ...
$ revenu : chr [1:98] "30 000 - 40 000" "40 000 - 50 000" "70 000 - 80 000" "70 000 - 80 000" ...
$ temps_ecran : num [1:98] 35 35 30 60 64 28 28 35 25 21 ...
$ nb_appareils : chr [1:98] "3" "5" "4" "4" ...
$ internet : chr [1:98] "Oui, avec la fibre" "Oui, avec la fibre" "Oui, avec la fibre" "Oui, avec la fibre" ...
$ fibre : chr [1:98] "Oui" "Oui" "Oui" "Oui" ...
$ forfait_tel : chr [1:98] "10 et 15 €" "10 et 15 €" "15 et 20 €" "0" ...
$ telephone_pro : chr [1:98] "Oui" "Non" "Oui" "Oui" ...
$ ecran_travail : chr [1:98] "Toute la journée" "Fréquemment (Plus de la moitié du temps)" "Fréquemment (Plus de la moitié du temps)" "Toute la journée" ...
$ sommeil : chr [1:98] "5h – 7h" "7h et 9h" "7h et 9h" "5h – 7h" ...
$ stress : chr [1:98] "Parfois" "Parfois" "Rarement" "Fréquemment" ...
$ loisir : num [1:98] 3 10 1 6 12 2 6 21 30 20 ...
$ vie_sociale : num [1:98] 14 15 2 8 8 7 10 20 80 10 ...
$ ecran_jour : chr [1:98] "Le soir" "L’après midi" "Le matin" "Le soir" ...
$ reseaux_sociaux: chr [1:98] "5" "2" "1" "0" ...
$ nb_abonnements : chr [1:98] "0" "1" "3" "0" ...
summary(ecran)
age genre csp lieu_de_vie
Length:98 Length:98 Length:98 Length:98
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
nb_personnes revenu temps_ecran nb_appareils
Min. :0.000 Length:98 Min. : 4.50 Length:98
1st Qu.:1.000 Class :character 1st Qu.:26.25 Class :character
Median :1.000 Mode :character Median :35.00 Mode :character
Mean :1.622 Mean :35.76
3rd Qu.:3.000 3rd Qu.:42.00
Max. :5.000 Max. :85.00
internet fibre forfait_tel telephone_pro
Length:98 Length:98 Length:98 Length:98
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
ecran_travail sommeil stress loisir
Length:98 Length:98 Length:98 Min. : 0.00
Class :character Class :character Class :character 1st Qu.: 4.00
Mode :character Mode :character Mode :character Median : 10.00
Mean : 12.52
3rd Qu.: 15.00
Max. :100.00
NA's :7
vie_sociale ecran_jour reseaux_sociaux nb_abonnements
Min. : 0.00 Length:98 Length:98 Length:98
1st Qu.: 5.00 Class :character Class :character Class :character
Median :12.00 Mode :character Mode :character Mode :character
Mean :16.36
3rd Qu.:21.00
Max. :80.00
NA's :13
Mettre en facteurs les variables
$age <- as.factor(ecran$age)
ecran$genre <- as.factor(ecran$genre)
ecran$csp <- as.factor(ecran$csp)
ecran$lieu_de_vie <- as.factor(ecran$lieu_de_vie)
ecran$revenu <- as.factor(ecran$revenu)
ecran$nb_appareils <- as.factor(ecran$nb_appareils)
ecran$internet <- as.factor(ecran$internet)
ecran$fibre <- as.factor(ecran$fibre)
ecran$forfait_tel <- as.factor(ecran$forfait_tel)
ecran$telephone_pro <- as.factor(ecran$telephone_pro)
ecran$ecran_travail <- as.factor(ecran$ecran_travail)
ecran$sommeil <- as.factor(ecran$sommeil)
ecran$stress <- as.factor(ecran$stress)
ecran$ecran_jour <- as.factor(ecran$ecran_jour)
ecran$reseaux_sociaux <- as.factor(ecran$reseaux_sociaux)
ecran$nb_abonnements <- as.factor(ecran$nb_abonnements) ecran
Résumé des toutes les variables
str(ecran)
tibble [98 × 20] (S3: tbl_df/tbl/data.frame)
$ age : Factor w/ 4 levels "18 - 24 ans",..: 2 3 3 3 2 4 2 2 3 2 ...
$ genre : Factor w/ 2 levels "Femme","Homme": 1 1 1 2 1 1 1 2 1 2 ...
$ csp : Factor w/ 8 levels "Agriculteurs exploitants",..: 4 7 4 4 5 8 5 5 5 5 ...
$ lieu_de_vie : Factor w/ 3 levels "Campagne","Périurbaine/ Banlieue",..: 3 1 2 3 1 1 1 2 1 2 ...
$ nb_personnes : num [1:98] 1 2 2 1 5 0 1 3 1 3 ...
$ revenu : Factor w/ 9 levels "< 10 000","10 000 - 20 000",..: 4 5 8 8 7 2 3 5 4 5 ...
$ temps_ecran : num [1:98] 35 35 30 60 64 28 28 35 25 21 ...
$ nb_appareils : Factor w/ 11 levels "1","10","2","3",..: 4 6 5 5 8 4 4 5 9 7 ...
$ internet : Factor w/ 4 levels "Non","Oui, avec l’ADSL",..: 3 3 3 3 2 2 3 3 3 3 ...
$ fibre : Factor w/ 2 levels "Non","Oui": 2 2 2 2 1 2 2 2 2 2 ...
$ forfait_tel : Factor w/ 9 levels "0","10 et 15 €",..: 2 2 3 1 3 8 4 3 3 5 ...
$ telephone_pro : Factor w/ 2 levels "Non","Oui": 2 1 2 2 1 1 1 2 1 2 ...
$ ecran_travail : Factor w/ 5 levels "Fréquemment (Plus de la moitié du temps)",..: 5 1 1 5 5 2 3 3 3 4 ...
$ sommeil : Factor w/ 4 levels "3h – 5h","5h – 7h",..: 2 3 3 2 3 3 2 3 3 3 ...
$ stress : Factor w/ 5 levels "Fréquemment",..: 3 3 4 1 1 4 1 4 2 4 ...
$ loisir : num [1:98] 3 10 1 6 12 2 6 21 30 20 ...
$ vie_sociale : num [1:98] 14 15 2 8 8 7 10 20 80 10 ...
$ ecran_jour : Factor w/ 7 levels "L’après midi",..: 7 1 3 7 1 7 1 7 1 1 ...
$ reseaux_sociaux: Factor w/ 11 levels "0","1","2","3",..: 6 3 2 1 1 1 2 4 3 3 ...
$ nb_abonnements : Factor w/ 9 levels "0","1","10","2",..: 1 2 5 1 2 2 1 2 2 2 ...
summary(ecran)
age genre
18 - 24 ans :47 Femme:72
25 - 49 ans :38 Homme:26
50- 69 ans :10
70 ans et plus: 3
csp
Employés :34
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants):31
Cadres et professions intellectuelles supérieures :17
Professions intermédiaires : 6
Retraités : 4
Ouvriers : 3
(Other) : 3
lieu_de_vie nb_personnes revenu
Campagne :36 Min. :0.000 40 000 - 50 000:21
Périurbaine/ Banlieue:11 1st Qu.:1.000 20 000 - 30 000:18
Ville :51 Median :1.000 10 000 - 20 000:17
Mean :1.622 30 000 - 40 000:12
3rd Qu.:3.000 < 10 000 :11
Max. :5.000 (Other) :10
NA's : 9
temps_ecran nb_appareils internet fibre
Min. : 4.50 3 :40 Non : 1 Non : 5
1st Qu.:26.25 4 :19 Oui, avec l’ADSL :17 Oui :84
Median :35.00 2 :14 Oui, avec la fibre :71 NA's: 9
Mean :35.76 5 :10 Oui, avec une autre solution: 9
3rd Qu.:42.00 6 : 5
Max. :85.00 7 : 3
(Other): 7
forfait_tel telephone_pro
15 et 20 € :35 Non:33
10 et 15 € :20 Oui:65
Plus de 35€ :12
20 et 25 € :11
Entre 5 et 10 €: 6
30 et 35 € : 5
(Other) : 9
ecran_travail sommeil
Fréquemment (Plus de la moitié du temps) :26 3h – 5h : 9
Jamais : 4 5h – 7h :32
Parfois (Entre un quart et la moitié du temps):17 7h et 9h :54
Rarement :11 Plus de 9h: 3
Toute la journée :37
NA's : 3
stress loisir vie_sociale
Fréquemment:26 Min. : 0.00 Min. : 0.00
Jamais : 2 1st Qu.: 4.00 1st Qu.: 5.00
Parfois :39 Median : 10.00 Median :12.00
Rarement :15 Mean : 12.52 Mean :16.36
Toujours :16 3rd Qu.: 15.00 3rd Qu.:21.00
Max. :100.00 Max. :80.00
NA's :7 NA's :13
ecran_jour reseaux_sociaux nb_abonnements
L’après midi : 9 3 :24 1 :34
L’après midi, Le soir :11 2 :14 2 :22
Le matin : 5 4 :12 0 :17
Le matin, L’après midi : 7 5 :12 3 :12
Le matin, L’après midi, Le soir: 7 6 : 9 4 : 8
Le matin, Le soir : 3 1 : 8 5 : 2
Le soir :56 (Other):19 (Other): 3
Valeurs manquantes - visualisation
sum(is.na(ecran))
[1] 41
lapply(ecran, function(x) which(is.na(x)))
$age
integer(0)
$genre
integer(0)
$csp
integer(0)
$lieu_de_vie
integer(0)
$nb_personnes
integer(0)
$revenu
[1] 22 24 26 33 44 45 54 84 88
$temps_ecran
integer(0)
$nb_appareils
integer(0)
$internet
integer(0)
$fibre
[1] 19 25 37 49 50 70 73 80 82
$forfait_tel
integer(0)
$telephone_pro
integer(0)
$ecran_travail
[1] 42 60 88
$sommeil
integer(0)
$stress
integer(0)
$loisir
[1] 14 15 23 47 54 62 64
$vie_sociale
[1] 14 15 22 43 44 47 51 52 54 60 62 64 67
$ecran_jour
integer(0)
$reseaux_sociaux
integer(0)
$nb_abonnements
integer(0)
Nous avons au total 41 valeurs manquantes
Résumé des variables numériques
summary(select_if(ecran, is.numeric))
nb_personnes temps_ecran loisir vie_sociale
Min. :0.000 Min. : 4.50 Min. : 0.00 Min. : 0.00
1st Qu.:1.000 1st Qu.:26.25 1st Qu.: 4.00 1st Qu.: 5.00
Median :1.000 Median :35.00 Median : 10.00 Median :12.00
Mean :1.622 Mean :35.76 Mean : 12.52 Mean :16.36
3rd Qu.:3.000 3rd Qu.:42.00 3rd Qu.: 15.00 3rd Qu.:21.00
Max. :5.000 Max. :85.00 Max. :100.00 Max. :80.00
NA's :7 NA's :13
sapply(select_if(ecran, is.numeric), sd)
nb_personnes temps_ecran loisir vie_sociale
1.350947 15.699702 NA NA
Imputation des valeurs manquantes
L’algorithme des k-plus proches voisins utilisera le voisin le plus proche pour l’imputation
<- kNN(ecran, dist_var = colnames(ecran), k = 1)
ecran <- ecran[, -c(21:40)] ecran
Exportation de la base de données sous format excel
# write_xlsx(x = ecran, path = "data/BDD_sans_NA.xlsx")
Utilisation de cette nouvelle base pour la suite du travail
<- read_excel(here("data", "BDD_sans_NA.xlsx"), col_names = T ) ecran
colnames(ecran) <- c("age", "genre", "csp", "lieu_de_vie", "nb_personnes", "revenu", "temps_ecran", "nb_appareils", "internet", "fibre", "forfait_tel", "telephone_pro", "ecran_travail", "sommeil", "stress", "loisir", "vie_sociale", "ecran_jour", "reseaux_sociaux", "nb_abonnements")
Mettre en facteurs les variables
str(ecran)
tibble [98 × 20] (S3: tbl_df/tbl/data.frame)
$ age : chr [1:98] "25 - 49 ans" "50- 69 ans" "50- 69 ans" "50- 69 ans" ...
$ genre : chr [1:98] "Femme" "Femme" "Femme" "Homme" ...
$ csp : chr [1:98] "Cadres et professions intellectuelles supérieures" "Professions intermédiaires" "Cadres et professions intellectuelles supérieures" "Cadres et professions intellectuelles supérieures" ...
$ lieu_de_vie : chr [1:98] "Ville" "Campagne" "Périurbaine/ Banlieue" "Ville" ...
$ nb_personnes : num [1:98] 1 2 2 1 5 0 1 3 1 3 ...
$ revenu : chr [1:98] "30 000 - 40 000" "40 000 - 50 000" "70 000 - 80 000" "70 000 - 80 000" ...
$ temps_ecran : num [1:98] 35 35 30 60 64 28 28 35 25 21 ...
$ nb_appareils : chr [1:98] "3" "5" "4" "4" ...
$ internet : chr [1:98] "Oui, avec la fibre" "Oui, avec la fibre" "Oui, avec la fibre" "Oui, avec la fibre" ...
$ fibre : chr [1:98] "Oui" "Oui" "Oui" "Oui" ...
$ forfait_tel : chr [1:98] "10 et 15 €" "10 et 15 €" "15 et 20 €" "0" ...
$ telephone_pro : chr [1:98] "Oui" "Non" "Oui" "Oui" ...
$ ecran_travail : chr [1:98] "Toute la journée" "Fréquemment (Plus de la moitié du temps)" "Fréquemment (Plus de la moitié du temps)" "Toute la journée" ...
$ sommeil : chr [1:98] "5h – 7h" "7h et 9h" "7h et 9h" "5h – 7h" ...
$ stress : chr [1:98] "Parfois" "Parfois" "Rarement" "Fréquemment" ...
$ loisir : num [1:98] 3 10 1 6 12 2 6 21 30 20 ...
$ vie_sociale : num [1:98] 14 15 2 8 8 7 10 20 80 10 ...
$ ecran_jour : chr [1:98] "Le soir" "L’après midi" "Le matin" "Le soir" ...
$ reseaux_sociaux: chr [1:98] "5" "2" "1" "0" ...
$ nb_abonnements : chr [1:98] "0" "1" "3" "0" ...
$age <- as.factor(ecran$age)
ecran$genre <- as.factor(ecran$genre)
ecran$csp <- as.factor(ecran$csp)
ecran$lieu_de_vie <- as.factor(ecran$lieu_de_vie)
ecran$revenu <- as.factor(ecran$revenu)
ecran$nb_appareils <- as.factor(ecran$nb_appareils)
ecran$internet <- as.factor(ecran$internet)
ecran$fibre <- as.factor(ecran$fibre)
ecran$forfait_tel <- as.factor(ecran$forfait_tel)
ecran$telephone_pro <- as.factor(ecran$telephone_pro)
ecran$ecran_travail <- as.factor(ecran$ecran_travail)
ecran$sommeil <- as.factor(ecran$sommeil)
ecran$stress <- as.factor(ecran$stress)
ecran$ecran_jour <- as.factor(ecran$ecran_jour)
ecran$reseaux_sociaux <- as.factor(ecran$reseaux_sociaux)
ecran$nb_abonnements <- as.factor(ecran$nb_abonnements)
ecranstr(ecran)
tibble [98 × 20] (S3: tbl_df/tbl/data.frame)
$ age : Factor w/ 4 levels "18 - 24 ans",..: 2 3 3 3 2 4 2 2 3 2 ...
$ genre : Factor w/ 2 levels "Femme","Homme": 1 1 1 2 1 1 1 2 1 2 ...
$ csp : Factor w/ 8 levels "Agriculteurs exploitants",..: 4 7 4 4 5 8 5 5 5 5 ...
$ lieu_de_vie : Factor w/ 3 levels "Campagne","Périurbaine/ Banlieue",..: 3 1 2 3 1 1 1 2 1 2 ...
$ nb_personnes : num [1:98] 1 2 2 1 5 0 1 3 1 3 ...
$ revenu : Factor w/ 9 levels "< 10 000","10 000 - 20 000",..: 4 5 8 8 7 2 3 5 4 5 ...
$ temps_ecran : num [1:98] 35 35 30 60 64 28 28 35 25 21 ...
$ nb_appareils : Factor w/ 11 levels "1","10","2","3",..: 4 6 5 5 8 4 4 5 9 7 ...
$ internet : Factor w/ 4 levels "Non","Oui, avec l’ADSL",..: 3 3 3 3 2 2 3 3 3 3 ...
$ fibre : Factor w/ 2 levels "Non","Oui": 2 2 2 2 1 2 2 2 2 2 ...
$ forfait_tel : Factor w/ 9 levels "0","10 et 15 €",..: 2 2 3 1 3 8 4 3 3 5 ...
$ telephone_pro : Factor w/ 2 levels "Non","Oui": 2 1 2 2 1 1 1 2 1 2 ...
$ ecran_travail : Factor w/ 5 levels "Fréquemment (Plus de la moitié du temps)",..: 5 1 1 5 5 2 3 3 3 4 ...
$ sommeil : Factor w/ 4 levels "3h – 5h","5h – 7h",..: 2 3 3 2 3 3 2 3 3 3 ...
$ stress : Factor w/ 5 levels "Fréquemment",..: 3 3 4 1 1 4 1 4 2 4 ...
$ loisir : num [1:98] 3 10 1 6 12 2 6 21 30 20 ...
$ vie_sociale : num [1:98] 14 15 2 8 8 7 10 20 80 10 ...
$ ecran_jour : Factor w/ 7 levels "L’après midi",..: 7 1 3 7 1 7 1 7 1 1 ...
$ reseaux_sociaux: Factor w/ 11 levels "0","1","2","3",..: 6 3 2 1 1 1 2 4 3 3 ...
$ nb_abonnements : Factor w/ 9 levels "0","1","10","2",..: 1 2 5 1 2 2 1 2 2 2 ...
Statistiques descriptives
Analyse univariée des variables qualitatives
Tableaux de contingence
table(ecran$genre,ecran$age)
18 - 24 ans 25 - 49 ans 50- 69 ans 70 ans et plus
Femme 36 28 7 1
Homme 11 10 3 2
table(ecran$csp)
Agriculteurs exploitants
1
Artisan/commerçant/Chef d’entreprise
2
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants)
31
Cadres et professions intellectuelles supérieures
17
Employés
34
Ouvriers
3
Professions intermédiaires
6
Retraités
4
table(ecran$csp, ecran$revenu)
< 10 000
Agriculteurs exploitants 1
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 4
Cadres et professions intellectuelles supérieures 0
Employés 6
Ouvriers 0
Professions intermédiaires 0
Retraités 0
10 000 - 20 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 5
Cadres et professions intellectuelles supérieures 0
Employés 7
Ouvriers 0
Professions intermédiaires 4
Retraités 1
20 000 - 30 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 6
Cadres et professions intellectuelles supérieures 4
Employés 9
Ouvriers 1
Professions intermédiaires 0
Retraités 2
30 000 - 40 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 1
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 1
Cadres et professions intellectuelles supérieures 2
Employés 8
Ouvriers 0
Professions intermédiaires 0
Retraités 0
40 000 - 50 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 1
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 11
Cadres et professions intellectuelles supérieures 8
Employés 3
Ouvriers 2
Professions intermédiaires 1
Retraités 0
50 000 - 60 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 1
Cadres et professions intellectuelles supérieures 1
Employés 0
Ouvriers 0
Professions intermédiaires 1
Retraités 0
60 000 - 70 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 0
Cadres et professions intellectuelles supérieures 0
Employés 1
Ouvriers 0
Professions intermédiaires 0
Retraités 1
70 000 - 80 000
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 2
Cadres et professions intellectuelles supérieures 2
Employés 0
Ouvriers 0
Professions intermédiaires 0
Retraités 0
80 000 et plus
Agriculteurs exploitants 0
Artisan/commerçant/Chef d’entreprise 0
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants) 1
Cadres et professions intellectuelles supérieures 0
Employés 0
Ouvriers 0
Professions intermédiaires 0
Retraités 0
table(ecran$revenu)
< 10 000 10 000 - 20 000 20 000 - 30 000 30 000 - 40 000 40 000 - 50 000
11 17 22 12 26
50 000 - 60 000 60 000 - 70 000 70 000 - 80 000 80 000 et plus
3 2 4 1
Diagrammes en bâtons
|>
ecran ggplot() +
aes(x = age, fill = age) +
geom_bar(fill = "#395948") +
ggtitle("Répartition de l'âge") +
labs(x = "âge", y="effectif") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran count(genre) |>
ggplot() +
aes(x = "", y = n, fill = genre) +
geom_bar(stat = "identity", color="white") +
ggtitle("") +
theme(plot.title = element_text(hjust = 0.5, size = 12))+
coord_polar("y") +
scale_fill_manual(values = couleurs_genre) +
theme_void() +
theme(plot.title = element_text(hjust = 0.5, size = 12))+
geom_text(aes(label = n), position = position_stack(vjust = 0.5), color = "white",size = 5, fontface = "bold")
|>
ecran ggplot() +
geom_bar(fill = "#395948") +
ggtitle("Répartition des lieux de résidence") +
aes(x = fct_infreq(lieu_de_vie), fill = lieu_de_vie) +
labs(x = "lieux de résidence",y="effectif") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12))
Nous utilisons ‘levels’ pour renommer nos variables afin d’améliorer la visualisation. Cependant, il est important de noter que cela modifie également les noms dans la base de données
#levels(ecran$csp) <- c("agriculteurs","artisans","sans activité", "cadres","employés","ouvriers", "intermédiaire","retraités")
|>
ecran ggplot() +
aes(x =fct_infreq(csp), fill = csp) +
geom_bar(fill = "blue4") +
ggtitle("Répartition de la catégorie socio-professionnelle") +
labs(x = "csp", y="effectif") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12),
axis.text.x = element_text(angle = 45, hjust = 1))
|>
ecran ggplot() +
geom_bar(fill = "blue4") +
ggtitle("Répartition du revenu") +
aes(x = fct_infreq(revenu), fill = revenu) +
labs(x = "Revenu", y="effectif") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12),
axis.text.x = element_text(angle = 45, hjust = 1))
#levels(ecran$internet) <- c("Non","ADSL","Fibre", "Autre solution")
|>
ecran ggplot(aes(x = internet, fill = internet)) +
geom_bar(fill = "#395948") +
ggtitle("Répartition des moyens de connexion") +
aes(x = fct_infreq(internet), fill = internet) +
labs(x = "internet", y="effectif") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran ggplot(aes(x = fct_infreq(nb_appareils), fill = nb_appareils)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition du nombre d'appareils") +
labs(x = "appareils", y="effectif") +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran count(fibre) |>
ggplot() +
aes(x = "", y = n, fill = fibre) +
geom_bar(stat = "identity", color = "white") +
ggtitle("Répartition de l'accès à la fibre") +
coord_polar("y") +
scale_fill_manual(values = couleurs) +
theme_void() +
theme(plot.title = element_text(hjust = 0.5, size = 12))+
geom_text(aes(label = n), position = position_stack(vjust = 0.5), color = "white",size = 5, fontface = "bold")
|>
ecran ggplot(aes(x = fct_infreq(forfait_tel), fill = forfait_tel)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition des forfaits téléphoniques") +
labs(x = "forfait", y="effectif")+
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12),
axis.text.x = element_text(angle = 45, hjust = 1))
|>
ecran count(telephone_pro) |>
ggplot() +
aes(x = "", y = n, fill = telephone_pro) +
geom_bar(stat = "identity", color = "white") +
ggtitle("Répartition de la possession d'un téléphone professionnel") +
coord_polar("y") +
scale_fill_manual(values = couleurs) +
theme_void() +
theme(plot.title = element_text(hjust = 0.5, size = 12))+
geom_text(aes(label = n), position = position_stack(vjust = 0.5), color = "white",size = 5, fontface = "bold")
#levels(ecran$ecran_travail) <- c("Fréquemment", "Jamais", "Parfois", "Rarement", "Toute la journée")
|>
ecran ggplot(aes(x = fct_infreq(ecran_travail), fill = ecran_travail)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition de la consommation numérique au travail") +
labs(x="fréquence",y="effectif")+
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran ggplot(aes(x = fct_infreq(sommeil), fill = sommeil)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition du temps de sommeil") +
labs(x="durée",y="effectif")+
theme_classic()+
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran ggplot(aes(x = fct_infreq(stress), fill = stress)) +
geom_bar(fill = "blue4") +
labs(x="fréquence", y="effectif")+
ggtitle("Répartition du stress") +
theme_classic()+
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran ggplot(aes(x = fct_infreq(ecran_jour), fill = ecran_jour)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition du moment de la journée") +
labs(x="fréquence", y="effectif")+
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12),
axis.text.x = element_text(angle = 45, hjust = 1))
|>
ecran ggplot(aes(x = fct_infreq(reseaux_sociaux), fill = reseaux_sociaux)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition des réseaux sociaux") +
labs(x="quantité",y="effectif")+
theme_classic()+
theme(plot.title = element_text(hjust = 0.5, size = 12))
|>
ecran ggplot(aes(x = fct_infreq(nb_abonnements), fill = nb_abonnements)) +
geom_bar(fill = "blue4") +
ggtitle("Répartition des abonnements") +
labs(x="quantité", y="effectif")+
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12))
Analyse bivariée des variables qualitatives
|>
ecranpivot_longer(
cols = temps_ecran,
names_to = "mesure",
values_to = "valeur"
|>
) ggplot() +
aes(y = valeur, x = age, color = age) +
geom_boxplot() +
geom_jitter(alpha = 0.3) +
#scale_color_manual(values = vecteur_couleur)
facet_wrap(~ mesure, scales = "free_y") +
theme_bw()
|>
ecranpivot_longer(
cols = temps_ecran,
names_to = "mesure",
values_to = "valeur"
|>
) ggplot() +
aes(y = valeur, x = csp, color=csp) +
geom_boxplot() +
geom_jitter(alpha = 0.3) +
#scale_color_manual(values = vecteur_couleur)
facet_wrap(~ mesure, scales = "free_y") +
theme_bw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
|>
ecranpivot_longer(
cols = temps_ecran,
names_to = "mesure",
values_to = "valeur"
|>
) ggplot() +
aes(y = valeur, x = ecran_jour, color=ecran_jour) +
geom_boxplot() +
geom_jitter(alpha = 0.3) +
#scale_color_manual(values = vecteur_couleur)
facet_wrap(~ mesure, scales = "free_y") +
theme_bw() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
ggplot(ecran) +
geom_boxplot(aes(x = csp, y = temps_ecran))
Analyse univariée des variables quantitatives
str(ecran)
tibble [98 × 20] (S3: tbl_df/tbl/data.frame)
$ age : Factor w/ 4 levels "18 - 24 ans",..: 2 3 3 3 2 4 2 2 3 2 ...
$ genre : Factor w/ 2 levels "Femme","Homme": 1 1 1 2 1 1 1 2 1 2 ...
$ csp : Factor w/ 8 levels "Agriculteurs exploitants",..: 4 7 4 4 5 8 5 5 5 5 ...
$ lieu_de_vie : Factor w/ 3 levels "Campagne","Périurbaine/ Banlieue",..: 3 1 2 3 1 1 1 2 1 2 ...
$ nb_personnes : num [1:98] 1 2 2 1 5 0 1 3 1 3 ...
$ revenu : Factor w/ 9 levels "< 10 000","10 000 - 20 000",..: 4 5 8 8 7 2 3 5 4 5 ...
$ temps_ecran : num [1:98] 35 35 30 60 64 28 28 35 25 21 ...
$ nb_appareils : Factor w/ 11 levels "1","10","2","3",..: 4 6 5 5 8 4 4 5 9 7 ...
$ internet : Factor w/ 4 levels "Non","Oui, avec l’ADSL",..: 3 3 3 3 2 2 3 3 3 3 ...
$ fibre : Factor w/ 2 levels "Non","Oui": 2 2 2 2 1 2 2 2 2 2 ...
$ forfait_tel : Factor w/ 9 levels "0","10 et 15 €",..: 2 2 3 1 3 8 4 3 3 5 ...
$ telephone_pro : Factor w/ 2 levels "Non","Oui": 2 1 2 2 1 1 1 2 1 2 ...
$ ecran_travail : Factor w/ 5 levels "Fréquemment (Plus de la moitié du temps)",..: 5 1 1 5 5 2 3 3 3 4 ...
$ sommeil : Factor w/ 4 levels "3h – 5h","5h – 7h",..: 2 3 3 2 3 3 2 3 3 3 ...
$ stress : Factor w/ 5 levels "Fréquemment",..: 3 3 4 1 1 4 1 4 2 4 ...
$ loisir : num [1:98] 3 10 1 6 12 2 6 21 30 20 ...
$ vie_sociale : num [1:98] 14 15 2 8 8 7 10 20 80 10 ...
$ ecran_jour : Factor w/ 7 levels "L’après midi",..: 7 1 3 7 1 7 1 7 1 1 ...
$ reseaux_sociaux: Factor w/ 11 levels "0","1","2","3",..: 6 3 2 1 1 1 2 4 3 3 ...
$ nb_abonnements : Factor w/ 9 levels "0","1","10","2",..: 1 2 5 1 2 2 1 2 2 2 ...
summary(select_if(ecran, is.numeric))
nb_personnes temps_ecran loisir vie_sociale
Min. :0.000 Min. : 4.50 Min. : 0.00 Min. : 0.00
1st Qu.:1.000 1st Qu.:26.25 1st Qu.: 4.00 1st Qu.: 5.00
Median :1.000 Median :35.00 Median : 10.00 Median :10.00
Mean :1.622 Mean :35.76 Mean : 12.85 Mean :15.78
3rd Qu.:3.000 3rd Qu.:42.00 3rd Qu.: 17.25 3rd Qu.:20.75
Max. :5.000 Max. :85.00 Max. :100.00 Max. :80.00
Histogrammes
hist(ecran$nb_personnes, main= "Répartition du nombre de personnes dans le foyer", xlab="personnes", ylab = "nombre d'individus", col = "#395948")
hist(ecran$temps_ecran, main= "Répartition du temps d'écrans", xlab="durée",ylab = "nombre d'individus", col = "#395948")
hist(ecran$loisir, main= "Répartition du temps consacré aux loisirs", xlab="durée", ylab = "nombre d'individus", col = "#395948")
hist(ecran$vie_sociale, main= "Répartition du temps consacré à la vie sociale", xlab="durée",ylab = "nombre d'individus", col = "#395948")
Boxplots
|>
ecranpivot_longer(
cols = where(is.numeric)
|>
) ggplot() +
aes(y = value) +
facet_wrap(~ name, scales = "free_y") +
geom_boxplot() +
theme_light()
Valeurs atypiques - Test Rosner
rosnerTest(ecran$temps_ecran,k=2, alpha=0.05)
Results of Outlier Test
-------------------------
Test Method: Rosner's Test for Outliers
Hypothesized Distribution: Normal
Data: ecran$temps_ecran
Sample Size: 98
Test Statistics: R.1 = 3.136677
R.2 = 2.324461
Test Statistic Parameter: k = 2
Alternative Hypothesis: Up to 2 observations are not
from the same Distribution.
Type I Error: 5%
Number of Outliers Detected: 0
i Mean.i SD.i Value Obs.Num R.i+1 lambda.i+1 Outlier
1 0 35.75510 15.69970 85 64 3.136677 3.377176 FALSE
2 1 35.24742 14.95081 70 21 2.324461 3.373658 FALSE
rosnerTest(ecran$loisir,k=2, alpha=0.05)
Results of Outlier Test
-------------------------
Test Method: Rosner's Test for Outliers
Hypothesized Distribution: Normal
Data: ecran$loisir
Sample Size: 98
Test Statistics: R.1 = 6.501007
R.2 = 4.368825
Test Statistic Parameter: k = 2
Alternative Hypothesis: Up to 2 observations are not
from the same Distribution.
Type I Error: 5%
Number of Outliers Detected: 2
i Mean.i SD.i Value Obs.Num R.i+1 lambda.i+1 Outlier
1 0 12.85204 13.40530 100 61 6.501007 3.377176 TRUE
2 1 11.95361 10.08198 56 34 4.368825 3.373658 TRUE
rosnerTest(ecran$vie_sociale,k=5, alpha=0.05)
Results of Outlier Test
-------------------------
Test Method: Rosner's Test for Outliers
Hypothesized Distribution: Normal
Data: ecran$vie_sociale
Sample Size: 98
Test Statistics: R.1 = 4.546626
R.2 = 2.773623
R.3 = 2.908100
R.4 = 2.892232
R.5 = 2.778605
Test Statistic Parameter: k = 5
Alternative Hypothesis: Up to 5 observations are not
from the same Distribution.
Type I Error: 5%
Number of Outliers Detected: 1
i Mean.i SD.i Value Obs.Num R.i+1 lambda.i+1 Outlier
1 0 15.77551 14.12575 80 9 4.546626 3.377176 TRUE
2 1 15.11340 12.57799 50 79 2.773623 3.373658 FALSE
3 2 14.75000 12.12132 50 90 2.908100 3.370097 FALSE
4 3 14.37895 11.62461 48 75 2.892232 3.366490 FALSE
5 4 14.02128 11.14902 45 48 2.778605 3.362836 FALSE
D’apres le test de Rosner nous avons 2 valeurs atypiques dans la variable “loisir” et 1 valeur atypique dans la variable “vie_sociale”. Les observations 80, 61 et 34 sont donc des valeurs atypiques
Supprimer les valeurs atypiques
<- ecran[-c(9, 61, 34),]
ecran dim(ecran)
[1] 95 20
Statistiques descriptives sans les valeurs atypiques
Analyse univariée des variables quantitatives
str(ecran)
tibble [95 × 20] (S3: tbl_df/tbl/data.frame)
$ age : Factor w/ 4 levels "18 - 24 ans",..: 2 3 3 3 2 4 2 2 2 2 ...
$ genre : Factor w/ 2 levels "Femme","Homme": 1 1 1 2 1 1 1 2 2 1 ...
$ csp : Factor w/ 8 levels "Agriculteurs exploitants",..: 4 7 4 4 5 8 5 5 5 2 ...
$ lieu_de_vie : Factor w/ 3 levels "Campagne","Périurbaine/ Banlieue",..: 3 1 2 3 1 1 1 2 2 3 ...
$ nb_personnes : num [1:95] 1 2 2 1 5 0 1 3 3 1 ...
$ revenu : Factor w/ 9 levels "< 10 000","10 000 - 20 000",..: 4 5 8 8 7 2 3 5 5 4 ...
$ temps_ecran : num [1:95] 35 35 30 60 64 28 28 35 21 60 ...
$ nb_appareils : Factor w/ 11 levels "1","10","2","3",..: 4 6 5 5 8 4 4 5 7 5 ...
$ internet : Factor w/ 4 levels "Non","Oui, avec l’ADSL",..: 3 3 3 3 2 2 3 3 3 3 ...
$ fibre : Factor w/ 2 levels "Non","Oui": 2 2 2 2 1 2 2 2 2 2 ...
$ forfait_tel : Factor w/ 9 levels "0","10 et 15 €",..: 2 2 3 1 3 8 4 3 5 3 ...
$ telephone_pro : Factor w/ 2 levels "Non","Oui": 2 1 2 2 1 1 1 2 2 2 ...
$ ecran_travail : Factor w/ 5 levels "Fréquemment (Plus de la moitié du temps)",..: 5 1 1 5 5 2 3 3 4 5 ...
$ sommeil : Factor w/ 4 levels "3h – 5h","5h – 7h",..: 2 3 3 2 3 3 2 3 3 1 ...
$ stress : Factor w/ 5 levels "Fréquemment",..: 3 3 4 1 1 4 1 4 4 5 ...
$ loisir : num [1:95] 3 10 1 6 12 2 6 21 20 4 ...
$ vie_sociale : num [1:95] 14 15 2 8 8 7 10 20 10 14 ...
$ ecran_jour : Factor w/ 7 levels "L’après midi",..: 7 1 3 7 1 7 1 7 1 4 ...
$ reseaux_sociaux: Factor w/ 11 levels "0","1","2","3",..: 6 3 2 1 1 1 2 4 3 7 ...
$ nb_abonnements : Factor w/ 9 levels "0","1","10","2",..: 1 2 5 1 2 2 1 2 2 5 ...
summary(ecran)
age genre
18 - 24 ans :45 Femme:70
25 - 49 ans :38 Homme:25
50- 69 ans : 9
70 ans et plus: 3
csp
Employés :33
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants):29
Cadres et professions intellectuelles supérieures :17
Professions intermédiaires : 6
Retraités : 4
Ouvriers : 3
(Other) : 3
lieu_de_vie nb_personnes revenu
Campagne :35 Min. :0.000 40 000 - 50 000:26
Périurbaine/ Banlieue:11 1st Qu.:1.000 20 000 - 30 000:22
Ville :49 Median :1.000 10 000 - 20 000:17
Mean :1.663 < 10 000 :11
3rd Qu.:3.000 30 000 - 40 000:10
Max. :5.000 50 000 - 60 000: 3
(Other) : 6
temps_ecran nb_appareils internet fibre
Min. : 4.50 3 :39 Non : 1 Non: 6
1st Qu.:26.50 4 :18 Oui, avec l’ADSL :17 Oui:89
Median :35.00 2 :14 Oui, avec la fibre :68
Mean :35.88 5 :10 Oui, avec une autre solution: 9
3rd Qu.:45.00 6 : 5
Max. :85.00 7 : 3
(Other): 6
forfait_tel telephone_pro
15 et 20 € :34 Non:32
10 et 15 € :20 Oui:63
Plus de 35€ :11
20 et 25 € :10
Entre 5 et 10 €: 6
30 et 35 € : 5
(Other) : 9
ecran_travail sommeil
Fréquemment (Plus de la moitié du temps) :25 3h – 5h : 9
Jamais : 4 5h – 7h :32
Parfois (Entre un quart et la moitié du temps):16 7h et 9h :51
Rarement :12 Plus de 9h: 3
Toute la journée :38
stress loisir vie_sociale
Fréquemment:26 Min. : 0.0 Min. : 0.00
Jamais : 1 1st Qu.: 4.0 1st Qu.: 5.00
Parfois :38 Median :10.0 Median :10.00
Rarement :15 Mean :11.3 Mean :15.12
Toujours :15 3rd Qu.:15.0 3rd Qu.:20.50
Max. :42.0 Max. :50.00
ecran_jour reseaux_sociaux nb_abonnements
L’après midi : 8 3 :24 1 :33
L’après midi, Le soir :10 2 :13 2 :21
Le matin : 5 5 :12 0 :17
Le matin, L’après midi : 7 4 :11 3 :12
Le matin, L’après midi, Le soir: 7 6 : 9 4 : 8
Le matin, Le soir : 3 1 : 8 5 : 2
Le soir :55 (Other):18 (Other): 2
summary(select_if(ecran, is.numeric))
nb_personnes temps_ecran loisir vie_sociale
Min. :0.000 Min. : 4.50 Min. : 0.0 Min. : 0.00
1st Qu.:1.000 1st Qu.:26.50 1st Qu.: 4.0 1st Qu.: 5.00
Median :1.000 Median :35.00 Median :10.0 Median :10.00
Mean :1.663 Mean :35.88 Mean :11.3 Mean :15.12
3rd Qu.:3.000 3rd Qu.:45.00 3rd Qu.:15.0 3rd Qu.:20.50
Max. :5.000 Max. :85.00 Max. :42.0 Max. :50.00
Histogrammes
par(mfrow = c(2,2))
hist(ecran$nb_personnes, main= "Répartition du nombre de personnes dans le foyer", xlab="personnes",ylab = "nombre d'individus", col = "blue4")
hist(ecran$temps_ecran, main= "Répartition du temps d'écrans", xlab="durée", ylab = "nombre d'individus", col = "blue4")
hist(ecran$loisir, main= "Répartition du temps consacré aux loisirs", xlab="durée", ylab = "nombre d'individus", col = "blue4")
hist(ecran$vie_sociale, main= "Répartition du temps consacré à la vie sociale", xlab="durée",ylab = "nombre d'individus", col = "blue4")
Analyse bivariée des variables quantitatives
Nous observons à l’aide de nuages de points le lien entre “temps_ecran” (y) et les variables explicatives
par(mfrow = c(2,2))
::map2(
purrr.x = c("nb_personnes", "loisir", "vie_sociale"),
.y = c("temps_ecran", "temps_ecran", "temps_ecran"),
.f = ~ ggplot(ecran) +
aes(x = get(.x), y = get(.y)) +
geom_point() +
labs(x = .x, y = .y) +
ggtitle(paste("Corrélation entre", .x, "et", .y)) +
theme_classic() +
theme(plot.title = element_text(hjust = 0.5, size = 12, face="bold"))
)
[[1]]
[[2]]
[[3]]
Correlation
Sous forme de matrice :
<- ecran[,c("nb_personnes","temps_ecran","loisir","vie_sociale")]
mydata =cor(mydata,method="s")
corr_mat corr_mat
nb_personnes temps_ecran loisir vie_sociale
nb_personnes 1.00000000 0.04474111 -0.0634830 0.08655831
temps_ecran 0.04474111 1.00000000 -0.2013519 -0.07046714
loisir -0.06348300 -0.20135191 1.0000000 0.44449510
vie_sociale 0.08655831 -0.07046714 0.4444951 1.00000000
corrplot(corr_mat, method = 'number',type="upper", tl.srt=45)
corrplot(corr_mat,type="upper")
Nous pouvons voir que la corrélation est très faible entre chaque variable explicative.De plus, la variable à expliquer a une corrélation négative avec les variables “loisir” et “vie_sociale” et positive avec la variable “nb_personnes”.
- Test de normalité des variables numeriques :
ks.test(ecran$nb_personnes,"pnorm",mean(ecran$nb_personnes),sd(ecran$nb_personnes))
Warning in ks.test.default(ecran$nb_personnes, "pnorm",
mean(ecran$nb_personnes), : ties should not be present for the
Kolmogorov-Smirnov test
Asymptotic one-sample Kolmogorov-Smirnov test
data: ecran$nb_personnes
D = 0.24631, p-value = 1.972e-05
alternative hypothesis: two-sided
ks.test(ecran$loisir,"pnorm",mean(ecran$loisir),sd(ecran$loisir))
Warning in ks.test.default(ecran$loisir, "pnorm", mean(ecran$loisir),
sd(ecran$loisir)): ties should not be present for the Kolmogorov-Smirnov test
Asymptotic one-sample Kolmogorov-Smirnov test
data: ecran$loisir
D = 0.15804, p-value = 0.01738
alternative hypothesis: two-sided
ks.test(ecran$vie_sociale,"pnorm",mean(ecran$vie_sociale),sd(ecran$vie_sociale))
Warning in ks.test.default(ecran$vie_sociale, "pnorm", mean(ecran$vie_sociale),
: ties should not be present for the Kolmogorov-Smirnov test
Asymptotic one-sample Kolmogorov-Smirnov test
data: ecran$vie_sociale
D = 0.18785, p-value = 0.00245
alternative hypothesis: two-sided
Les variables ne suivent pas la loi normale , on va donc utiliser le coefficient de Spearman
Sous forme de tableau :
cor(ecran[,c("nb_personnes","temps_ecran","loisir","vie_sociale")],
use="complete.obs",method = c("spearman"))
nb_personnes temps_ecran loisir vie_sociale
nb_personnes 1.00000000 0.04474111 -0.0634830 0.08655831
temps_ecran 0.04474111 1.00000000 -0.2013519 -0.07046714
loisir -0.06348300 -0.20135191 1.0000000 0.44449510
vie_sociale 0.08655831 -0.07046714 0.4444951 1.00000000
Pour avoir un aperçu visuel, nous utilisons une matrice de corrélation complétée par les nuages de points et les histogrammes.
#chart.Correlation(mydata, histogram=TRUE, pch=19,method = c("spearman"))
- Conclusion : Pas de corrélation entre ces variables explicatives donc nous allons les conserver.
Catégories
Pour avoir un nombre de variables correctes et pas démesurés ; Création ecran2
<- ecran
ecran2 summary(ecran2)
age genre
18 - 24 ans :45 Femme:70
25 - 49 ans :38 Homme:25
50- 69 ans : 9
70 ans et plus: 3
csp
Employés :33
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants):29
Cadres et professions intellectuelles supérieures :17
Professions intermédiaires : 6
Retraités : 4
Ouvriers : 3
(Other) : 3
lieu_de_vie nb_personnes revenu
Campagne :35 Min. :0.000 40 000 - 50 000:26
Périurbaine/ Banlieue:11 1st Qu.:1.000 20 000 - 30 000:22
Ville :49 Median :1.000 10 000 - 20 000:17
Mean :1.663 < 10 000 :11
3rd Qu.:3.000 30 000 - 40 000:10
Max. :5.000 50 000 - 60 000: 3
(Other) : 6
temps_ecran nb_appareils internet fibre
Min. : 4.50 3 :39 Non : 1 Non: 6
1st Qu.:26.50 4 :18 Oui, avec l’ADSL :17 Oui:89
Median :35.00 2 :14 Oui, avec la fibre :68
Mean :35.88 5 :10 Oui, avec une autre solution: 9
3rd Qu.:45.00 6 : 5
Max. :85.00 7 : 3
(Other): 6
forfait_tel telephone_pro
15 et 20 € :34 Non:32
10 et 15 € :20 Oui:63
Plus de 35€ :11
20 et 25 € :10
Entre 5 et 10 €: 6
30 et 35 € : 5
(Other) : 9
ecran_travail sommeil
Fréquemment (Plus de la moitié du temps) :25 3h – 5h : 9
Jamais : 4 5h – 7h :32
Parfois (Entre un quart et la moitié du temps):16 7h et 9h :51
Rarement :12 Plus de 9h: 3
Toute la journée :38
stress loisir vie_sociale
Fréquemment:26 Min. : 0.0 Min. : 0.00
Jamais : 1 1st Qu.: 4.0 1st Qu.: 5.00
Parfois :38 Median :10.0 Median :10.00
Rarement :15 Mean :11.3 Mean :15.12
Toujours :15 3rd Qu.:15.0 3rd Qu.:20.50
Max. :42.0 Max. :50.00
ecran_jour reseaux_sociaux nb_abonnements
L’après midi : 8 3 :24 1 :33
L’après midi, Le soir :10 2 :13 2 :21
Le matin : 5 5 :12 0 :17
Le matin, L’après midi : 7 4 :11 3 :12
Le matin, L’après midi, Le soir: 7 6 : 9 4 : 8
Le matin, Le soir : 3 1 : 8 5 : 2
Le soir :55 (Other):18 (Other): 2
Regrouper en catégories plus larges et création de catégories binaires
Variables quali en binaire
- Réseaux sociaux
summary(ecran2$reseaux_sociaux)
0 1 2 3 4 5 6
5 8 13 24 11 12 9
7 8 9 Plus de 10
6 3 0 4
<- ecran2 |>
ecran2 mutate(cat_reseau_0_2 = ifelse(reseaux_sociaux %in% c("0","1","2"), 1, 0),
cat_reseau_3_5 = ifelse(reseaux_sociaux %in% c("3","4","5"), 1, 0),
cat_reseau_6_sup6 = ifelse(reseaux_sociaux %in% c("6","7","8","9","Plus de 10"), 1, 0))
- Age
<- ecran2 |>
ecran2 mutate(cat_18_24 = ifelse(age == "18 - 24 ans", 1, 0),
cat_25_49 = ifelse(age == "25 - 49 ans", 1, 0),
cat_plus_50 = ifelse(age %in% c("50- 69 ans","70 ans et plus"), 1, 0))
- Forfait téléphone
summary(ecran2$forfait_tel)
0 10 et 15 € 15 et 20 € 20 et 25 € 25 et 30 €
2 20 34 10 3
30 et 35 € Entre 5 et 10 € Moins de 5 € Plus de 35€
5 6 4 11
<- ecran2 |>
ecran2 mutate(tel_inf_15 = ifelse(forfait_tel %in% c("0", "Moins de 5 €","Entre 5 et 10 €","10 et 15 €" ), 1, 0),
tel_15_25 = ifelse(forfait_tel %in% c("15 et 20 €","20 et 25 €"), 1, 0),
tel_sup_25 = ifelse(forfait_tel %in% c("25 et 30 €","30 et 35 €","Plus de 35€"), 1, 0))
- Nombre d’appareils
summary(ecran2$nb_appareils)
1 10 2 3 4 5 6
1 2 14 39 18 10 5
7 8 9 Plus de 10
3 0 1 2
<- ecran2 |>
ecran2 mutate(appareils_1_2 = ifelse(nb_appareils %in% c("1", "2"), 1, 0),
appareils_3_4 = ifelse(nb_appareils %in% c("3", "4"), 1, 0),
appareils_plus_4 = ifelse(nb_appareils %in% c("5","6","7","8","9","10","Plus de 10"), 1, 0))
- Nombre d’abonnements
summary(ecran2$nb_abonnements)
0 1 10 2 3 4 5
17 33 1 21 12 8 2
7 Plus de 10
0 1
<- ecran2 |>
ecran2 mutate(abo_0 = ifelse(nb_abonnements == "0", 1, 0),
abo_1 = ifelse(nb_abonnements == "1", 1, 0),
abo_2 = ifelse(nb_abonnements == "2", 1, 0),
abo_3_sup = ifelse(nb_abonnements %in% c("3","4","5","6","7", "8","9","10","Plus de 10"), 1, 0))
- Genre
summary(ecran2$genre)
Femme Homme
70 25
<- ecran2 |>
ecran2 mutate(homme = ifelse(genre == "Homme", 1, 0),
femme = ifelse(genre == "Femme", 1, 0))
- Lieu de vie
summary(ecran2$lieu_de_vie)
Campagne Périurbaine/ Banlieue Ville
35 11 49
<- ecran2 |>
ecran2 mutate(pas_ville = ifelse(lieu_de_vie %in% c("Campagne","Périurbaine/ Banlieue"), 1, 0),
ville = ifelse(lieu_de_vie == "Ville", 1, 0))
- CSP
summary(ecran2$csp)
Agriculteurs exploitants
1
Artisan/commerçant/Chef d’entreprise
2
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants)
29
Cadres et professions intellectuelles supérieures
17
Employés
33
Ouvriers
3
Professions intermédiaires
6
Retraités
4
<- ecran2 |>
ecran2 mutate(cat_Employes = ifelse(csp == "Employés", 1, 0),
cat_sans_activite = ifelse(csp == "Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants)", 1, 0),
cat_cadres = ifelse(csp == "Cadres et professions intellectuelles supérieures", 1, 0),
cat_autres = ifelse(csp %in% c("Professions intermédiaires","Retraités", "Ouvriers", "Artisan/commerçant/Chef d’entreprise","Agriculteurs exploitants"), 1, 0))
- Ecran au travail
summary(ecran2$ecran_travail)
Fréquemment (Plus de la moitié du temps)
25
Jamais
4
Parfois (Entre un quart et la moitié du temps)
16
Rarement
12
Toute la journée
38
<- ecran2 |>
ecran2 mutate(ecran_travail_plein = ifelse(ecran_travail == "Toute la journée", 1, 0),
ecran_travail_bcp = ifelse(ecran_travail == "Fréquemment (Plus de la moitié du temps)", 1, 0),
ecran_travail_peu = ifelse(ecran_travail %in% c("Parfois (Entre un quart et la moitié du temps)","Rarement","Jamais"), 1, 0))
- Internet
summary(ecran2$internet)
Non Oui, avec l’ADSL
1 17
Oui, avec la fibre Oui, avec une autre solution
68 9
<- ecran2 |>
ecran2 mutate(pas_internet = ifelse(internet == "Non", 1, 0),
internet_autre = ifelse(internet %in% c("Oui, avec l’ADSL", "Oui, avec une autre solution"), 1, 0),
internet_fibre = ifelse(internet == "Oui, avec la fibre", 1, 0))
- Sommeil
summary(ecran2$sommeil)
3h – 5h 5h – 7h 7h et 9h Plus de 9h
9 32 51 3
<- ecran2 |>
ecran2 mutate(nuit_inf_7 = ifelse(sommeil %in% c("3h – 5h", "5h – 7h"), 1, 0),
nuit_5_7 = ifelse(sommeil %in% c("7h et 9h","Plus de 9h"), 1, 0))
- Ecran jour
summary(ecran2$ecran_jour)
L’après midi L’après midi, Le soir
8 10
Le matin Le matin, L’après midi
5 7
Le matin, L’après midi, Le soir Le matin, Le soir
7 3
Le soir
55
<- ecran2 |>
ecran2 mutate(jour_3 = ifelse(ecran_jour == "Le matin, L’après midi, Le soir", 1, 0),
jour_2 = ifelse(ecran_jour %in% c("L’après midi, Le soir", "Le matin, L’après midi", "Le matin, Le soir"), 1, 0),
jour_1 = ifelse(ecran_jour %in% c("L’après midi","Le matin","Le soir"), 1, 0))
Variables instruments
- Revenu
summary(ecran2$revenu)
< 10 000 10 000 - 20 000 20 000 - 30 000 30 000 - 40 000 40 000 - 50 000
11 17 22 10 26
50 000 - 60 000 60 000 - 70 000 70 000 - 80 000 80 000 et plus
3 2 3 1
<- ecran2 |>
ecran2 mutate(cat_inf_20000 = ifelse(revenu %in% c("< 10 000","10 000 - 20 000"), 1, 0),
cat_20_40000 = ifelse(revenu %in% c("20 000 - 30 000","30 000 - 40 000"), 1, 0),
cat_sup_40000 = ifelse(revenu %in% c("40 000 - 50 000","50 000 - 60 000","60 000 - 70 000", "70 000 - 80 000","80 000 et plus"), 1, 0))
- Fibre
summary(ecran2$fibre)
Non Oui
6 89
<- ecran2 |>
ecran2 mutate(fibre_oui = ifelse(fibre == "Oui", 1, 0),
fibre_non = ifelse(fibre == "Non", 1, 0))
- Téléphone pro
summary(ecran2$telephone_pro)
Non Oui
32 63
<- ecran2 |>
ecran2 mutate(tel_pro_non = ifelse(telephone_pro == "Non", 1, 0),
tel_pro_oui = ifelse(telephone_pro == "Oui", 1, 0))
- Stress
summary(ecran2$stress)
Fréquemment Jamais Parfois Rarement Toujours
26 1 38 15 15
<- ecran2 |>
ecran2 mutate(stress_toujours = ifelse(stress == "Toujours", 1, 0),
stress_bcp = ifelse(stress == "Fréquemment", 1, 0),
stress_peu = ifelse(stress %in% c("Parfois", "Rarement","Jamais"),1, 0))
summary(ecran2)
age genre
18 - 24 ans :45 Femme:70
25 - 49 ans :38 Homme:25
50- 69 ans : 9
70 ans et plus: 3
csp
Employés :33
Autres personnes sans activité professionnelle (par exemple les chômeurs ou les étudiants):29
Cadres et professions intellectuelles supérieures :17
Professions intermédiaires : 6
Retraités : 4
Ouvriers : 3
(Other) : 3
lieu_de_vie nb_personnes revenu
Campagne :35 Min. :0.000 40 000 - 50 000:26
Périurbaine/ Banlieue:11 1st Qu.:1.000 20 000 - 30 000:22
Ville :49 Median :1.000 10 000 - 20 000:17
Mean :1.663 < 10 000 :11
3rd Qu.:3.000 30 000 - 40 000:10
Max. :5.000 50 000 - 60 000: 3
(Other) : 6
temps_ecran nb_appareils internet fibre
Min. : 4.50 3 :39 Non : 1 Non: 6
1st Qu.:26.50 4 :18 Oui, avec l’ADSL :17 Oui:89
Median :35.00 2 :14 Oui, avec la fibre :68
Mean :35.88 5 :10 Oui, avec une autre solution: 9
3rd Qu.:45.00 6 : 5
Max. :85.00 7 : 3
(Other): 6
forfait_tel telephone_pro
15 et 20 € :34 Non:32
10 et 15 € :20 Oui:63
Plus de 35€ :11
20 et 25 € :10
Entre 5 et 10 €: 6
30 et 35 € : 5
(Other) : 9
ecran_travail sommeil
Fréquemment (Plus de la moitié du temps) :25 3h – 5h : 9
Jamais : 4 5h – 7h :32
Parfois (Entre un quart et la moitié du temps):16 7h et 9h :51
Rarement :12 Plus de 9h: 3
Toute la journée :38
stress loisir vie_sociale
Fréquemment:26 Min. : 0.0 Min. : 0.00
Jamais : 1 1st Qu.: 4.0 1st Qu.: 5.00
Parfois :38 Median :10.0 Median :10.00
Rarement :15 Mean :11.3 Mean :15.12
Toujours :15 3rd Qu.:15.0 3rd Qu.:20.50
Max. :42.0 Max. :50.00
ecran_jour reseaux_sociaux nb_abonnements
L’après midi : 8 3 :24 1 :33
L’après midi, Le soir :10 2 :13 2 :21
Le matin : 5 5 :12 0 :17
Le matin, L’après midi : 7 4 :11 3 :12
Le matin, L’après midi, Le soir: 7 6 : 9 4 : 8
Le matin, Le soir : 3 1 : 8 5 : 2
Le soir :55 (Other):18 (Other): 2
cat_reseau_0_2 cat_reseau_3_5 cat_reseau_6_sup6 cat_18_24
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :0.0000 Median :0.0000 Median :0.0000
Mean :0.2737 Mean :0.4947 Mean :0.2316 Mean :0.4737
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
cat_25_49 cat_plus_50 tel_inf_15 tel_15_25 tel_sup_25
Min. :0.0 Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0
1st Qu.:0.0 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0
Median :0.0 Median :0.0000 Median :0.0000 Median :0.0000 Median :0.0
Mean :0.4 Mean :0.1263 Mean :0.3368 Mean :0.4632 Mean :0.2
3rd Qu.:1.0 3rd Qu.:0.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.0
Max. :1.0 Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0
appareils_1_2 appareils_3_4 appareils_plus_4 abo_0
Min. :0.0000 Min. :0.0 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :1.0 Median :0.0000 Median :0.0000
Mean :0.1579 Mean :0.6 Mean :0.2421 Mean :0.1789
3rd Qu.:0.0000 3rd Qu.:1.0 3rd Qu.:0.0000 3rd Qu.:0.0000
Max. :1.0000 Max. :1.0 Max. :1.0000 Max. :1.0000
abo_1 abo_2 abo_3_sup homme
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :0.0000 Median :0.0000 Median :0.0000
Mean :0.3474 Mean :0.2211 Mean :0.2526 Mean :0.2632
3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:0.5000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
femme pas_ville ville cat_Employes
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :1.0000 Median :0.0000 Median :1.0000 Median :0.0000
Mean :0.7368 Mean :0.4842 Mean :0.5158 Mean :0.3474
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
cat_sans_activite cat_cadres cat_autres ecran_travail_plein
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0
Median :0.0000 Median :0.0000 Median :0.0000 Median :0.0
Mean :0.3053 Mean :0.1789 Mean :0.1684 Mean :0.4
3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:0.0000 3rd Qu.:1.0
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0
ecran_travail_bcp ecran_travail_peu pas_internet internet_autre
Min. :0.0000 Min. :0.0000 Min. :0.00000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:0.0000
Median :0.0000 Median :0.0000 Median :0.00000 Median :0.0000
Mean :0.2632 Mean :0.3368 Mean :0.01053 Mean :0.2737
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.00000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.00000 Max. :1.0000
internet_fibre nuit_inf_7 nuit_5_7 jour_3
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.00000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.00000
Median :1.0000 Median :0.0000 Median :1.0000 Median :0.00000
Mean :0.7158 Mean :0.4316 Mean :0.5684 Mean :0.07368
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.00000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.00000
jour_2 jour_1 cat_inf_20000 cat_20_40000
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :1.0000 Median :0.0000 Median :0.0000
Mean :0.2105 Mean :0.7158 Mean :0.2947 Mean :0.3368
3rd Qu.:0.0000 3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
cat_sup_40000 fibre_oui fibre_non tel_pro_non
Min. :0.0000 Min. :0.0000 Min. :0.00000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:1.0000 1st Qu.:0.00000 1st Qu.:0.0000
Median :0.0000 Median :1.0000 Median :0.00000 Median :0.0000
Mean :0.3684 Mean :0.9368 Mean :0.06316 Mean :0.3368
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.00000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.00000 Max. :1.0000
tel_pro_oui stress_toujours stress_bcp stress_peu
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :1.0000 Median :0.0000 Median :0.0000 Median :1.0000
Mean :0.6632 Mean :0.1579 Mean :0.2737 Mean :0.5684
3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:1.0000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
str(ecran2)
tibble [95 × 65] (S3: tbl_df/tbl/data.frame)
$ age : Factor w/ 4 levels "18 - 24 ans",..: 2 3 3 3 2 4 2 2 2 2 ...
$ genre : Factor w/ 2 levels "Femme","Homme": 1 1 1 2 1 1 1 2 2 1 ...
$ csp : Factor w/ 8 levels "Agriculteurs exploitants",..: 4 7 4 4 5 8 5 5 5 2 ...
$ lieu_de_vie : Factor w/ 3 levels "Campagne","Périurbaine/ Banlieue",..: 3 1 2 3 1 1 1 2 2 3 ...
$ nb_personnes : num [1:95] 1 2 2 1 5 0 1 3 3 1 ...
$ revenu : Factor w/ 9 levels "< 10 000","10 000 - 20 000",..: 4 5 8 8 7 2 3 5 5 4 ...
$ temps_ecran : num [1:95] 35 35 30 60 64 28 28 35 21 60 ...
$ nb_appareils : Factor w/ 11 levels "1","10","2","3",..: 4 6 5 5 8 4 4 5 7 5 ...
$ internet : Factor w/ 4 levels "Non","Oui, avec l’ADSL",..: 3 3 3 3 2 2 3 3 3 3 ...
$ fibre : Factor w/ 2 levels "Non","Oui": 2 2 2 2 1 2 2 2 2 2 ...
$ forfait_tel : Factor w/ 9 levels "0","10 et 15 €",..: 2 2 3 1 3 8 4 3 5 3 ...
$ telephone_pro : Factor w/ 2 levels "Non","Oui": 2 1 2 2 1 1 1 2 2 2 ...
$ ecran_travail : Factor w/ 5 levels "Fréquemment (Plus de la moitié du temps)",..: 5 1 1 5 5 2 3 3 4 5 ...
$ sommeil : Factor w/ 4 levels "3h – 5h","5h – 7h",..: 2 3 3 2 3 3 2 3 3 1 ...
$ stress : Factor w/ 5 levels "Fréquemment",..: 3 3 4 1 1 4 1 4 4 5 ...
$ loisir : num [1:95] 3 10 1 6 12 2 6 21 20 4 ...
$ vie_sociale : num [1:95] 14 15 2 8 8 7 10 20 10 14 ...
$ ecran_jour : Factor w/ 7 levels "L’après midi",..: 7 1 3 7 1 7 1 7 1 4 ...
$ reseaux_sociaux : Factor w/ 11 levels "0","1","2","3",..: 6 3 2 1 1 1 2 4 3 7 ...
$ nb_abonnements : Factor w/ 9 levels "0","1","10","2",..: 1 2 5 1 2 2 1 2 2 5 ...
$ cat_reseau_0_2 : num [1:95] 0 1 1 1 1 1 1 0 1 0 ...
$ cat_reseau_3_5 : num [1:95] 1 0 0 0 0 0 0 1 0 0 ...
$ cat_reseau_6_sup6 : num [1:95] 0 0 0 0 0 0 0 0 0 1 ...
$ cat_18_24 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ cat_25_49 : num [1:95] 1 0 0 0 1 0 1 1 1 1 ...
$ cat_plus_50 : num [1:95] 0 1 1 1 0 1 0 0 0 0 ...
$ tel_inf_15 : num [1:95] 1 1 0 1 0 1 0 0 0 0 ...
$ tel_15_25 : num [1:95] 0 0 1 0 1 0 1 1 0 1 ...
$ tel_sup_25 : num [1:95] 0 0 0 0 0 0 0 0 1 0 ...
$ appareils_1_2 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ appareils_3_4 : num [1:95] 1 0 1 1 0 1 1 1 0 1 ...
$ appareils_plus_4 : num [1:95] 0 1 0 0 1 0 0 0 1 0 ...
$ abo_0 : num [1:95] 1 0 0 1 0 0 1 0 0 0 ...
$ abo_1 : num [1:95] 0 1 0 0 1 1 0 1 1 0 ...
$ abo_2 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ abo_3_sup : num [1:95] 0 0 1 0 0 0 0 0 0 1 ...
$ homme : num [1:95] 0 0 0 1 0 0 0 1 1 0 ...
$ femme : num [1:95] 1 1 1 0 1 1 1 0 0 1 ...
$ pas_ville : num [1:95] 0 1 1 0 1 1 1 1 1 0 ...
$ ville : num [1:95] 1 0 0 1 0 0 0 0 0 1 ...
$ cat_Employes : num [1:95] 0 0 0 0 1 0 1 1 1 0 ...
$ cat_sans_activite : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ cat_cadres : num [1:95] 1 0 1 1 0 0 0 0 0 0 ...
$ cat_autres : num [1:95] 0 1 0 0 0 1 0 0 0 1 ...
$ ecran_travail_plein: num [1:95] 1 0 0 1 1 0 0 0 0 1 ...
$ ecran_travail_bcp : num [1:95] 0 1 1 0 0 0 0 0 0 0 ...
$ ecran_travail_peu : num [1:95] 0 0 0 0 0 1 1 1 1 0 ...
$ pas_internet : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ internet_autre : num [1:95] 0 0 0 0 1 1 0 0 0 0 ...
$ internet_fibre : num [1:95] 1 1 1 1 0 0 1 1 1 1 ...
$ nuit_inf_7 : num [1:95] 1 0 0 1 0 0 1 0 0 1 ...
$ nuit_5_7 : num [1:95] 0 1 1 0 1 1 0 1 1 0 ...
$ jour_3 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ jour_2 : num [1:95] 0 0 0 0 0 0 0 0 0 1 ...
$ jour_1 : num [1:95] 1 1 1 1 1 1 1 1 1 0 ...
$ cat_inf_20000 : num [1:95] 0 0 0 0 0 1 0 0 0 0 ...
$ cat_20_40000 : num [1:95] 1 0 0 0 0 0 1 0 0 1 ...
$ cat_sup_40000 : num [1:95] 0 1 1 1 1 0 0 1 1 0 ...
$ fibre_oui : num [1:95] 1 1 1 1 0 1 1 1 1 1 ...
$ fibre_non : num [1:95] 0 0 0 0 1 0 0 0 0 0 ...
$ tel_pro_non : num [1:95] 0 1 0 0 1 1 1 0 0 0 ...
$ tel_pro_oui : num [1:95] 1 0 1 1 0 0 0 1 1 1 ...
$ stress_toujours : num [1:95] 0 0 0 0 0 0 0 0 0 1 ...
$ stress_bcp : num [1:95] 0 0 0 1 1 0 1 0 0 0 ...
$ stress_peu : num [1:95] 1 1 1 0 0 1 0 1 1 0 ...
Création 2 base de données
- Base sans les instruments et la deuxième avec les instruments. Les deux avec la variable de référence
<- ecran2[, -c(1,2,3,4,5,6,8,9,10,11,12,13,14,15,18,19,20,56,57,58,59,60,61,62,63,64,65)]
ecran_sans_instru <- ecran2[, -c(1,2,3,4,6,8,9,10,11,12,13,14,15,18,19,20)]
ecran_avec_instru
#save(ecran_sans_instru, file = "data/ecran_sans_instru.rda")
#save(ecran_avec_instru, file = "data/ecran_avec_instru.rda")
- Base sans instruments et la deuxième avec les instruments. Les deux sans la variable de référence
<- ecran_sans_instru[, -c(5,7,11,14,17,21,23,24,28,33,35,38)]
ecran_sans_instru_sansref
<- ecran_avec_instru[, -c(6,8,12,15,18,22,24,25,29,34,36,39,42,43,46,49)]
ecran_avec_instru_sansref
#save(ecran_sans_instru_sansref, file = "data/ecran_sans_instru_sansref.rda")
#save(ecran_avec_instru_sansref, file = "data/ecran_avec_instru_sansref.rda")
Analyse économétrique
Récupération de données
Utilisation de la base de données écran sans les instruments et sans la référence
load(here("data", "ecran_sans_instru_sansref.rda"))
<- ecran_sans_instru_sansref
ecran dim(ecran)
[1] 95 26
str(ecran)
tibble [95 × 26] (S3: tbl_df/tbl/data.frame)
$ temps_ecran : num [1:95] 35 35 30 60 64 28 28 35 21 60 ...
$ loisir : num [1:95] 3 10 1 6 12 2 6 21 20 4 ...
$ vie_sociale : num [1:95] 14 15 2 8 8 7 10 20 10 14 ...
$ cat_reseau_0_2 : num [1:95] 0 1 1 1 1 1 1 0 1 0 ...
$ cat_reseau_6_sup6: num [1:95] 0 0 0 0 0 0 0 0 0 1 ...
$ cat_25_49 : num [1:95] 1 0 0 0 1 0 1 1 1 1 ...
$ cat_plus_50 : num [1:95] 0 1 1 1 0 1 0 0 0 0 ...
$ tel_inf_15 : num [1:95] 1 1 0 1 0 1 0 0 0 0 ...
$ tel_sup_25 : num [1:95] 0 0 0 0 0 0 0 0 1 0 ...
$ appareils_1_2 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ appareils_plus_4 : num [1:95] 0 1 0 0 1 0 0 0 1 0 ...
$ abo_0 : num [1:95] 1 0 0 1 0 0 1 0 0 0 ...
$ abo_2 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ abo_3_sup : num [1:95] 0 0 1 0 0 0 0 0 0 1 ...
$ homme : num [1:95] 0 0 0 1 0 0 0 1 1 0 ...
$ pas_ville : num [1:95] 0 1 1 0 1 1 1 1 1 0 ...
$ cat_sans_activite: num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ cat_cadres : num [1:95] 1 0 1 1 0 0 0 0 0 0 ...
$ cat_autres : num [1:95] 0 1 0 0 0 1 0 0 0 1 ...
$ ecran_travail_bcp: num [1:95] 0 1 1 0 0 0 0 0 0 0 ...
$ ecran_travail_peu: num [1:95] 0 0 0 0 0 1 1 1 1 0 ...
$ pas_internet : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ internet_autre : num [1:95] 0 0 0 0 1 1 0 0 0 0 ...
$ nuit_inf_7 : num [1:95] 1 0 0 1 0 0 1 0 0 1 ...
$ jour_3 : num [1:95] 0 0 0 0 0 0 0 0 0 0 ...
$ jour_2 : num [1:95] 0 0 0 0 0 0 0 0 0 1 ...
4:26] <- lapply(ecran[4:26], as.factor)
ecran[str(ecran)
tibble [95 × 26] (S3: tbl_df/tbl/data.frame)
$ temps_ecran : num [1:95] 35 35 30 60 64 28 28 35 21 60 ...
$ loisir : num [1:95] 3 10 1 6 12 2 6 21 20 4 ...
$ vie_sociale : num [1:95] 14 15 2 8 8 7 10 20 10 14 ...
$ cat_reseau_0_2 : Factor w/ 2 levels "0","1": 1 2 2 2 2 2 2 1 2 1 ...
$ cat_reseau_6_sup6: Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 2 ...
$ cat_25_49 : Factor w/ 2 levels "0","1": 2 1 1 1 2 1 2 2 2 2 ...
$ cat_plus_50 : Factor w/ 2 levels "0","1": 1 2 2 2 1 2 1 1 1 1 ...
$ tel_inf_15 : Factor w/ 2 levels "0","1": 2 2 1 2 1 2 1 1 1 1 ...
$ tel_sup_25 : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 2 1 ...
$ appareils_1_2 : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
$ appareils_plus_4 : Factor w/ 2 levels "0","1": 1 2 1 1 2 1 1 1 2 1 ...
$ abo_0 : Factor w/ 2 levels "0","1": 2 1 1 2 1 1 2 1 1 1 ...
$ abo_2 : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
$ abo_3_sup : Factor w/ 2 levels "0","1": 1 1 2 1 1 1 1 1 1 2 ...
$ homme : Factor w/ 2 levels "0","1": 1 1 1 2 1 1 1 2 2 1 ...
$ pas_ville : Factor w/ 2 levels "0","1": 1 2 2 1 2 2 2 2 2 1 ...
$ cat_sans_activite: Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
$ cat_cadres : Factor w/ 2 levels "0","1": 2 1 2 2 1 1 1 1 1 1 ...
$ cat_autres : Factor w/ 2 levels "0","1": 1 2 1 1 1 2 1 1 1 2 ...
$ ecran_travail_bcp: Factor w/ 2 levels "0","1": 1 2 2 1 1 1 1 1 1 1 ...
$ ecran_travail_peu: Factor w/ 2 levels "0","1": 1 1 1 1 1 2 2 2 2 1 ...
$ pas_internet : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
$ internet_autre : Factor w/ 2 levels "0","1": 1 1 1 1 2 2 1 1 1 1 ...
$ nuit_inf_7 : Factor w/ 2 levels "0","1": 2 1 1 2 1 1 2 1 1 2 ...
$ jour_3 : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 1 ...
$ jour_2 : Factor w/ 2 levels "0","1": 1 1 1 1 1 1 1 1 1 2 ...
summary(ecran)
temps_ecran loisir vie_sociale cat_reseau_0_2
Min. : 4.50 Min. : 0.0 Min. : 0.00 0:69
1st Qu.:26.50 1st Qu.: 4.0 1st Qu.: 5.00 1:26
Median :35.00 Median :10.0 Median :10.00
Mean :35.88 Mean :11.3 Mean :15.12
3rd Qu.:45.00 3rd Qu.:15.0 3rd Qu.:20.50
Max. :85.00 Max. :42.0 Max. :50.00
cat_reseau_6_sup6 cat_25_49 cat_plus_50 tel_inf_15 tel_sup_25 appareils_1_2
0:73 0:57 0:83 0:63 0:76 0:80
1:22 1:38 1:12 1:32 1:19 1:15
appareils_plus_4 abo_0 abo_2 abo_3_sup homme pas_ville cat_sans_activite
0:72 0:78 0:74 0:71 0:70 0:49 0:66
1:23 1:17 1:21 1:24 1:25 1:46 1:29
cat_cadres cat_autres ecran_travail_bcp ecran_travail_peu pas_internet
0:78 0:79 0:70 0:63 0:94
1:17 1:16 1:25 1:32 1: 1
internet_autre nuit_inf_7 jour_3 jour_2
0:69 0:54 0:88 0:75
1:26 1:41 1: 7 1:20
MCO
Hypothèses sous-jacentes à la méthode des Moindres Carrés Ordinaires
Modèle linéaire
Modèle avec toutes les variables, ne sera pas utilisé dans notre analyse - voir méthode STEP
<- lm(temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 + cat_25_49 + cat_plus_50 + tel_inf_15 + tel_sup_25 + appareils_1_2 + appareils_plus_4 + abo_0 + abo_2 + abo_3_sup + homme + pas_ville + cat_sans_activite + cat_cadres + cat_autres + ecran_travail_bcp + ecran_travail_peu + pas_internet + internet_autre + nuit_inf_7 + jour_3 + jour_2, data=ecran)
modele1
summary(modele1)
Call:
lm(formula = temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 +
cat_reseau_6_sup6 + cat_25_49 + cat_plus_50 + tel_inf_15 +
tel_sup_25 + appareils_1_2 + appareils_plus_4 + abo_0 + abo_2 +
abo_3_sup + homme + pas_ville + cat_sans_activite + cat_cadres +
cat_autres + ecran_travail_bcp + ecran_travail_peu + pas_internet +
internet_autre + nuit_inf_7 + jour_3 + jour_2, data = ecran)
Residuals:
Min 1Q Median 3Q Max
-24.503 -8.912 -0.815 7.447 35.558
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 41.0805 7.1099 5.778 1.99e-07 ***
loisir -0.1057 0.2103 -0.503 0.61685
vie_sociale -0.1800 0.1570 -1.147 0.25549
cat_reseau_0_21 -4.0312 5.0592 -0.797 0.42830
cat_reseau_6_sup61 9.5478 5.3309 1.791 0.07767 .
cat_25_491 -1.4514 5.2351 -0.277 0.78242
cat_plus_501 -4.1037 8.7089 -0.471 0.63898
tel_inf_151 -2.6226 4.0957 -0.640 0.52409
tel_sup_251 -7.9265 4.6422 -1.707 0.09223 .
appareils_1_21 11.5977 5.2763 2.198 0.03130 *
appareils_plus_41 3.1873 4.2642 0.747 0.45734
abo_01 -8.1979 5.0213 -1.633 0.10710
abo_21 -6.6294 5.0091 -1.323 0.19005
abo_3_sup1 -3.6215 4.4330 -0.817 0.41678
homme1 6.1879 4.1251 1.500 0.13816
pas_ville1 6.5266 3.7579 1.737 0.08689 .
cat_sans_activite1 2.1203 4.8246 0.439 0.66169
cat_cadres1 8.2460 5.8445 1.411 0.16277
cat_autres1 3.4039 5.7235 0.595 0.55397
ecran_travail_bcp1 -11.5269 4.6034 -2.504 0.01465 *
ecran_travail_peu1 -12.9224 4.7990 -2.693 0.00889 **
pas_internet1 13.0349 16.3039 0.799 0.42675
internet_autre1 6.6674 3.8631 1.726 0.08884 .
nuit_inf_71 -0.7751 3.6011 -0.215 0.83020
jour_31 -1.0904 6.9154 -0.158 0.87518
jour_21 3.6913 4.1450 0.891 0.37627
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 14.56 on 69 degrees of freedom
Multiple R-squared: 0.3839, Adjusted R-squared: 0.1607
F-statistic: 1.72 on 25 and 69 DF, p-value: 0.04026
R = 38.39% de la variance dans temps_ecran est expliquée par le modèle. R- ajusté : 16,07
P-value associée au test de Fisher < 0,05 : H0 est refusée ==> 0.040, le modèle, dans son ensemble, est statistiquement significatif, mais pas très fortement.
plot(modele1)
Warning: not plotting observations with leverage one:
70
D’après les graphiques, le modèle1
Ne suivent pas a priori une loi normale
Ne vérifie pas à priori l’hypothèse d’homoscédasticité car variance de la variable Mesure augmente à droite
Test de normalité de résidus
Hypothèse H0 : les erreurs suivent une loi normale au seuil de risque de 5 %
qqnorm(residuals(modele1))
hist(residuals(modele1), breaks=30, main="Histogramme des Résidus", xlab="Résidus")
<-residuals(modele1)
residus
shapiro.test(residus)
Shapiro-Wilk normality test
data: residus
W = 0.98024, p-value = 0.1614
ks.test(residus, "pnorm", mean = mean(residus), sd = sd(residus))
Exact one-sample Kolmogorov-Smirnov test
data: residus
D = 0.071371, p-value = 0.6913
alternative hypothesis: two-sided
p-value = 0,16 : hypothèse de normalité des résidus OK au seuil de risque de 5%
Test d’homoscédasticité des résidus
H0 = homoscedasticité
bptest(modele1)
studentized Breusch-Pagan test
data: modele1
BP = 12.07, df = 25, p-value = 0.986
p-value = 0.986 > 0,05 On ne rejette pas l’hypothèse nulle (à savoir l’homoscédasticité des résidus)
Test de la linéarité de la forme fonctionnelle
reset(modele1)
RESET test
data: modele1
RESET = 1.168, df1 = 2, df2 = 67, p-value = 0.3172
p-value = 0.3172
p_value> 0,05 forme fonctionnelle linéaire du modèle spécifié est acceptée au seuil de 5%
Analyse des observations influençant l’estimation
plot(cooks.distance(modele1),type="h")
# OU option avec le seuil
<- cooks.distance(modele1)
cooks_d # Afficher le graphique des distances de Cook
plot(cooks_d, type="h", main="Distances de Cook")
Vérification de la multicolinéarité après estimation
vif(modele1)
loisir vie_sociale cat_reseau_0_2 cat_reseau_6_sup6
1.554233 1.759555 2.280368 2.266505
cat_25_49 cat_plus_50 tel_inf_15 tel_sup_25
2.947956 3.751426 1.679451 1.545372
appareils_1_2 appareils_plus_4 abo_0 abo_2
1.659030 1.495394 1.660307 1.936374
abo_3_sup homme pas_ville cat_sans_activite
1.662921 1.478839 1.580720 2.212485
cat_cadres cat_autres ecran_travail_bcp ecran_travail_peu
2.249285 2.056297 1.841631 2.305654
pas_internet internet_autre nuit_inf_7 jour_3
1.240853 1.329520 1.425768 1.462933
jour_2
1.279849
Pas de problème de multicolinéarité entre les différentes variables explicatives du modèle
Step : Sélection des variables explicatives significatives (modèle linéaire = modele1 )
<- (lm(temps_ecran~1,data=ecran))
modele0 summary(modele0)
Call:
lm(formula = temps_ecran ~ 1, data = ecran)
Residuals:
Min 1Q Median 3Q Max
-31.384 -9.384 -0.884 9.116 49.116
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 35.88 1.63 22.01 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 15.89 on 94 degrees of freedom
Méthode ascendante
step(modele0, scope=list(lower=modele0, upper=modele1), data=ecran, direction="forward")
Start: AIC=526.5
temps_ecran ~ 1
Df Sum of Sq RSS AIC
+ ecran_travail_peu 1 1788.08 21952 521.06
+ cat_reseau_6_sup6 1 1287.78 22452 523.20
+ cat_reseau_0_2 1 1144.13 22596 523.81
+ homme 1 915.94 22824 524.76
+ jour_2 1 879.10 22861 524.92
+ loisir 1 851.67 22889 525.03
+ cat_cadres 1 659.84 23080 525.82
+ cat_plus_50 1 545.29 23195 526.29
<none> 23740 526.50
+ cat_sans_activite 1 441.91 23298 526.71
+ abo_0 1 425.13 23315 526.78
+ cat_autres 1 396.66 23344 526.90
+ internet_autre 1 330.58 23410 527.17
+ cat_25_49 1 264.11 23476 527.44
+ tel_sup_25 1 243.20 23497 527.52
+ jour_3 1 226.35 23514 527.59
+ vie_sociale 1 222.86 23517 527.60
+ nuit_inf_7 1 133.38 23607 527.96
+ appareils_plus_4 1 36.83 23703 528.35
+ tel_inf_15 1 14.77 23726 528.44
+ abo_2 1 11.25 23729 528.45
+ abo_3_sup 1 4.30 23736 528.48
+ appareils_1_2 1 4.18 23736 528.48
+ ecran_travail_bcp 1 2.74 23738 528.49
+ pas_ville 1 1.20 23739 528.49
+ pas_internet 1 0.79 23739 528.50
Step: AIC=521.06
temps_ecran ~ ecran_travail_peu
Df Sum of Sq RSS AIC
+ homme 1 1139.01 20813 518.00
+ cat_reseau_6_sup6 1 945.82 21006 518.88
+ cat_reseau_0_2 1 747.34 21205 519.77
+ loisir 1 731.69 21220 519.84
+ jour_2 1 556.61 21396 520.62
+ ecran_travail_bcp 1 472.44 21480 520.99
+ vie_sociale 1 461.79 21490 521.04
<none> 21952 521.06
+ cat_25_49 1 316.88 21635 521.68
+ abo_0 1 307.56 21645 521.72
+ cat_sans_activite 1 240.24 21712 522.02
+ cat_plus_50 1 233.15 21719 522.05
+ internet_autre 1 210.96 21741 522.14
+ cat_cadres 1 151.78 21800 522.40
+ nuit_inf_7 1 125.19 21827 522.52
+ cat_autres 1 122.97 21829 522.53
+ abo_2 1 109.71 21842 522.58
+ tel_sup_25 1 91.66 21860 522.66
+ pas_ville 1 60.76 21891 522.80
+ jour_3 1 44.64 21908 522.87
+ appareils_1_2 1 32.05 21920 522.92
+ pas_internet 1 16.07 21936 522.99
+ appareils_plus_4 1 11.32 21941 523.01
+ tel_inf_15 1 2.92 21949 523.05
+ abo_3_sup 1 0.08 21952 523.06
Step: AIC=518
temps_ecran ~ ecran_travail_peu + homme
Df Sum of Sq RSS AIC
+ cat_reseau_6_sup6 1 1021.05 19792 515.22
+ loisir 1 692.86 20120 516.78
+ cat_reseau_0_2 1 644.59 20168 517.01
+ vie_sociale 1 549.14 20264 517.46
<none> 20813 518.00
+ cat_sans_activite 1 398.57 20415 518.16
+ ecran_travail_bcp 1 393.38 20420 518.19
+ jour_2 1 393.19 20420 518.19
+ cat_plus_50 1 377.93 20435 518.26
+ cat_25_49 1 320.40 20493 518.53
+ abo_0 1 267.13 20546 518.77
+ internet_autre 1 250.67 20562 518.85
+ nuit_inf_7 1 173.35 20640 519.20
+ cat_autres 1 150.06 20663 519.31
+ pas_ville 1 138.11 20675 519.37
+ tel_inf_15 1 105.85 20707 519.51
+ abo_2 1 97.76 20715 519.55
+ appareils_1_2 1 36.45 20777 519.83
+ tel_sup_25 1 26.36 20787 519.88
+ appareils_plus_4 1 16.65 20796 519.92
+ jour_3 1 6.17 20807 519.97
+ pas_internet 1 4.49 20809 519.98
+ abo_3_sup 1 2.91 20810 519.99
+ cat_cadres 1 1.20 20812 519.99
Step: AIC=515.22
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6
Df Sum of Sq RSS AIC
+ ecran_travail_bcp 1 500.53 19292 514.79
<none> 19792 515.22
+ internet_autre 1 402.56 19390 515.27
+ loisir 1 373.08 19419 515.41
+ vie_sociale 1 371.53 19421 515.42
+ cat_reseau_0_2 1 250.75 19541 516.01
+ jour_2 1 191.15 19601 516.30
+ cat_plus_50 1 188.68 19603 516.31
+ appareils_1_2 1 180.11 19612 516.35
+ pas_ville 1 151.31 19641 516.49
+ tel_sup_25 1 123.32 19669 516.63
+ tel_inf_15 1 122.30 19670 516.63
+ nuit_inf_7 1 118.01 19674 516.65
+ abo_0 1 112.54 19680 516.68
+ cat_cadres 1 102.20 19690 516.73
+ abo_3_sup 1 101.90 19690 516.73
+ cat_autres 1 89.74 19702 516.79
+ jour_3 1 71.74 19720 516.88
+ cat_sans_activite 1 69.89 19722 516.88
+ abo_2 1 56.34 19736 516.95
+ appareils_plus_4 1 32.90 19759 517.06
+ cat_25_49 1 29.19 19763 517.08
+ pas_internet 1 0.01 19792 517.22
Step: AIC=514.79
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp
Df Sum of Sq RSS AIC
+ internet_autre 1 650.73 18641 513.53
+ vie_sociale 1 416.49 18875 514.71
<none> 19292 514.79
+ appareils_1_2 1 319.75 18972 515.20
+ loisir 1 289.32 19002 515.35
+ tel_sup_25 1 219.49 19072 515.70
+ jour_2 1 213.87 19078 515.73
+ pas_ville 1 189.54 19102 515.85
+ cat_reseau_0_2 1 177.97 19114 515.91
+ abo_2 1 175.09 19116 515.92
+ nuit_inf_7 1 132.86 19159 516.13
+ abo_0 1 105.66 19186 516.27
+ tel_inf_15 1 103.24 19188 516.28
+ cat_plus_50 1 93.26 19198 516.33
+ cat_sans_activite 1 85.97 19206 516.36
+ cat_cadres 1 64.55 19227 516.47
+ cat_25_49 1 59.98 19232 516.49
+ abo_3_sup 1 35.89 19256 516.61
+ cat_autres 1 32.87 19259 516.62
+ appareils_plus_4 1 27.87 19264 516.65
+ jour_3 1 23.01 19269 516.67
+ pas_internet 1 13.76 19278 516.72
Step: AIC=513.53
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre
Df Sum of Sq RSS AIC
+ vie_sociale 1 399.35 18242 513.47
<none> 18641 513.53
+ loisir 1 356.70 18284 513.69
+ appareils_1_2 1 312.00 18329 513.92
+ jour_2 1 282.17 18359 514.08
+ tel_sup_25 1 264.16 18377 514.17
+ pas_ville 1 256.80 18384 514.21
+ cat_reseau_0_2 1 174.27 18467 514.63
+ abo_2 1 125.97 18515 514.88
+ cat_cadres 1 110.88 18530 514.96
+ abo_0 1 105.68 18535 514.99
+ cat_plus_50 1 99.34 18542 515.02
+ cat_autres 1 93.82 18547 515.05
+ abo_3_sup 1 62.40 18578 515.21
+ tel_inf_15 1 57.32 18584 515.23
+ pas_internet 1 46.94 18594 515.29
+ cat_sans_activite 1 31.00 18610 515.37
+ appareils_plus_4 1 27.80 18613 515.39
+ nuit_inf_7 1 25.83 18615 515.40
+ cat_25_49 1 11.73 18629 515.47
+ jour_3 1 4.38 18636 515.50
Step: AIC=513.47
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre + vie_sociale
Df Sum of Sq RSS AIC
<none> 18242 513.47
+ appareils_1_2 1 342.00 17900 513.67
+ tel_sup_25 1 296.33 17945 513.91
+ pas_ville 1 267.20 17974 514.07
+ jour_2 1 267.04 17974 514.07
+ cat_plus_50 1 258.27 17983 514.12
+ abo_0 1 250.90 17991 514.15
+ cat_reseau_0_2 1 133.87 18108 514.77
+ cat_cadres 1 131.15 18110 514.78
+ loisir 1 128.27 18113 514.80
+ cat_autres 1 100.27 18141 514.95
+ abo_3_sup 1 75.30 18166 515.08
+ tel_inf_15 1 62.36 18179 515.14
+ pas_internet 1 58.22 18183 515.17
+ abo_2 1 44.64 18197 515.24
+ appareils_plus_4 1 33.69 18208 515.29
+ cat_25_49 1 10.91 18231 515.41
+ nuit_inf_7 1 6.93 18235 515.43
+ cat_sans_activite 1 3.03 18238 515.45
+ jour_3 1 0.16 18241 515.47
Call:
lm(formula = temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre + vie_sociale, data = ecran)
Coefficients:
(Intercept) ecran_travail_peu1 homme1 cat_reseau_6_sup61
38.5981 -11.9641 8.2840 8.5305
ecran_travail_bcp1 internet_autre1 vie_sociale
-7.4881 6.0100 -0.1663
#AIC=513.47
Step: AIC=513.47
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 + ecran_travail_bcp + internet_autre + vie_sociale
Méthode descendante
step(modele1, data=ecran,direction="backward")
Start: AIC=530.48
temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
cat_25_49 + cat_plus_50 + tel_inf_15 + tel_sup_25 + appareils_1_2 +
appareils_plus_4 + abo_0 + abo_2 + abo_3_sup + homme + pas_ville +
cat_sans_activite + cat_cadres + cat_autres + ecran_travail_bcp +
ecran_travail_peu + pas_internet + internet_autre + nuit_inf_7 +
jour_3 + jour_2
Df Sum of Sq RSS AIC
- jour_3 1 5.27 14631 528.52
- nuit_inf_7 1 9.82 14636 528.55
- cat_25_49 1 16.29 14642 528.59
- cat_sans_activite 1 40.94 14667 528.75
- cat_plus_50 1 47.06 14673 528.79
- loisir 1 53.54 14679 528.83
- cat_autres 1 74.97 14701 528.97
- tel_inf_15 1 86.91 14712 529.05
- appareils_plus_4 1 118.42 14744 529.25
- cat_reseau_0_2 1 134.58 14760 529.35
- pas_internet 1 135.49 14761 529.36
- abo_3_sup 1 141.46 14767 529.40
- jour_2 1 168.10 14794 529.57
- vie_sociale 1 278.69 14904 530.28
<none> 14626 530.48
- abo_2 1 371.26 14997 530.86
- cat_cadres 1 421.95 15048 531.18
- homme 1 476.96 15103 531.53
- abo_0 1 564.99 15191 532.08
- tel_sup_25 1 617.98 15244 532.41
- internet_autre 1 631.41 15257 532.50
- pas_ville 1 639.36 15265 532.55
- cat_reseau_6_sup6 1 679.95 15306 532.80
- appareils_1_2 1 1024.10 15650 534.91
- ecran_travail_bcp 1 1329.03 15955 536.74
- ecran_travail_peu 1 1536.95 16163 537.97
Step: AIC=528.52
temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
cat_25_49 + cat_plus_50 + tel_inf_15 + tel_sup_25 + appareils_1_2 +
appareils_plus_4 + abo_0 + abo_2 + abo_3_sup + homme + pas_ville +
cat_sans_activite + cat_cadres + cat_autres + ecran_travail_bcp +
ecran_travail_peu + pas_internet + internet_autre + nuit_inf_7 +
jour_2
Df Sum of Sq RSS AIC
- nuit_inf_7 1 7.39 14638 526.56
- cat_25_49 1 14.17 14645 526.61
- cat_sans_activite 1 38.94 14670 526.77
- cat_plus_50 1 44.92 14676 526.81
- loisir 1 51.00 14682 526.85
- cat_autres 1 71.12 14702 526.98
- tel_inf_15 1 83.22 14714 527.06
- appareils_plus_4 1 114.40 14745 527.26
- cat_reseau_0_2 1 130.89 14762 527.36
- pas_internet 1 133.48 14764 527.38
- abo_3_sup 1 155.66 14787 527.52
- jour_2 1 183.96 14815 527.70
- vie_sociale 1 284.41 14915 528.35
<none> 14631 528.52
- abo_2 1 366.19 14997 528.86
- cat_cadres 1 420.16 15051 529.21
- homme 1 472.85 15104 529.54
- abo_0 1 594.32 15225 530.30
- tel_sup_25 1 613.01 15244 530.42
- pas_ville 1 635.13 15266 530.55
- internet_autre 1 636.44 15267 530.56
- cat_reseau_6_sup6 1 766.45 15397 531.37
- appareils_1_2 1 1048.54 15679 533.09
- ecran_travail_bcp 1 1362.38 15993 534.97
- ecran_travail_peu 1 1649.19 16280 536.66
Step: AIC=526.56
temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
cat_25_49 + cat_plus_50 + tel_inf_15 + tel_sup_25 + appareils_1_2 +
appareils_plus_4 + abo_0 + abo_2 + abo_3_sup + homme + pas_ville +
cat_sans_activite + cat_cadres + cat_autres + ecran_travail_bcp +
ecran_travail_peu + pas_internet + internet_autre + jour_2
Df Sum of Sq RSS AIC
- cat_25_49 1 17.50 14656 524.68
- cat_sans_activite 1 41.53 14680 524.83
- cat_plus_50 1 46.08 14684 524.86
- loisir 1 46.88 14685 524.87
- cat_autres 1 73.36 14712 525.04
- tel_inf_15 1 78.50 14717 525.07
- appareils_plus_4 1 110.81 14749 525.28
- pas_internet 1 128.38 14767 525.39
- cat_reseau_0_2 1 136.35 14775 525.45
- abo_3_sup 1 173.37 14812 525.68
- jour_2 1 178.05 14816 525.71
- vie_sociale 1 306.70 14945 526.53
<none> 14638 526.56
- abo_2 1 370.26 15009 526.94
- cat_cadres 1 425.64 15064 527.29
- homme 1 467.43 15106 527.55
- tel_sup_25 1 605.68 15244 528.42
- pas_ville 1 636.93 15275 528.61
- internet_autre 1 694.92 15333 528.97
- abo_0 1 697.95 15336 528.99
- cat_reseau_6_sup6 1 760.35 15399 529.38
- appareils_1_2 1 1042.75 15681 531.10
- ecran_travail_bcp 1 1358.30 15997 532.99
- ecran_travail_peu 1 1645.31 16284 534.68
Step: AIC=524.68
temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
cat_plus_50 + tel_inf_15 + tel_sup_25 + appareils_1_2 + appareils_plus_4 +
abo_0 + abo_2 + abo_3_sup + homme + pas_ville + cat_sans_activite +
cat_cadres + cat_autres + ecran_travail_bcp + ecran_travail_peu +
pas_internet + internet_autre + jour_2
Df Sum of Sq RSS AIC
- cat_plus_50 1 28.64 14684 522.86
- loisir 1 45.40 14701 522.97
- cat_autres 1 58.33 14714 523.06
- cat_sans_activite 1 63.88 14720 523.09
- tel_inf_15 1 78.99 14735 523.19
- appareils_plus_4 1 99.94 14756 523.32
- pas_internet 1 116.34 14772 523.43
- abo_3_sup 1 161.44 14817 523.72
- jour_2 1 170.05 14826 523.77
- cat_reseau_0_2 1 172.53 14828 523.79
<none> 14656 524.68
- vie_sociale 1 322.70 14978 524.75
- abo_2 1 357.17 15013 524.97
- cat_cadres 1 408.42 15064 525.29
- homme 1 479.63 15135 525.74
- tel_sup_25 1 648.76 15305 526.79
- abo_0 1 682.84 15339 527.00
- pas_ville 1 694.59 15350 527.08
- internet_autre 1 771.34 15427 527.55
- cat_reseau_6_sup6 1 1009.78 15666 529.01
- appareils_1_2 1 1121.98 15778 529.69
- ecran_travail_bcp 1 1385.80 16042 531.26
- ecran_travail_peu 1 1656.65 16312 532.85
Step: AIC=522.86
temps_ecran ~ loisir + vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_inf_15 + tel_sup_25 + appareils_1_2 + appareils_plus_4 +
abo_0 + abo_2 + abo_3_sup + homme + pas_ville + cat_sans_activite +
cat_cadres + cat_autres + ecran_travail_bcp + ecran_travail_peu +
pas_internet + internet_autre + jour_2
Df Sum of Sq RSS AIC
- loisir 1 34.35 14719 521.09
- cat_autres 1 40.63 14725 521.13
- cat_sans_activite 1 67.83 14752 521.30
- tel_inf_15 1 101.08 14786 521.52
- appareils_plus_4 1 101.61 14786 521.52
- pas_internet 1 114.78 14799 521.60
- abo_3_sup 1 190.11 14874 522.09
- jour_2 1 200.76 14885 522.15
- vie_sociale 1 294.10 14978 522.75
<none> 14684 522.86
- cat_reseau_0_2 1 328.21 15013 522.96
- cat_cadres 1 380.42 15065 523.29
- abo_2 1 393.65 15078 523.38
- homme 1 466.01 15150 523.83
- tel_sup_25 1 671.22 15356 525.11
- pas_ville 1 696.12 15381 525.26
- abo_0 1 703.32 15388 525.31
- internet_autre 1 767.42 15452 525.70
- cat_reseau_6_sup6 1 1021.64 15706 527.25
- appareils_1_2 1 1140.31 15825 527.97
- ecran_travail_bcp 1 1493.29 16178 530.06
- ecran_travail_peu 1 1820.54 16505 531.97
Step: AIC=521.09
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_inf_15 + tel_sup_25 + appareils_1_2 + appareils_plus_4 +
abo_0 + abo_2 + abo_3_sup + homme + pas_ville + cat_sans_activite +
cat_cadres + cat_autres + ecran_travail_bcp + ecran_travail_peu +
pas_internet + internet_autre + jour_2
Df Sum of Sq RSS AIC
- cat_autres 1 35.01 14754 519.31
- cat_sans_activite 1 75.94 14795 519.57
- tel_inf_15 1 86.34 14805 519.64
- appareils_plus_4 1 102.32 14821 519.74
- pas_internet 1 120.40 14839 519.86
- abo_3_sup 1 196.05 14915 520.34
- jour_2 1 233.89 14953 520.58
<none> 14719 521.09
- cat_reseau_0_2 1 330.41 15049 521.19
- abo_2 1 406.30 15125 521.67
- cat_cadres 1 408.57 15127 521.69
- vie_sociale 1 445.52 15164 521.92
- homme 1 456.91 15176 521.99
- tel_sup_25 1 683.80 15403 523.40
- abo_0 1 698.78 15418 523.49
- pas_ville 1 718.12 15437 523.61
- internet_autre 1 757.57 15476 523.85
- cat_reseau_6_sup6 1 1099.26 15818 525.93
- appareils_1_2 1 1127.62 15846 526.10
- ecran_travail_bcp 1 1576.39 16295 528.75
- ecran_travail_peu 1 1841.36 16560 530.28
Step: AIC=519.31
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_inf_15 + tel_sup_25 + appareils_1_2 + appareils_plus_4 +
abo_0 + abo_2 + abo_3_sup + homme + pas_ville + cat_sans_activite +
cat_cadres + ecran_travail_bcp + ecran_travail_peu + pas_internet +
internet_autre + jour_2
Df Sum of Sq RSS AIC
- cat_sans_activite 1 49.42 14803 517.63
- tel_inf_15 1 63.03 14817 517.72
- appareils_plus_4 1 111.33 14865 518.03
- pas_internet 1 118.11 14872 518.07
- abo_3_sup 1 179.69 14934 518.46
- jour_2 1 238.22 14992 518.83
- cat_reseau_0_2 1 301.61 15055 519.23
<none> 14754 519.31
- cat_cadres 1 373.56 15127 519.69
- abo_2 1 401.86 15156 519.86
- vie_sociale 1 466.73 15220 520.27
- homme 1 472.56 15226 520.31
- tel_sup_25 1 655.29 15409 521.44
- pas_ville 1 683.30 15437 521.61
- abo_0 1 684.14 15438 521.62
- internet_autre 1 863.67 15618 522.72
- cat_reseau_6_sup6 1 1094.96 15849 524.11
- appareils_1_2 1 1124.81 15879 524.29
- ecran_travail_bcp 1 1543.24 16297 526.76
- ecran_travail_peu 1 1808.15 16562 528.29
Step: AIC=517.63
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_inf_15 + tel_sup_25 + appareils_1_2 + appareils_plus_4 +
abo_0 + abo_2 + abo_3_sup + homme + pas_ville + cat_cadres +
ecran_travail_bcp + ecran_travail_peu + pas_internet + internet_autre +
jour_2
Df Sum of Sq RSS AIC
- tel_inf_15 1 54.91 14858 515.98
- appareils_plus_4 1 86.29 14890 516.18
- pas_internet 1 101.58 14905 516.28
- abo_3_sup 1 221.50 15025 517.04
- jour_2 1 224.29 15028 517.06
<none> 14803 517.63
- cat_cadres 1 337.67 15141 517.77
- cat_reseau_0_2 1 345.44 15149 517.82
- abo_2 1 376.00 15179 518.01
- homme 1 461.51 15265 518.55
- vie_sociale 1 573.93 15377 519.24
- tel_sup_25 1 608.76 15412 519.46
- pas_ville 1 655.57 15459 519.75
- abo_0 1 741.51 15545 520.27
- internet_autre 1 938.33 15742 521.47
- appareils_1_2 1 1189.94 15993 522.97
- cat_reseau_6_sup6 1 1319.63 16123 523.74
- ecran_travail_bcp 1 1503.17 16306 524.82
- ecran_travail_peu 1 1875.51 16679 526.96
Step: AIC=515.98
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + appareils_plus_4 + abo_0 + abo_2 +
abo_3_sup + homme + pas_ville + cat_cadres + ecran_travail_bcp +
ecran_travail_peu + pas_internet + internet_autre + jour_2
Df Sum of Sq RSS AIC
- appareils_plus_4 1 72.43 14931 514.44
- pas_internet 1 121.13 14979 514.75
- abo_3_sup 1 215.61 15074 515.35
- jour_2 1 217.00 15075 515.36
<none> 14858 515.98
- cat_cadres 1 367.23 15225 516.30
- homme 1 409.71 15268 516.56
- cat_reseau_0_2 1 435.31 15293 516.72
- abo_2 1 448.59 15307 516.81
- tel_sup_25 1 554.24 15412 517.46
- vie_sociale 1 555.55 15414 517.47
- pas_ville 1 654.08 15512 518.07
- abo_0 1 829.91 15688 519.14
- internet_autre 1 990.13 15848 520.11
- appareils_1_2 1 1186.06 16044 521.28
- cat_reseau_6_sup6 1 1269.59 16128 521.77
- ecran_travail_bcp 1 1530.49 16389 523.29
- ecran_travail_peu 1 1822.47 16681 524.97
Step: AIC=514.44
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + abo_2 + abo_3_sup +
homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu +
pas_internet + internet_autre + jour_2
Df Sum of Sq RSS AIC
- pas_internet 1 103.98 15034 513.10
- jour_2 1 212.23 15143 513.78
- abo_3_sup 1 231.08 15162 513.90
<none> 14931 514.44
- cat_cadres 1 384.07 15315 514.86
- homme 1 412.73 15343 515.03
- cat_reseau_0_2 1 419.03 15350 515.07
- abo_2 1 438.88 15369 515.19
- tel_sup_25 1 501.82 15432 515.58
- vie_sociale 1 552.94 15484 515.90
- pas_ville 1 821.81 15752 517.53
- abo_0 1 871.71 15802 517.83
- internet_autre 1 998.77 15929 518.59
- appareils_1_2 1 1117.91 16048 519.30
- cat_reseau_6_sup6 1 1228.32 16159 519.95
- ecran_travail_bcp 1 1497.76 16428 521.52
- ecran_travail_peu 1 1750.53 16681 522.97
Step: AIC=513.1
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + abo_2 + abo_3_sup +
homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu +
internet_autre + jour_2
Df Sum of Sq RSS AIC
- jour_2 1 188.89 15223 512.29
- abo_3_sup 1 240.83 15275 512.61
<none> 15034 513.10
- cat_cadres 1 348.74 15383 513.28
- abo_2 1 388.22 15423 513.52
- homme 1 419.97 15454 513.72
- cat_reseau_0_2 1 453.04 15488 513.92
- tel_sup_25 1 489.35 15524 514.14
- vie_sociale 1 549.55 15584 514.51
- abo_0 1 872.97 15908 516.46
- pas_ville 1 886.23 15921 516.54
- internet_autre 1 937.61 15972 516.85
- appareils_1_2 1 1089.59 16124 517.75
- cat_reseau_6_sup6 1 1160.41 16195 518.16
- ecran_travail_bcp 1 1396.10 16431 519.54
- ecran_travail_peu 1 1759.02 16794 521.61
Step: AIC=512.29
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + abo_2 + abo_3_sup +
homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu +
internet_autre
Df Sum of Sq RSS AIC
- abo_3_sup 1 260.50 15484 511.90
- cat_cadres 1 295.09 15518 512.11
<none> 15223 512.29
- abo_2 1 449.54 15673 513.05
- tel_sup_25 1 495.44 15719 513.33
- homme 1 524.70 15748 513.51
- vie_sociale 1 536.65 15760 513.58
- cat_reseau_0_2 1 561.94 15785 513.73
- internet_autre 1 868.19 16092 515.56
- abo_0 1 877.55 16101 515.61
- pas_ville 1 962.09 16186 516.11
- appareils_1_2 1 1064.19 16288 516.71
- cat_reseau_6_sup6 1 1233.28 16457 517.69
- ecran_travail_bcp 1 1358.26 16582 518.41
- ecran_travail_peu 1 1975.91 17199 521.88
Step: AIC=511.9
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + abo_2 + homme + pas_ville +
cat_cadres + ecran_travail_bcp + ecran_travail_peu + internet_autre
Df Sum of Sq RSS AIC
- abo_2 1 267.92 15752 511.53
<none> 15484 511.90
- cat_cadres 1 332.59 15816 511.92
- cat_reseau_0_2 1 483.16 15967 512.82
- homme 1 487.25 15971 512.84
- tel_sup_25 1 503.96 15988 512.94
- vie_sociale 1 531.70 16016 513.11
- abo_0 1 667.55 16152 513.91
- internet_autre 1 835.51 16319 514.89
- pas_ville 1 993.78 16478 515.81
- cat_reseau_6_sup6 1 1157.27 16641 516.75
- appareils_1_2 1 1182.63 16667 516.89
- ecran_travail_bcp 1 1526.08 17010 518.83
- ecran_travail_peu 1 1948.70 17433 521.16
Step: AIC=511.53
temps_ecran ~ vie_sociale + cat_reseau_0_2 + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + homme + pas_ville +
cat_cadres + ecran_travail_bcp + ecran_travail_peu + internet_autre
Df Sum of Sq RSS AIC
- cat_reseau_0_2 1 316.85 16069 511.42
<none> 15752 511.53
- tel_sup_25 1 373.87 16126 511.76
- cat_cadres 1 400.78 16153 511.92
- homme 1 528.26 16280 512.66
- abo_0 1 544.14 16296 512.76
- vie_sociale 1 760.65 16512 514.01
- internet_autre 1 916.88 16669 514.90
- pas_ville 1 920.86 16673 514.93
- appareils_1_2 1 1298.91 17051 517.06
- ecran_travail_bcp 1 1321.22 17073 517.18
- cat_reseau_6_sup6 1 1407.95 17160 517.66
- ecran_travail_peu 1 1756.20 17508 519.57
Step: AIC=511.42
temps_ecran ~ vie_sociale + cat_reseau_6_sup6 + tel_sup_25 +
appareils_1_2 + abo_0 + homme + pas_ville + cat_cadres +
ecran_travail_bcp + ecran_travail_peu + internet_autre
Df Sum of Sq RSS AIC
<none> 16069 511.42
- cat_cadres 1 346.34 16415 511.45
- tel_sup_25 1 380.31 16449 511.64
- abo_0 1 550.44 16619 512.62
- homme 1 596.09 16665 512.88
- pas_ville 1 756.68 16825 513.79
- vie_sociale 1 839.09 16908 514.26
- internet_autre 1 895.35 16964 514.57
- appareils_1_2 1 1198.48 17267 516.26
- ecran_travail_bcp 1 1450.38 17519 517.63
- cat_reseau_6_sup6 1 1862.34 17931 519.84
- ecran_travail_peu 1 2018.44 18087 520.66
Call:
lm(formula = temps_ecran ~ vie_sociale + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + homme + pas_ville +
cat_cadres + ecran_travail_bcp + ecran_travail_peu + internet_autre,
data = ecran)
Coefficients:
(Intercept) vie_sociale cat_reseau_6_sup61 tel_sup_251
36.4523 -0.2519 12.3794 -5.3294
appareils_1_21 abo_01 homme1 pas_ville1
11.8095 -6.8988 6.4134 6.3371
cat_cadres1 ecran_travail_bcp1 ecran_travail_peu1 internet_autre1
6.4451 -10.5870 -12.7396 7.2202
# Step: AIC=511.42
Step: AIC=511.42temps_ecran ~ vie_sociale + cat_reseau_6_sup6 + tel_sup_25 + appareils_1_2 + abo_0 + homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu + internet_autre
Méthode double
#méthode dans les 2 sens
step(modele0, scope = list(upper=modele1),data=ecran,direction="both")
Start: AIC=526.5
temps_ecran ~ 1
Df Sum of Sq RSS AIC
+ ecran_travail_peu 1 1788.08 21952 521.06
+ cat_reseau_6_sup6 1 1287.78 22452 523.20
+ cat_reseau_0_2 1 1144.13 22596 523.81
+ homme 1 915.94 22824 524.76
+ jour_2 1 879.10 22861 524.92
+ loisir 1 851.67 22889 525.03
+ cat_cadres 1 659.84 23080 525.82
+ cat_plus_50 1 545.29 23195 526.29
<none> 23740 526.50
+ cat_sans_activite 1 441.91 23298 526.71
+ abo_0 1 425.13 23315 526.78
+ cat_autres 1 396.66 23344 526.90
+ internet_autre 1 330.58 23410 527.17
+ cat_25_49 1 264.11 23476 527.44
+ tel_sup_25 1 243.20 23497 527.52
+ jour_3 1 226.35 23514 527.59
+ vie_sociale 1 222.86 23517 527.60
+ nuit_inf_7 1 133.38 23607 527.96
+ appareils_plus_4 1 36.83 23703 528.35
+ tel_inf_15 1 14.77 23726 528.44
+ abo_2 1 11.25 23729 528.45
+ abo_3_sup 1 4.30 23736 528.48
+ appareils_1_2 1 4.18 23736 528.48
+ ecran_travail_bcp 1 2.74 23738 528.49
+ pas_ville 1 1.20 23739 528.49
+ pas_internet 1 0.79 23739 528.50
Step: AIC=521.06
temps_ecran ~ ecran_travail_peu
Df Sum of Sq RSS AIC
+ homme 1 1139.01 20813 518.00
+ cat_reseau_6_sup6 1 945.82 21006 518.88
+ cat_reseau_0_2 1 747.34 21205 519.77
+ loisir 1 731.69 21220 519.84
+ jour_2 1 556.61 21396 520.62
+ ecran_travail_bcp 1 472.44 21480 520.99
+ vie_sociale 1 461.79 21490 521.04
<none> 21952 521.06
+ cat_25_49 1 316.88 21635 521.68
+ abo_0 1 307.56 21645 521.72
+ cat_sans_activite 1 240.24 21712 522.02
+ cat_plus_50 1 233.15 21719 522.05
+ internet_autre 1 210.96 21741 522.14
+ cat_cadres 1 151.78 21800 522.40
+ nuit_inf_7 1 125.19 21827 522.52
+ cat_autres 1 122.97 21829 522.53
+ abo_2 1 109.71 21842 522.58
+ tel_sup_25 1 91.66 21860 522.66
+ pas_ville 1 60.76 21891 522.80
+ jour_3 1 44.64 21908 522.87
+ appareils_1_2 1 32.05 21920 522.92
+ pas_internet 1 16.07 21936 522.99
+ appareils_plus_4 1 11.32 21941 523.01
+ tel_inf_15 1 2.92 21949 523.05
+ abo_3_sup 1 0.08 21952 523.06
- ecran_travail_peu 1 1788.08 23740 526.50
Step: AIC=518
temps_ecran ~ ecran_travail_peu + homme
Df Sum of Sq RSS AIC
+ cat_reseau_6_sup6 1 1021.05 19792 515.22
+ loisir 1 692.86 20120 516.78
+ cat_reseau_0_2 1 644.59 20168 517.01
+ vie_sociale 1 549.14 20264 517.46
<none> 20813 518.00
+ cat_sans_activite 1 398.57 20415 518.16
+ ecran_travail_bcp 1 393.38 20420 518.19
+ jour_2 1 393.19 20420 518.19
+ cat_plus_50 1 377.93 20435 518.26
+ cat_25_49 1 320.40 20493 518.53
+ abo_0 1 267.13 20546 518.77
+ internet_autre 1 250.67 20562 518.85
+ nuit_inf_7 1 173.35 20640 519.20
+ cat_autres 1 150.06 20663 519.31
+ pas_ville 1 138.11 20675 519.37
+ tel_inf_15 1 105.85 20707 519.51
+ abo_2 1 97.76 20715 519.55
+ appareils_1_2 1 36.45 20777 519.83
+ tel_sup_25 1 26.36 20787 519.88
+ appareils_plus_4 1 16.65 20796 519.92
+ jour_3 1 6.17 20807 519.97
+ pas_internet 1 4.49 20809 519.98
+ abo_3_sup 1 2.91 20810 519.99
+ cat_cadres 1 1.20 20812 519.99
- homme 1 1139.01 21952 521.06
- ecran_travail_peu 1 2011.15 22824 524.76
Step: AIC=515.22
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6
Df Sum of Sq RSS AIC
+ ecran_travail_bcp 1 500.53 19292 514.79
<none> 19792 515.22
+ internet_autre 1 402.56 19390 515.27
+ loisir 1 373.08 19419 515.41
+ vie_sociale 1 371.53 19421 515.42
+ cat_reseau_0_2 1 250.75 19541 516.01
+ jour_2 1 191.15 19601 516.30
+ cat_plus_50 1 188.68 19603 516.31
+ appareils_1_2 1 180.11 19612 516.35
+ pas_ville 1 151.31 19641 516.49
+ tel_sup_25 1 123.32 19669 516.63
+ tel_inf_15 1 122.30 19670 516.63
+ nuit_inf_7 1 118.01 19674 516.65
+ abo_0 1 112.54 19680 516.68
+ cat_cadres 1 102.20 19690 516.73
+ abo_3_sup 1 101.90 19690 516.73
+ cat_autres 1 89.74 19702 516.79
+ jour_3 1 71.74 19720 516.88
+ cat_sans_activite 1 69.89 19722 516.88
+ abo_2 1 56.34 19736 516.95
+ appareils_plus_4 1 32.90 19759 517.06
+ cat_25_49 1 29.19 19763 517.08
+ pas_internet 1 0.01 19792 517.22
- cat_reseau_6_sup6 1 1021.05 20813 518.00
- homme 1 1214.24 21006 518.88
- ecran_travail_peu 1 1642.63 21435 520.79
Step: AIC=514.79
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp
Df Sum of Sq RSS AIC
+ internet_autre 1 650.73 18641 513.53
+ vie_sociale 1 416.49 18875 514.71
<none> 19292 514.79
+ appareils_1_2 1 319.75 18972 515.20
- ecran_travail_bcp 1 500.53 19792 515.22
+ loisir 1 289.32 19002 515.35
+ tel_sup_25 1 219.49 19072 515.70
+ jour_2 1 213.87 19078 515.73
+ pas_ville 1 189.54 19102 515.85
+ cat_reseau_0_2 1 177.97 19114 515.91
+ abo_2 1 175.09 19116 515.92
+ nuit_inf_7 1 132.86 19159 516.13
+ abo_0 1 105.66 19186 516.27
+ tel_inf_15 1 103.24 19188 516.28
+ cat_plus_50 1 93.26 19198 516.33
+ cat_sans_activite 1 85.97 19206 516.36
+ cat_cadres 1 64.55 19227 516.47
+ cat_25_49 1 59.98 19232 516.49
+ abo_3_sup 1 35.89 19256 516.61
+ cat_autres 1 32.87 19259 516.62
+ appareils_plus_4 1 27.87 19264 516.65
+ jour_3 1 23.01 19269 516.67
+ pas_internet 1 13.76 19278 516.72
- homme 1 1126.85 20418 518.18
- cat_reseau_6_sup6 1 1128.20 20420 518.19
- ecran_travail_peu 1 2129.96 21422 522.74
Step: AIC=513.53
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre
Df Sum of Sq RSS AIC
+ vie_sociale 1 399.35 18242 513.47
<none> 18641 513.53
+ loisir 1 356.70 18284 513.69
+ appareils_1_2 1 312.00 18329 513.92
+ jour_2 1 282.17 18359 514.08
+ tel_sup_25 1 264.16 18377 514.17
+ pas_ville 1 256.80 18384 514.21
+ cat_reseau_0_2 1 174.27 18467 514.63
- internet_autre 1 650.73 19292 514.79
+ abo_2 1 125.97 18515 514.88
+ cat_cadres 1 110.88 18530 514.96
+ abo_0 1 105.68 18535 514.99
+ cat_plus_50 1 99.34 18542 515.02
+ cat_autres 1 93.82 18547 515.05
+ abo_3_sup 1 62.40 18578 515.21
+ tel_inf_15 1 57.32 18584 515.23
- ecran_travail_bcp 1 748.70 19390 515.27
+ pas_internet 1 46.94 18594 515.29
+ cat_sans_activite 1 31.00 18610 515.37
+ appareils_plus_4 1 27.80 18613 515.39
+ nuit_inf_7 1 25.83 18615 515.40
+ cat_25_49 1 11.73 18629 515.47
+ jour_3 1 4.38 18636 515.50
- homme 1 1181.21 19822 517.36
- cat_reseau_6_sup6 1 1366.47 20007 518.25
- ecran_travail_peu 1 2124.03 20765 521.78
Step: AIC=513.47
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre + vie_sociale
Df Sum of Sq RSS AIC
<none> 18242 513.47
- vie_sociale 1 399.35 18641 513.53
+ appareils_1_2 1 342.00 17900 513.67
+ tel_sup_25 1 296.33 17945 513.91
+ pas_ville 1 267.20 17974 514.07
+ jour_2 1 267.04 17974 514.07
+ cat_plus_50 1 258.27 17983 514.12
+ abo_0 1 250.90 17991 514.15
- internet_autre 1 633.59 18875 514.71
+ cat_reseau_0_2 1 133.87 18108 514.77
+ cat_cadres 1 131.15 18110 514.78
+ loisir 1 128.27 18113 514.80
+ cat_autres 1 100.27 18141 514.95
+ abo_3_sup 1 75.30 18166 515.08
+ tel_inf_15 1 62.36 18179 515.14
+ pas_internet 1 58.22 18183 515.17
+ abo_2 1 44.64 18197 515.24
+ appareils_plus_4 1 33.69 18208 515.29
+ cat_25_49 1 10.91 18231 515.41
+ nuit_inf_7 1 6.93 18235 515.43
+ cat_sans_activite 1 3.03 18238 515.45
+ jour_3 1 0.16 18241 515.47
- ecran_travail_bcp 1 796.88 19038 515.53
- cat_reseau_6_sup6 1 1155.00 19396 517.30
- homme 1 1246.50 19488 517.75
- ecran_travail_peu 1 2388.87 20630 523.16
Call:
lm(formula = temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre + vie_sociale, data = ecran)
Coefficients:
(Intercept) ecran_travail_peu1 homme1 cat_reseau_6_sup61
38.5981 -11.9641 8.2840 8.5305
ecran_travail_bcp1 internet_autre1 vie_sociale
-7.4881 6.0100 -0.1663
#Step: AIC=513.47
temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 + ecran_travail_bcp + internet_autre + vie_sociale
# methode descendente
<- lm(temps_ecran ~ vie_sociale + cat_reseau_6_sup6 +
modele_d + appareils_1_2 + abo_0 + homme + pas_ville +
tel_sup_25 + ecran_travail_bcp + ecran_travail_peu + internet_autre, data = ecran)
cat_cadres
summary(modele_d)
Call:
lm(formula = temps_ecran ~ vie_sociale + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + homme + pas_ville +
cat_cadres + ecran_travail_bcp + ecran_travail_peu + internet_autre,
data = ecran)
Residuals:
Min 1Q Median 3Q Max
-23.197 -10.084 -0.957 7.728 34.387
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 36.4523 4.1527 8.778 1.82e-13 ***
vie_sociale -0.2519 0.1210 -2.082 0.04043 *
cat_reseau_6_sup61 12.3794 3.9914 3.102 0.00263 **
tel_sup_251 -5.3294 3.8024 -1.402 0.16477
appareils_1_21 11.8095 4.7464 2.488 0.01484 *
abo_01 -6.8988 4.0914 -1.686 0.09552 .
homme1 6.4134 3.6550 1.755 0.08300 .
pas_ville1 6.3371 3.2054 1.977 0.05136 .
cat_cadres1 6.4451 4.8187 1.338 0.18471
ecran_travail_bcp1 -10.5870 3.8680 -2.737 0.00758 **
ecran_travail_peu1 -12.7396 3.9455 -3.229 0.00178 **
internet_autre1 7.2202 3.3574 2.151 0.03442 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 13.91 on 83 degrees of freedom
Multiple R-squared: 0.3231, Adjusted R-squared: 0.2334
F-statistic: 3.602 on 11 and 83 DF, p-value: 0.000352
# methode ascendante
<-lm(temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 + ecran_travail_bcp + internet_autre + vie_sociale, data = ecran)
modele_a summary(modele_a)
Call:
lm(formula = temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre + vie_sociale, data = ecran)
Residuals:
Min 1Q Median 3Q Max
-26.929 -11.771 -1.455 7.873 38.187
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 38.5981 3.5173 10.974 < 2e-16 ***
ecran_travail_peu1 -11.9641 3.5243 -3.395 0.00103 **
homme1 8.2840 3.3782 2.452 0.01617 *
cat_reseau_6_sup61 8.5305 3.6139 2.360 0.02046 *
ecran_travail_bcp1 -7.4881 3.8191 -1.961 0.05308 .
internet_autre1 6.0100 3.4377 1.748 0.08390 .
vie_sociale -0.1663 0.1198 -1.388 0.16864
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 14.4 on 88 degrees of freedom
Multiple R-squared: 0.2316, Adjusted R-squared: 0.1792
F-statistic: 4.421 on 6 and 88 DF, p-value: 0.0005937
# méthode double
<- lm(temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 + ecran_travail_bcp + internet_autre + vie_sociale, data = ecran)
modele_double summary(modele_double)
Call:
lm(formula = temps_ecran ~ ecran_travail_peu + homme + cat_reseau_6_sup6 +
ecran_travail_bcp + internet_autre + vie_sociale, data = ecran)
Residuals:
Min 1Q Median 3Q Max
-26.929 -11.771 -1.455 7.873 38.187
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 38.5981 3.5173 10.974 < 2e-16 ***
ecran_travail_peu1 -11.9641 3.5243 -3.395 0.00103 **
homme1 8.2840 3.3782 2.452 0.01617 *
cat_reseau_6_sup61 8.5305 3.6139 2.360 0.02046 *
ecran_travail_bcp1 -7.4881 3.8191 -1.961 0.05308 .
internet_autre1 6.0100 3.4377 1.748 0.08390 .
vie_sociale -0.1663 0.1198 -1.388 0.16864
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 14.4 on 88 degrees of freedom
Multiple R-squared: 0.2316, Adjusted R-squared: 0.1792
F-statistic: 4.421 on 6 and 88 DF, p-value: 0.0005937
Modele_d - Tests
<-residuals(modele_d)
residus3
ks.test(residus3, "pnorm", mean = mean(residus3), sd = sd(residus3))
Exact one-sample Kolmogorov-Smirnov test
data: residus3
D = 0.055149, p-value = 0.9193
alternative hypothesis: two-sided
reset(modele_d)
RESET test
data: modele_d
RESET = 0.71814, df1 = 2, df2 = 81, p-value = 0.4907
bptest(modele_d)
studentized Breusch-Pagan test
data: modele_d
BP = 10.579, df = 11, p-value = 0.4792
vif(modele_d)
vie_sociale cat_reseau_6_sup6 tel_sup_25 appareils_1_2
1.144620 1.391108 1.135186 1.469916
abo_0 homme pas_ville cat_cadres
1.206856 1.271109 1.259208 1.674071
ecran_travail_bcp ecran_travail_peu internet_autre
1.423566 1.706333 1.099522
plot(cooks.distance(modele_d), type = "h", main = "Distance de cook")
Possible endogénéité de certaines variables explicatives
load(here("data", "ecran_avec_instru_sansref.rda"))
<- ecran_avec_instru_sansref ecran_i
à partir base de données avec les instruments, nous allons choisir les variables que conforment le modèle retenue ultérieurement, le modele_d
<- lm(temps_ecran ~ vie_sociale + cat_reseau_6_sup6 +
modele_di + appareils_1_2 + abo_0 + homme + pas_ville +
tel_sup_25 + ecran_travail_bcp + ecran_travail_peu + internet_autre,
cat_cadres data = ecran_i)
summary(modele_di)
Call:
lm(formula = temps_ecran ~ vie_sociale + cat_reseau_6_sup6 +
tel_sup_25 + appareils_1_2 + abo_0 + homme + pas_ville +
cat_cadres + ecran_travail_bcp + ecran_travail_peu + internet_autre,
data = ecran_i)
Residuals:
Min 1Q Median 3Q Max
-23.197 -10.084 -0.957 7.728 34.387
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 36.4523 4.1527 8.778 1.82e-13 ***
vie_sociale -0.2519 0.1210 -2.082 0.04043 *
cat_reseau_6_sup6 12.3794 3.9914 3.102 0.00263 **
tel_sup_25 -5.3294 3.8024 -1.402 0.16477
appareils_1_2 11.8095 4.7464 2.488 0.01484 *
abo_0 -6.8988 4.0914 -1.686 0.09552 .
homme 6.4134 3.6550 1.755 0.08300 .
pas_ville 6.3371 3.2054 1.977 0.05136 .
cat_cadres 6.4451 4.8187 1.338 0.18471
ecran_travail_bcp -10.5870 3.8680 -2.737 0.00758 **
ecran_travail_peu -12.7396 3.9455 -3.229 0.00178 **
internet_autre 7.2202 3.3574 2.151 0.03442 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 13.91 on 83 degrees of freedom
Multiple R-squared: 0.3231, Adjusted R-squared: 0.2334
F-statistic: 3.602 on 11 and 83 DF, p-value: 0.000352
variables endogènes = + tel_sup_25 + appareils_1_2 + abo_0 + internet_autre + vie_sociale
variables exogènes = cat_reseau_6_sup6 + homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu
instruments =stress_toujours + stress_bcp + tel_pro_non + cat_inf_20000 + cat_20_40000 + nb_personnes + fibre_non
# ivreg
<- ivreg(temps_ecran ~ vie_sociale + tel_sup_25 + appareils_1_2 + abo_0 + internet_autre + cat_reseau_6_sup6 + homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu | cat_reseau_6_sup6 + homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu + tel_pro_non + cat_inf_20000 + cat_20_40000 + nb_personnes + fibre_non + stress_toujours + stress_bcp, data=ecran_i)
reg_DMC
summary(reg_DMC, diagnostics = TRUE)
Call:
ivreg(formula = temps_ecran ~ vie_sociale + tel_sup_25 + appareils_1_2 +
abo_0 + internet_autre + cat_reseau_6_sup6 + homme + pas_ville +
cat_cadres + ecran_travail_bcp + ecran_travail_peu | cat_reseau_6_sup6 +
homme + pas_ville + cat_cadres + ecran_travail_bcp + ecran_travail_peu +
tel_pro_non + cat_inf_20000 + cat_20_40000 + nb_personnes +
fibre_non + stress_toujours + stress_bcp, data = ecran_i)
Residuals:
Min 1Q Median 3Q Max
-46.2686 -12.6582 -0.4241 11.7027 45.1387
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 42.2713 12.2165 3.460 0.000855 ***
vie_sociale -0.3865 0.6304 -0.613 0.541446
tel_sup_25 -17.0728 21.7994 -0.783 0.435751
appareils_1_2 2.7568 25.5274 0.108 0.914262
abo_0 -33.7151 27.1138 -1.243 0.217196
internet_autre 25.8429 11.3253 2.282 0.025057 *
cat_reseau_6_sup6 11.3063 10.3542 1.092 0.278015
homme 3.5460 6.1779 0.574 0.567533
pas_ville 5.5357 8.4065 0.659 0.512034
cat_cadres 9.8941 9.8937 1.000 0.320198
ecran_travail_bcp -14.8904 9.0734 -1.641 0.104563
ecran_travail_peu -7.9819 8.4362 -0.946 0.346820
Diagnostic tests:
df1 df2 statistic p-value
Weak instruments (vie_sociale) 7 81 1.495 0.180661
Weak instruments (tel_sup_25) 7 81 1.034 0.413900
Weak instruments (appareils_1_2) 7 81 1.303 0.259589
Weak instruments (abo_0) 7 81 0.811 0.580768
Weak instruments (internet_autre) 7 81 4.839 0.000136 ***
Wu-Hausman 5 78 1.814 0.119685
Sargan 2 NA 2.208 0.331536
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 20.61 on 83 degrees of freedom
Multiple R-Squared: -0.4848, Adjusted R-squared: -0.6816
Wald test: 1.529 on 11 and 83 DF, p-value: 0.1367