À la fin de cette capsule, vous serez en mesure de:
Veuillez noter qu’il est possible d’avoir plus d’une bonne réponse par question. Vous pouvez reprendre chaque exercice grâce aux boutons "Start Over" ou "Try Again" Le bouton "hint" est là pour être utilisé!
Écrivez une ligne de code qui calcule la somme de 2 et 2.
Compléter le code suivant pour calculer la moyenne du vecteur x
.
x <- c(1, 2, NA, 3)
La fonction seq()
permet de générer des valeurs séquentielles. Utilisez cette fonction pour créer un vecteur contenant les valeurs suivantes:
## [1] 1 3 5 7 9 11 13
Dans l'aide de R, on peut voir que la fonction mean()
a la structure suivante.
mean(x, trim = 0, na.rm = FALSE, ...)
La fonction rnorm()
permet de générer aléatoirement une séquence de nombres suivant une loi de distribution Normale. Dans l'aide de R, on peut voir que la fonction a la structure suivante.
rnorm(n, mean = 0, sd = 1)
Un des nombreux intérêts de R est qu’il donne accès à de nombreuses fonctions pour travailler avec nos données, en plus des opérateurs de base (+, -, *, /, ^). Les résultats des fonctions sont très variables, mais leur fonctionnement est toujours le même.
Une fonction suit toujours le même principe:
c()
.Il y a plusieurs fonctions de base que vous devriez connaître par coeur. Pour les démonstrations suivantes, nous utiliserons la fonction c()
pour créer un vecteur 1 v
contenant les valeurs de 1 à 6.
# La fonction c() veut dire "combine"
v <- c(1, 2, 3, 4, 5, 6)
v
## [1] 1 2 3 4 5 6
Les fonctions suivantes retournent une seule valeur.
min(v) # Valeur minimum du vecteur
## [1] 1
max(v) # Valeur maximum du vecteur
## [1] 6
mean(v) # Valeur moyenne du vecteur
## [1] 3.5
median(v) # Valeur médiane du vecteur
## [1] 3.5
var(v) # Variance du vecteur
## [1] 3.5
sd(v) # Écart-type du vecteur
## [1] 1.870829
Les fonctions suivantes retournent un vecteur de valeurs.
range(v) # Étendu des valeurs du vecteur
## [1] 1 6
cos(v) # Cosinus des valeurs du vecteur
## [1] 0.5403023 -0.4161468 -0.9899925 -0.6536436 0.2836622 0.9601703
log(v) # Le logarithme naturel (base e) du vecteur
## [1] 0.0000000 0.6931472 1.0986123 1.3862944 1.6094379 1.7917595
Finalement, les fonctions suivantes sont utilisées pour l’action qu’elles accomplissent. Elles retournent aussi une valeur qui contient beaucoup d’information et que vous serez souvent appelés à utiliser pour des traitements de données un peu plus complexes.
plot(v) # Graphique à partir des valeurs du vecteur
write.csv(v, file = "monvecteur.csv") # Sauvegarde les valeurs du vecteur
La plupart des fonctions de R utilisent des paramètres. Un paramètre est simplement une valeur que l’on fournit à une fonction pour contrôler certains aspects de son fonctionnement. Pour connaître les paramètres qu’il est possible de modifier pour une fonction, il faut aller consulter l’aide. Il existe deux moyens rapides pour accéder à l’aide d’une fonction. Par exemple, pour accéder à l’aide de la fonction mean()
, on peut taper ces deux fonctions dans la console de RStudio 2 (fenêtre de commande en bas à gauche):
help(mean)
?mean
Une fois la page d'aide ouverte, vous trouverez quelque chose de semblable à ce qui suit:
mean(x, trim = 0, na.rm = FALSE, ...)
On peut y voir qu'il y a trois essentiels paramètres associés à cette fonction.
x
est un vecteur de valeurs (généralement numériques)trim = 0
une fraction entre 0 et 0.5 d'observations à supprimer au début et à la fin du vecteur x
avant le calcul de la moyenne.na.rm = FALSE
une valeur logic
permettant de conserver (na.rm = FALSE
) ou supprimer (na.rm = TRUE
) les valeurs manquantes avant le calcul de la moyenne. Vous utiliserez très souvent ce paramètre!Il existe deux types de paramètres:
Par exemple, dans la fonction mean()
, x
est un paramètre obligatoire et na.rm = FALSE
est un paramètre optionnel.
Dans l'exemple suivant, on crée un vecteur v
contenant une valeur manquante à la position 3.
v <- c(1, 2, NA, 3)
mean(v)
## [1] NA
Comme on le constate, R n'est pas capable de calculer spontanément la moyenne, car il y a une valeur manquante. Basé sur notre lecture de l'aide, on peut modifier la valeur du paramètre na.rm
pour indiquer à la fonction mean()
de supprimer les valeurs manquantes avant le calcul.
v <- c(1, 2, NA, 3)
mean(v, na.rm = TRUE)
## [1] 2
Le calcul revient donc à faire l'opération suivante:
(1 + 2 + 3) / 3
## [1] 2
L'ordre des paramètres passés à une fonction R est important. Il existe deux façons de spécifier les paramètres d'une fonction.
Si on revient à la fonction mean()
, l'ordre des paramètres est x
, trim
et na.rm
.
mean(x, trim = 0, na.rm = FALSE)
L'appel de la fonction en utilisant les paramètres nommés veut simplement dire que nous sommes spécifiques sur les noms des paramètres utilisés. Dans ce cas, l'ordre des paramètres n'a pas d'importance. Dans l'exemple suivant, tous les appels de la fonction mean()
sont équivalents. Notez qu'il est quand même recommandé de suivre l'ordre des paramètres présenté dans l'aide par souci de clarté du code.
v <- c(1, 2, 3)
mean(x = v, trim = 0, na.rm = FALSE)
mean(x = v, na.rm = FALSE, trim = 0)
mean(na.rm = FALSE, x = v, trim = 0)
mean(na.rm = FALSE, trim = 0, x = v)
Avec la méthode des paramètres non nommés, il est possible d'omettre le nom des paramètres. Par exemple:
v <- c(1, 2, 3)
mean(v, 0, FALSE)
Dans ce cas, il est obligatoire que l'ordre des paramètres suive celle de la signature de la fonction qui est spécifiée dans l'aide (i.e. mean(x, trim = 0, na.rm = FALSE)
).
Info! Bien que l'appel d'une fonction avec des paramètres non nommés soit techniquement valide, il est recommandé d'utiliser des paramètres nommés, car cela rend le code plus clair et plus explicite.
Le matériel pédagogique utilisé dans cette capsule est disponible pour le téléchargement sous deux formats différents:
Pour télécharger le fichier localement sur votre ordinateur, tablette ou téléphone portable, il suffit de cliquer sur le lien désiré avec le bouton droit de votre souris et choisir “sauvegarder sous…”.