Un des nombreux intérêts de R est qu’il donne accès à de nombreuses fonctions pour travailler avec nos données, en plus des opérateurs de base (+, -, *, /, ^). Les résultats des fonctions sont très variables, mais leur fonctionnement est toujours le même.
Une fonction suit toujours le même principe:
c()
.Il y a plusieurs fonctions de base que vous devriez connaître par coeur. Pour les démonstrations suivantes, nous utiliserons la fonction c()
pour créer un vecteur 1 v
contenant les valeurs de 1 à 6.
## [1] 1 2 3 4 5 6
Les fonctions suivantes retournent une seule valeur.
## [1] 1
## [1] 6
## [1] 3.5
## [1] 3.5
## [1] 3.5
## [1] 1.870829
Les fonctions suivantes retournent un vecteur de valeurs.
## [1] 1 6
## [1] 0.5403023 -0.4161468 -0.9899925 -0.6536436 0.2836622 0.9601703
## [1] 0.0000000 0.6931472 1.0986123 1.3862944 1.6094379 1.7917595
Finalement, les fonctions suivantes sont utilisées pour l’action qu’elles accomplissent. Elles retournent aussi une valeur qui contient beaucoup d’information et que vous serez souvent appelés à utiliser pour des traitements de données un peu plus complexes.
La plupart des fonctions de R utilisent des paramètres. Un paramètre est simplement une valeur que l’on fournit à une fonction pour contrôler certains aspects de son fonctionnement. Pour connaître les paramètres qu’il est possible de modifier pour une fonction, il faut aller consulter l’aide. Il existe deux moyens rapides pour accéder à l’aide d’une fonction. Par exemple, pour accéder à l’aide de la fonction mean()
, on peut taper ces deux fonctions dans la console de RStudio 2 (fenêtre de commande en bas à gauche):
help(mean)
?mean
Une fois la page d’aide ouverte, vous trouverez quelque chose de semblable à ce qui suit:
mean(x, trim = 0, na.rm = FALSE, ...)
On peut y voir qu’il y a trois essentiels paramètres associés à cette fonction.
x
est un vecteur de valeurs (généralement numériques)trim = 0
une fraction entre 0 et 0.5 d’observations à supprimer au début et à la fin du vecteur x
avant le calcul de la moyenne.na.rm = FALSE
une valeur logic
permettant de conserver (na.rm = FALSE
) ou supprimer (na.rm = TRUE
) les valeurs manquantes avant le calcul de la moyenne. Vous utiliserez très souvent ce paramètre!Il existe deux types de paramètres:
Par exemple, dans la fonction mean()
, x
est un paramètre obligatoire et na.rm = FALSE
est un paramètre optionnel.
Dans l’exemple suivant, on crée un vecteur v
contenant une valeur manquante à la position 3.
## [1] NA
Comme on le constate, R n’est pas capable de calculer spontanément la moyenne, car il y a une valeur manquante. Basé sur notre lecture de l’aide, on peut modifier la valeur du paramètre na.rm
pour indiquer à la fonction mean()
de supprimer les valeurs manquantes avant le calcul.
## [1] 2
Le calcul revient donc à faire l’opération suivante:
## [1] 2
L’ordre des paramètres passés à une fonction R est important. Il existe deux façons de spécifier les paramètres d’une fonction.
Si on revient à la fonction mean()
, l’ordre des paramètres est x
, trim
et na.rm
.
L’appel de la fonction en utilisant les paramètres nommés veut simplement dire que nous sommes spécifiques sur les noms des paramètres utilisés. Dans ce cas, l’ordre des paramètres n’a pas d’importance. Dans l’exemple suivant, tous les appels de la fonction mean()
sont équivalents. Notez qu’il est quand même recommandé de suivre l’ordre des paramètres présenté dans l’aide par souci de clarté du code.
v <- c(1, 2, 3)
mean(x = v, trim = 0, na.rm = FALSE)
mean(x = v, na.rm = FALSE, trim = 0)
mean(na.rm = FALSE, x = v, trim = 0)
mean(na.rm = FALSE, trim = 0, x = v)
Avec la méthode des paramètres non nommés, il est possible d’omettre le nom des paramètres. Par exemple:
Dans ce cas, il est obligatoire que l’ordre des paramètres suive celle de la signature de la fonction qui est spécifiée dans l’aide (i.e. mean(x, trim = 0, na.rm = FALSE)
).
Info! Bien que l’appel d’une fonction avec des paramètres non nommés soit techniquement valide, il est recommandé d’utiliser des paramètres nommés, car cela rend le code plus clair et plus explicite.
Le matériel pédagogique utilisé dans cette capsule est disponible pour le téléchargement sous deux formats différents:
Pour télécharger le fichier localement sur votre ordinateur, tablette ou téléphone portable, il suffit de cliquer sur le lien désiré avec le bouton droit de votre souris et choisir “sauvegarder sous…”.