La programmation R concerne l'application d'un programme statistique gratuit, contrôlé par son propre langage de programmation appelé R. (La version commerciale de R s'appelle S.)

Ce qui suit est une brève introduction à la programmation R.

Si vous avez besoin d'aide pour la programmation R, nos statisticiens seront ravis de vous aider. Utilisez simplement notre formulaire de contact pour une consultation gratuite et une offre non contraignante - ou appelez-nous .

Cet article traite des sujets suivants:

  • Comment apprendre la programmation R?
  • Les bases: Types de données dans R et affectations de valeurs
  • Les commandes les plus importantes de la programmation R
  • Entrée de commande depuis la console
  • scripts
  • les structures de contrôle
  • Où puis-je trouver de l'aide si je ne sais pas?

Comment apprendre à programmer en R?

La programmation dite R est un langage de programmation séparé défini par ses types de données, ses commandes et ses règles. Si vous êtes déjà familiarisé avec d'autres langages de programmation, apprendre R est très facile. Si vous souhaitez obtenir de l'aide pour traiter avec R, vous devez suivre un cours de statistique ou demander des cours de statistiques . Des cours et des manuels d'autoapprentissage gratuits sont disponibles sur Internet.

Les bases: Types de données dans R et affectations de valeurs

Dans R, il existe les mêmes types de données que dans les autres langages de programmation:

  • entier (nombres naturels)
  • numérique (nombres avec des décimales)
  • complexe
  • caractère (texte)
  • logique (en supposant seulement deux valeurs: VRAI et FAUX, c'est-à-dire vrai et faux)

Les affectations de valeurs sont effectuées au moyen d'une flèche, c'est-à-dire que <- 5 assigne la valeur 5 à la variable a. A ne doit pas être défini comme dans d'autres langages de programmation. Vous pouvez utiliser de nouvelles variables. Cependant, vous devez faire attention au type de données. Certaines opérations ou fonctions produisent des résultats différents, selon le type de données. Par exemple, 9 est inférieur à 80, c'est-à-dire lorsqu'on compare ces nombres 9 <89. Si les nombres sont compris comme des mots et triés alphabétiquement, alors 89 est avant 9. La séquence serait alors 89, 9, 90. Cela peut s'expliquer par type Conversions, par exemple avec des fonctions comme as.character (), qui convertit un nombre en un mot, ou as.numeric (), qui convertit au contraire le texte en nombres (autant que possible). Les données sont généralement compilées dans des listes et des tableaux pour les évaluations statistiques. Comme le vecteur c est une liste d'objets similaires (par exemple seulement des nombres), comme liste une liste d'objets différents. De même, les tableaux sont distingués entre la matrice (d'éléments similaires) et la trame de données (provenant d'éléments différents). Vous pouvez afficher le contenu d'une variable, d'une liste ou d'une table à tout moment en saisissant son nom. Par exemple, vous pouvez obtenir des éléments individuels d'un vecteur x avec x [1] pour la première entrée. Entrez l'entrée dans la deuxième ligne et la troisième colonne de la matrice m avec m [2,3]. La troisième colonne est donnée par m [, 3]. Si vous avez les noms des colonnes, vous pouvez également sélectionner une colonne avec m $ name.

Les commandes les plus importantes de la programmation R

Les commandes les plus importantes de R sont celles avec lesquelles les données sont lues, fusionnées et révisées.

Des commandes supplémentaires sont disponibles lorsque vous installez l'un des innombrables paquets (packages). Ceci est fait avec install.packages ("nom du paquet"). Pour utiliser le paquet, chargez-le avec la bibliothèque ("nom du paquet").

Entrée de commande depuis la console

Lorsque vous démarrez le programme R, la console s'ouvre en premier. Là vous pouvez entrer et exécuter des commandes. Vous pouvez rapidement répéter les commandes précédentes en faisant défiler vers le haut avec les touches fléchées. Mais ce n'est pas idéal. Normalement, vous ne démarrez que les scripts de la console (voir ci-dessous) ou vous pouvez afficher des résultats intermédiaires.

Scripts dans la programmation R

Il est tout à fait possible d'effectuer toutes vos évaluations sur la console. Il y a cependant de bonnes raisons de lister et sauvegarder vos commandes dans un fichier de script: Tout d'abord, cela supporte la documentation des étapes d'évaluation exécutées, et ensuite leur répétabilité.

Avant de créer un script, vous devez définir le répertoire de travail. Vous faites cela via le menu de R via File -> change dir. Entrez le répertoire de travail. Si le répertoire de travail est, par exemple, Mes Documents -> R, vous devez passer par C: / -> Utilisateurs -> Mes Documents -> R. R va maintenant enregistrer les scripts et les fichiers et rechercher les données à lire.

Utilisez Fichier -> Nouveau script pour créer un nouveau script ou ouvrir un script existant dans Fichier. Bien sûr, vous devez enregistrer votre script tôt ou tard, au plus tard avant de le lancer.

Dans le script, écrivez vos commandes dans l'ordre dans lequel elles doivent être exécutées. Très utiles sont aussi des commentaires, que vous pouvez écrire entre les commandes ou aussi derrière les commandes, marqués par ##. Ces commentaires sont alors ignorés par R et ne sont pas exécutés.

Si vous voulez exécuter un script program.R, enregistrez-le en cliquant sur l'icône Enregistrer et entrez la source ("Program.R") dans la console.
Image RSkript.jpg

Structures de contrôle pour la programmation R

Les structures de contrôle sont des commandes qui vous permettent de vérifier les conditions et de répéter les commandes. Par exemple, vous pouvez vous assurer qu'un fichier a été téléchargé. Vous avez exécuté la commande download.file  mais comment vous assurer que cela fonctionne? Vous pouvez vérifier l'existence du fichier avec file.exists ("fichier.txt") et, si nécessaire, répéter le téléchargement.
Comme dans la plupart des langages de programmation, vous disposez également des options suivantes pour la programmation R:
Pour la boucle: Si vous savez déjà à quelle fréquence vous voulez répéter quelque chose, utilisez une boucle for. Dans l'exemple, vous ne voudriez probablement pas lire le fichier à l'infini, si cela ne fonctionnait pas. Peut-être cela n'existe-t-il pas du tout? Si vous voulez répéter deux fois, écrivez pour (i dans 1: 2).
Si (condition) vérifie si une condition est vraie. Si file.exists ("file.txt") == FALSE, le téléchargement doit être répété. Vous pouvez également utiliser autre pour définir ce qui devrait se passer dans l'autre cas.
Repeat () répète indéfiniment les commandes dans le support rond. Vous pouvez laisser cette boucle sans fin avec une commande break, par exemple avec if (file.exists ("file.txt")) break.
While (condition) {} exécute les commandes dans les accolades tant que la condition entre parenthèses est remplie. Par exemple: while (! File.exists ("fichier.txt")) {download.file}. (Le point d'exclamation: refuse une instruction logique.)

Où puis-je trouver de l'aide si je ne sais pas?

Chaque commande R est décrite dans une aide détaillée, dans laquelle sont décrits tous les paramètres d'une fonction, ainsi que des exemples. Vous pouvez appeler cette aide en entrant un point d'interrogation dans la console avant les noms des commandes, par exemple "source ()". Pour plus d'aide, veuillez consulter la documentation ci-dessous ou nos conseils statistiques .