Dans un contexte statistique, une matrice typique dans R a des lignes correspondant à des observations, par exemple sur différentes personnes et des colonnes correspondant à des variables telles que le poids et la tension artérielle. La matrice est alors une structure de données bidimensionnelle. Mais supposons que nous avons également des données prises à différents moments, un point de données par personne par variable par temps. Le temps devient alors le troisième dimentis, en plus des lignes et des colonnes. Dans R, ces ensembles de données sont appelés des tableaux.
Comme un exemple simple, considérez les élèves et les résultats des tests. Dites que chaque test se compose de deux parties, donc nous enregistrons deux scores pour un étudiant pour chaque test. Supposons maintenant que nous ayons deux tests, et pour garder l'exemple petit, supposons que nous avons seulement trois étudiants. Voici les données pour le premier test:
L'élève 1 a obtenu un score de 46 et 30 lors du premier test, l'étudiant 2 a marqué 21 et 25, et ainsi de suite. Voici les notes pour les mêmes étudiants sur le deuxième test:
Maintenant, mettons les deux tests dans une seule structure de données, que nous allons appeler des tests. Nous allons organiser deux "couches" - une couche par test - avec trois lignes et deux colonnes dans chaque couche. Nous allons stocker le premier test dans la première couche et le deuxième test dans la seconde.
Dans la couche 1, il y aura trois lignes pour les scores de trois élèves sur le premier test, avec deux colonnes par rangée pour les deux parties d'un test. Nous utilisons la fonction de matrice de R pour créer la structure de données:
Dans l'argument dim = c (3,2,2), nous spécifions deux couches (c'est la seconde-deuxième), chacune consistant en trois lignes et deux colonnes. Cela devient alors un attribut de la structure de données:
Chaque élément de test comporte maintenant trois indices, plutôt que deux, comme dans le cas matriciel. Le premier sous-chapitre correspond au premier élément du vecteur $ dim, le second indice correspondant au deuxième élément du vecteur, etc. Par exemple, le score sur la deuxième partie du test 1 pour l'étudiant 3 est récupéré comme suit:
La fonction d'impression de R pour les tableaux affiche la couche de données par couche:
Tout comme nous avons construit notre réseau tridimensionnel en combinant deux matrices, nous pouvons construire des tableaux à quatre dimensions en combinant deux ou plusieurs tableaux à trois dimensions, et ainsi de suite.
L'une des utilisations les plus fréquentes des tableaux consiste à calculer les tableaux. Voir la section 6.3 pour un exemple d'une table tridimensionnelle.