Formation SPSS

Les vecteurs dans R

aaaaaaaaaaaaaaaa

Détails: Écrit par Elie Chancelin; Catégorie parente: Logiciel R; Catégorie : Les vecteurs dans R

Lors de l'application d'une opération à deux vecteurs qui nécessitent qu'ils aient la même longueur, R recycle automatiquement, ou le répète, le plus court, jusqu'à ce qu'il soit suffisamment long pour correspondre le plus long. Voici un exemple:

> c (1,2,4) + c (6,0,9,20,22)
[1] 7 2 13 21 24

> c (1,2,4) + c (6,0,9,20,22)
[1] 7 2 13 21 24

Message d'avertissement: longueur d'objet plus longue
n'est pas un multiple de longueur d'objet plus courte dans: c (1, 2, 4) + c (6, 0, 9, 20, 22)
Le vecteur plus court a été recyclé, de sorte que l'opération a été prise comme suit:

> c (1,2,4,1,2) + c (6,0,9,20,22)

> c (1,2,4,1,2) + c (6,0,9,20,22)

Voici un exemple plus subtil:

> x
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6
> x+c(1,2)
[,1] [,2]
[1,] 2 6
[2,] 4 6
[3,] 4 8

> x
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 3 6
> x+c(1,2)
[,1] [,2]
[1,] 2 6
[2,] 4 6
[3,] 4 8

Encore une fois, gardez à l'esprit que les matrices sont en fait des vecteurs longs. Ici, x, en tant que matrice 3 par 2, est également un vecteur à six éléments, qui dans R est stocké en colonne par colonne. En d'autres termes, en termes de stockage, x est le même que c (1,2,3,4,5,6). Nous avons ajouté un vecteur à deux éléments à cet élément à six éléments, de sorte que notre vecteur ajouté devait être répété deux fois pour créer six éléments. En d'autres termes, nous procédions essentiellement à cela:

x + c (1,2,1,2,1,2)

x + c (1,2,1,2,1,2)

Non seulement cela, mais c (1,2,1,2,1,2) a également été changé d'un vecteur à une matrice ayant la même forme que x avant l'addition a eu lieu:
1 2
2 1
1 2
Ainsi, le résultat net était de calculer ce qui suit:

Détails: Écrit par Elie Chancelin; Catégorie parente: Logiciel R; Catégorie : Les vecteurs dans R

Dans cette section, nous discuterons de quelques faits divers liés à la fonction de concaténation, c (), qui sont souvent utiles.
Si les arguments que vous passez à c () sont de différents modes, ils seront réduits à un type qui est le dénominateur commun le plus bas, comme suit:

> c(5,2,"abc")
[1] "5" "2" "abc"
> c(5,2,list(a=1,b=4))
[[1]]
[1] 5
[[2]]
[1] 2
$a
[1] 1
$b
[1] 4

> c(5,2,"abc")
[1] "5" "2" "abc"
> c(5,2,list(a=1,b=4))
[[1]]
[1] 5
[[2]]
[1] 2
$a
[1] 1
$b
[1] 4

Dans le premier exemple, nous combinons les modes entier et caractère, une combinaison que R choisit de réduire au dernier mode. Dans le deuxième exemple, R considère que le mode de liste doit avoir une priorité inférieure dans les expressions mixtes. Nous en discuterons plus loin à la section 4.3.
Vous ne voudrez probablement pas écrire de code qui fait de telles combinaisons, mais vous pouvez rencontrer un code dans lequel cela se produit, il est donc important de respecter l'effet.
Un autre point à garder à l'esprit est que c () a un effet d'aplatissement pour les vecteurs, comme dans cet exemple:

> c (5,2, c (1,5,6)) 
[1] 5,0 2,0 1,5 6,0

> c (5,2, c (1,5,6)) 
[1] 5,0 2,0 1,5 6,0

Ceux qui connaissent d'autres langues, comme Python, ont peut-être attendu le code précédent pour produire un objet à deux niveaux. Cela ne se produit pas avec les vecteurs R, même si vous pouvez avoir des listes à deux niveaux, comme vous le verrez au chapitre 4.
Dans le chapitre suivant, nous passons à un cas spécial très important de vecteurs, celui des matrices et des matrices.

Détails: Écrit par Elie Chancelin; Catégorie parente: Logiciel R; Catégorie : Les vecteurs dans R

Les éléments d'un vecteur peuvent éventuellement être nommés. Par exemple, disons que nous avons un vecteur à 50 éléments montrant la population de chaque état aux États-Unis. Nous pourrions nommer chaque élément en fonction de son nom d'état, comme «Montana» et «New Jersey». Cela pourrait entraîner des points de dénomination dans les parcelles, et ainsi de suite.
Nous pouvons assigner ou interroger des noms d'éléments vectoriels via la fonction names ():

> x <- c(1,2,4)
> names(x)
NULL
> names(x) <- c("a","b","ab")
> names(x)
[1] "a" "b" "ab"
> x
a b ab
1 2 4

> x <- c(1,2,4)
> names(x)
NULL
> names(x) <- c("a","b","ab")
> names(x)
[1] "a" "b" "ab"
> x
a b ab
1 2 4

Nous pouvons supprimer les noms d'un vecteur en assignant NULL:

> names(x) <- NULL
> x
[1] 1 2 4

> names(x) <- NULL
> x
[1] 1 2 4

Nous pouvons même référencer les éléments du vecteur par nom:

> x <- c(1,2,4)
> names(x) <- c("a","b","ab")
> x["b"]
b
2

> x <- c(1,2,4)
> names(x) <- c("a","b","ab")
> x["b"]
b
2

Détails: Écrit par Elie Chancelin; Catégorie parente: Logiciel R; Catégorie : Les vecteurs dans R

Supposons que nous souhaitons tester si deux vecteurs sont égaux. L'approche naïve, utilisant ==, ne fonctionnera pas.

> x <- 1: 3
> y <- c (1,3,4)
> x == y
[1] TRUE FALSE FALSE

> x <- 1: 3
> y <- c (1,3,4)
> x == y
[1] TRUE FALSE FALSE

Qu'est-il arrivé? Le point essentiel est que nous traitons de la vectorisation. Tout comme presque n'importe quoi dans R, == est une fonction.

> "==" (3,2) [1] FALSE
> i <- 2
> "==" (i, 2) [1] TRUE

> "==" (3,2) [1] FALSE
> i <- 2
> "==" (i, 2) [1] TRUE

En fait, == est une fonction vectorisée. L'expression x == y applique la fonction == () aux éléments de x et y. donnant un vecteur de valeurs booléennes.
Que peut-on faire à la place? Une option est de travailler avec la nature vectorisée de ==, en appliquant la fonction all ():

> x <- 1:3
> y <- c(1,3,4)
> x == y
[1] TRUE FALSE FALSE
> all(x == y)
[1] FALSE

> x <- 1:3
> y <- c(1,3,4)
> x == y
[1] TRUE FALSE FALSE
> all(x == y)
[1] FALSE

L'application de all() au résultat de == demande si tous les éléments de ce dernier sont vrais, ce qui est identique à savoir si x et y sont identiques.
Ou encore mieux, nous pouvons simplement utiliser la fonction identique, comme ceci:

> identical(x,y)
[1] FALSE

> identical(x,y)
[1] FALSE

Soyez prudent, bien que le mot identique signifie vraiment ce qu'il dit. Considérons cette petite session R:

> x <- 1:2
> y <- c(1,2)
> x
[1] 1 2
> y
[1] 1 2
> identical(x,y)
[1] FALSE
> typeof(x)
[1] "integer"
> typeof(y)
[1] "double"

> x <- 1:2
> y <- c(1,2)
> x
[1] 1 2
> y
[1] 1 2
> identical(x,y)
[1] FALSE
> typeof(x)
[1] "integer"
> typeof(y)
[1] "double"

Ainsi,: produit des nombres entiers tandis que c () produit des nombres à virgule flottante. Qui savait?

Vectorisé if-then-else: la fonction ifelse () dans R

Les vecteurs dans R

Recyclage dans la programmation R

Plus sur c ()

Noms d'éléments vectoriels dans la programmation R

Test de l'égalité vectorielle dans R

Enquête statistique

A qui nos services?