Le traitement des valeurs manquantes est une tâche importante dans la littérature standard d'exploration de données. Dans le langage de programmation R, les valeurs manquantes sont représentées par NA. Les NA ne sont pas des chaînes ou des valeurs numériques; ils sont considérés comme un indicateur des valeurs manquantes. Après avoir importé un ensemble de données dans la plateforme de programmation R, il est important de vérifier si, pour toute variable, des valeurs manquantes existent ou non; Pour vérifier cela, la commande is.na () est utilisée. S'il vous plaît voir l'exemple donné ici:
> x <-c (12,13,14,21,23,24, NA, 25, NA, 0, NA)
> is.na (x)
[1] FAUX FAUX FAUX FAUX FAUX FAUX FAUX FAUX FAUX FAUX FAUX
> mean (x, na.rm = TRUE)
[1] 16,5
> moyenne (x)
[1] NA
L'objet x est un vecteur numérique qui contient des valeurs NA, pour vérifier que is.na () peut être utilisé, à chaque fois qu'il est satisfait, le résultat sera TRUE. Si nous calculons quelque chose avec la présence de NA, nous finissons par obtenir une erreur ou aucun résultat. Soit nous pouvons remplacer l'ensemble de données en modifiant les valeurs NA, soit nous pouvons supprimer ces valeurs NA en effectuant n'importe quel calcul. Comme dans le script précédent, c'est na.rm = T qui est utilisé pour enlever les NA du calcul moyen de l'objet x.