Imprimer
Catégorie : Data mining

Pour supprimer les valeurs manquantes de l'ensemble de données, na.omit () peut être utilisé. Il supprime la ligne entière même si les données sont manquantes pour une seule variable. Il existe diverses méthodes d'imputation des valeurs manquantes:
• Imputation moyenne: les valeurs manquantes dans un vecteur de données sont remplacées par la valeur moyenne ou médiane de ce vecteur, à l'exclusion de l'AN
• Méthode de la moyenne locale: en prenant la moyenne locale pour la valeur manquante, en prenant en compte 3 ou 5 périodes moyenne mobile, c'est-à-dire pour une période de 3 la moyenne des données manquantes et la valeur postérieure peuvent décider de la valeur manquante
• Garder cela à part: Parfois, l'imputation n'est tout simplement pas possible, et il se peut que le client veuille séparer les valeurs manquantes pour comprendre séparément le comportement manquant.
• Basé sur un modèle: il existe des techniques d'imputation de valeurs manquantes basées sur un modèle telles que la méthode de prédiction de valeur manquante basée sur la régression
• Clustering: Similaire à la prédiction basée sur la régression à l'imputation de valeur manquante, le clustering k-means peut être utilisé pour imputer les valeurs manquantes de l'ensemble de données