Supprimer les lignes en double avec une certaine valeur dans une colonne spécifique

Vicky Publié le Dev

Vicky

J'ai un bloc de données et je veux supprimer les lignes qui sont dupliquées dans toutes les colonnes sauf une colonne et choisir de conserver celles qui ne sont pas certaines valeurs.

Dans l'exemple ci-dessus, la 3e ligne et la 4e ligne sont dupliquées pour toutes les colonnes à l'exception de col3, donc je veux garder une seule ligne. L'étape compliquée est que je veux garder la 4ème ligne au lieu de la 3ème car la 3ème ligne de col3 est "exclue". En général, je souhaite ne conserver que les lignes (qui ont été dupliquées) qui n'ont pas "exclu".

Ma trame de données réelle a beaucoup de lignes dupliquées et parmi ces 2 lignes qui sont dupliquées, l'une d'elles est "exclue" à coup sûr.

Ci-dessous est reproductible ex:

a <- c(1,2,3,3,7)
b <- c(4,5,6,6,8)
c <- c("red","green","excluded","orange","excluded")
d <- data.frame(a,b,c)

Merci beaucoup!

Mise à jour: ou, lors de la suppression des doublons, ne conserver que la deuxième observation (4e ligne).

SKyJim

dplyr avec une base R devrait fonctionner pour cela:

 library(dplyr) 
 a <- c(1,2,3,3,3,7)
 b <- c(4,5,6,6,6,8)
 c <- c("red","green","brown","excluded","orange","excluded")
 d <- data.frame(a,b,c)

 d <- filter(d, !duplicated(d[,1:2]) | c!="excluded")

Result: 
  a b        c
1 1 4      red
2 2 5    green
3 3 6    brown
4 3 6   orange
5 7 8 excluded

Le filtre éliminera tout ce qui devrait être exclu et non dupliqué. J'ai ajouté un exemple d'exclusion non unique à votre exemple («marron») à tester également.

Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.

En cas d'infraction, veuillez [email protected] Supprimer.

modifier le2021-01-23

laisse moi dire quelques mots

0commentaires

connexionAprès avoir participé à la revue

Article précédent:Une certaine confusion dans la création d'un tableau croisé dynamique

TOP liste

article

Supprimer les lignes en double avec une certaine valeur dans une colonne spécifique

Supprimer les lignes en double avec une certaine valeur dans une colonne spécifique

J'ai besoin de savoir si ces deux phrases sont les mêmes en programmation

Javascript indiquant "impossible de définir la propriété 'innerHTML' sur null"

Nextcloud avec Docker: impossible de créer ou d'écrire dans le répertoire de données

La taille de la forme n'est pas égale à la taille de la cellule du tableau et ajuste le texte à l'intérieur de la forme

Trouver l'intersection et l'union de deux rectangles

Comment changer la couleur de la police dans R?

Empêcher l'allocation de mémoire dans la génération de combinaison récursive

Référencement des assemblys de structure .net 4.7 dans la solution .net core 2

Compter combien de fois un nombre apparaît dans un tableau aléatoire

Pourquoi utiliser Asyncio ne réduit pas le temps d'exécution global en Python et n'exécute pas les fonctions simultanément?

Comment convertir une chaîne en tuple en utilisant `reads`?

java.lang.ClassNotFoundException: oracle.jdbc.driver.OracleDriver

comment afficher un bouton au-dessus d'un autre élément ?

Création d'un nouvel objet d'une classe avec un nouveau nom en cliquant sur un bouton dans java swing

comment supprimer "compte de connexion google" à des fins de développement - actions sur google

Restauration de la sauvegarde de la base de données SQL Server sur la version inférieure

Créer un graphique à barres avec une fréquence relative / à partir d'un objet de table dans R

Création d'un rappel python pour une fonction C à partir d'une DLL avec un tampon char.

java.lang.NoClassDefFoundError: org / springframework / data / repository / config / BootstrapMode

comment le contrôle de tableau javascript devrait-il être

impossible d'ouvrir un nouvel onglet dans react, ajoute localhost: 3000 sur le lien?