Supprimer les doublons dans une colonne en fonction d'une autre colonne où il y a une hiérarchie

Omwrichmond

J'ai une trame de données comme celle-ci:

dat1 <- data.frame(Unit = c("a","a","b","c","c","c","d"), Habitat = c("choppy sands","sands","meadow","sands","meadow","choppy sands","choppy sands"), Litter = c(3.7,3.4,5.6,2.1,3.6,7.5,1.2))

>dat1
  Unit      Habitat Litter
1    a choppy sands    3.7
2    a        sands    3.4
3    b       meadow    5.6
4    c        sands    2.1
5    c       meadow    3.6
6    c choppy sands    7.5
7    d choppy sands    1.2

Je souhaite rechercher et supprimer les lignes en double en fonction de l'unité où la ligne unique à conserver pour chaque valeur d'unité dépend d'une hiérarchie de valeurs dans Habitat. S'il y a des lignes dupliquées basées sur l'Unité, une ligne où Habitat = "prairie" a la priorité, puis une ligne où Habitat = "sables agités", puis une ligne où Habitat = "sables". Ainsi, la trame de données résultante ressemblerait à ceci:

  Unit      Habitat Litter
1    a choppy sands    3.7
2    b       meadow    5.6
3    c       meadow    3.6
4    d choppy sands    1.2

Toute aide très appréciée.

Curt F.

En utilisant dplyret forcats(tous deux dans le tidyversesystème de packages), vous pouvez faire quelque chose comme ceci:

dat2 <- 
    dat1 %>%
    mutate(Habitat = fct_relevel(Habitat, c('meadow', 'choppy sands', 'sands'), after=0L)) %>%
    group_by(Unit) %>%
    filter(as.numeric(Habitat) == min(as.numeric(Habitat)))

Cela donne la sortie souhaitée. L'idée est de créer Habitatune variable de facteur et d'encoder votre hiérarchie dans les niveaux de cette variable. Ensuite, (dans chaque Unitgroupe), vous conservez les lignes qui ont la priorité la plus élevée Habitaten filtrant à l'aide de la as.numeric(Habitat) == min(as.numeric(Habitat))règle.

Cet article est collecté sur Internet, veuillez indiquer la source lors de la réimpression.

En cas d'infraction, veuillez [email protected] Supprimer.

modifier le2021-01-22

laisse moi dire quelques mots

0commentaires

connexionAprès avoir participé à la revue

Article précédent:Ajouter et pousser la balise de validation dans le travail GitLab CI / CD

TOP liste

article

Supprimer les doublons dans une colonne en fonction d'une autre colonne où il y a une hiérarchie

Supprimer les doublons dans une colonne en fonction d'une autre colonne où il y a une hiérarchie

J'ai besoin de savoir si ces deux phrases sont les mêmes en programmation

Javascript indiquant "impossible de définir la propriété 'innerHTML' sur null"

Nextcloud avec Docker: impossible de créer ou d'écrire dans le répertoire de données

La taille de la forme n'est pas égale à la taille de la cellule du tableau et ajuste le texte à l'intérieur de la forme

Trouver l'intersection et l'union de deux rectangles

Comment changer la couleur de la police dans R?

Empêcher l'allocation de mémoire dans la génération de combinaison récursive

Référencement des assemblys de structure .net 4.7 dans la solution .net core 2

Compter combien de fois un nombre apparaît dans un tableau aléatoire

Pourquoi utiliser Asyncio ne réduit pas le temps d'exécution global en Python et n'exécute pas les fonctions simultanément?

Comment convertir une chaîne en tuple en utilisant `reads`?

java.lang.ClassNotFoundException: oracle.jdbc.driver.OracleDriver

comment afficher un bouton au-dessus d'un autre élément ?

Création d'un nouvel objet d'une classe avec un nouveau nom en cliquant sur un bouton dans java swing

comment supprimer "compte de connexion google" à des fins de développement - actions sur google

Restauration de la sauvegarde de la base de données SQL Server sur la version inférieure

Créer un graphique à barres avec une fréquence relative / à partir d'un objet de table dans R

Création d'un rappel python pour une fonction C à partir d'une DLL avec un tampon char.

java.lang.NoClassDefFoundError: org / springframework / data / repository / config / BootstrapMode

comment le contrôle de tableau javascript devrait-il être

impossible d'ouvrir un nouvel onglet dans react, ajoute localhost: 3000 sur le lien?