dplyr: Teilmenge von Zeilen basierend auf der Anzahl einer Spalte

Brigadeiro Gepostet am Dev

26

Brigadegeneral

Ich möchte Zeilen eines Datenrahmens basierend auf der Anzahl der Beobachtungen in einer bestimmten Spalte so unterteilen, dass ich nur Zeilen erhalte, bei denen es n + Beobachtungen gibt. Ich möchte dies mit Tidyverse-Funktionen tun, nicht mit Basis-R-Funktionen.

Beispiel: Behalten Sie aus den planesDaten des nycflights13Pakets alle Zeilen bei, planes$manufacturerin denen mindestens 10 Beobachtungen vorhanden sind. Die Teilmengendaten sollten nur die folgenden Hersteller haben:

[1] "AIRBUS"                        "AIRBUS INDUSTRIE"              "BOEING"                       
[4] "BOMBARDIER INC"                "EMBRAER"                       "MCDONNELL DOUGLAS"            
[7] "MCDONNELL DOUGLAS AIRCRAFT CO" "MCDONNELL DOUGLAS CORPORATION"

Hinweis: Dieser Beitrag geht nicht auf diese Frage ein.

Andy Brown

Du kannst das:

library(dplyr)

df <- planes %>%
  dplyr::group_by(manufacturer) %>%
  dplyr::filter(n() > 10)

Zusammenfassung der Ausgabe

df %>% count(manufacturer)

# A tibble: 8 × 2
# Groups:   manufacturer [8]
  manufacturer                      n
  <chr>                         <int>
1 AIRBUS                          336
2 AIRBUS INDUSTRIE                400
3 BOEING                         1630
4 BOMBARDIER INC                  368
5 EMBRAER                         299
6 MCDONNELL DOUGLAS               120
7 MCDONNELL DOUGLAS AIRCRAFT CO   103
8 MCDONNELL DOUGLAS CORPORATION    14

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am2021-09-7

Lass mich ein paar Worte sagen

0Kommentare

LoginNach der Teilnahme an der Überprüfung

Vorheriger Beitrag:Wie ändere ich den Paginator?

Verwandte Artikel

Pandas: Auswahl von Zeilen basierend auf der Anzahl der Werte einer bestimmten Spalte

Wiederholen von Zeilen basierend auf der Anzahl in einer anderen Spalte - SQL

pandas dataframe: Aggregieren einer Teilmenge von Zeilen basierend auf dem Wert einer Spalte

R- Zusammenführen der variablen Anzahl von Zeilen in mehreren Spalten basierend auf nicht leeren Zeilen in einer anderen Spalte

pandas python Aktualisiert die Teilmenge von Spalte A basierend auf der Teilmenge einer oder mehrerer anderer Spalten

Teilmenge n Anzahl von Zeilen aus einem Datenrahmen, basierend auf einer kategorialen Variablen, in R.

Löschen Sie Zeilen mit Duplikaten basierend auf einer Spalte, die von der Anzahl der NAs in verschiedenen Spalten abhängt

Wie erstellen Sie eine Spalte, die basierend auf einer Teilmenge von Zeilen inkrementiert wird?

Auffüllen einer Spalte in einer Tabelle basierend auf der Anzahl der Zeilen in einer anderen Tabelle

Übergabe einer Teilmenge von Objekten an die Pipeline, basierend auf der Anzahl der Eigenschaften?

Teilmenge aller Zeilen basierend auf dem ersten Wert der Spalte

Hinzufügen einer leeren Anzahl von Zeilen in der Rasteransicht basierend auf der Anzahl der Rasterzeilen

Auswählen von Spalten aus einer Teilmenge basierend auf dem Maximum einer anderen Spalte in der Teilmenge in MySQL

Bedingtes Zählen einer bestimmten Anzahl von Elementen in einer Spalte basierend auf anderen Spalten und Zeilen

Kombinieren von Zeilen basierend auf einer Spalte

Fügen Sie einen Spaltenwert basierend auf der Auswahl einer Teilmenge von Zeilen hinzu

Teilen Sie eine lange Spalte basierend auf der festen Anzahl von Zeilen in SQL in mehrere Spalten auf

Löschen einer Teilmenge von Zeilen basierend auf anderen Variablen

Python DataFrame: Zuweisen von Werten zur Spalte basierend auf der Anzahl der vorhandenen Zeilen?

Neuordnung eines Faktors in r basierend auf einer Teilmenge der Zeilen

Teilmenge einer Zeile basierend auf der Spalte mit ähnlichem Namen

SQL Server Summieren Sie eine bestimmte Anzahl von Zeilen basierend auf einer anderen Spalte

Zählen Sie die Anzahl der Zeilen basierend auf einem Muster in einer Spalte

Pandas Dataframe - Zeichnet die Anzahl der Zeilen basierend auf der kumulierten Summe in einer Spalte mit einer Bedingung auf

Pandas-Datenrahmen gruppieren nach einer Spalte und aktualisieren basierend auf der Anzahl die Zeilen einer anderen Spalte einzeln

Zusammenführen von Zeilen in einer Spalte basierend auf Pandas der zweiten Spalte

Ändern Sie die Tabellenbreite basierend auf der Anzahl der Zeilen in einer anderen Tabelle mithilfe von Javascript

Teilmenge basierend auf mehreren Variablen in einer Spalte

Verwenden von dplyr mutuate (oder eines anderen Pakets) zum Erstellen einer neuen Spalte basierend auf der Anzahl bestimmter Werte in jeder Zeile

TOP Liste

Artikel

heißlabel

Archiv