dplyr: Teilmenge von Zeilen basierend auf der Anzahl einer Spalte

Brigadegeneral

Ich möchte Zeilen eines Datenrahmens basierend auf der Anzahl der Beobachtungen in einer bestimmten Spalte so unterteilen, dass ich nur Zeilen erhalte, bei denen es n + Beobachtungen gibt. Ich möchte dies mit Tidyverse-Funktionen tun, nicht mit Basis-R-Funktionen.

Beispiel: Behalten Sie aus den planesDaten des nycflights13Pakets alle Zeilen bei, planes$manufacturerin denen mindestens 10 Beobachtungen vorhanden sind. Die Teilmengendaten sollten nur die folgenden Hersteller haben:

[1] "AIRBUS"                        "AIRBUS INDUSTRIE"              "BOEING"                       
[4] "BOMBARDIER INC"                "EMBRAER"                       "MCDONNELL DOUGLAS"            
[7] "MCDONNELL DOUGLAS AIRCRAFT CO" "MCDONNELL DOUGLAS CORPORATION"

Hinweis: Dieser Beitrag geht nicht auf diese Frage ein.

Andy Brown

Du kannst das:

library(dplyr)

df <- planes %>%
  dplyr::group_by(manufacturer) %>%
  dplyr::filter(n() > 10)

Zusammenfassung der Ausgabe

df %>% count(manufacturer)

# A tibble: 8 × 2
# Groups:   manufacturer [8]
  manufacturer                      n
  <chr>                         <int>
1 AIRBUS                          336
2 AIRBUS INDUSTRIE                400
3 BOEING                         1630
4 BOMBARDIER INC                  368
5 EMBRAER                         299
6 MCDONNELL DOUGLAS               120
7 MCDONNELL DOUGLAS AIRCRAFT CO   103
8 MCDONNELL DOUGLAS CORPORATION    14

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

Pandas: Auswahl von Zeilen basierend auf der Anzahl der Werte einer bestimmten Spalte

Wiederholen von Zeilen basierend auf der Anzahl in einer anderen Spalte - SQL

pandas dataframe: Aggregieren einer Teilmenge von Zeilen basierend auf dem Wert einer Spalte

R- Zusammenführen der variablen Anzahl von Zeilen in mehreren Spalten basierend auf nicht leeren Zeilen in einer anderen Spalte

pandas python Aktualisiert die Teilmenge von Spalte A basierend auf der Teilmenge einer oder mehrerer anderer Spalten

Teilmenge n Anzahl von Zeilen aus einem Datenrahmen, basierend auf einer kategorialen Variablen, in R.

Löschen Sie Zeilen mit Duplikaten basierend auf einer Spalte, die von der Anzahl der NAs in verschiedenen Spalten abhängt

Wie erstellen Sie eine Spalte, die basierend auf einer Teilmenge von Zeilen inkrementiert wird?

Auffüllen einer Spalte in einer Tabelle basierend auf der Anzahl der Zeilen in einer anderen Tabelle

Übergabe einer Teilmenge von Objekten an die Pipeline, basierend auf der Anzahl der Eigenschaften?

Teilmenge aller Zeilen basierend auf dem ersten Wert der Spalte

Hinzufügen einer leeren Anzahl von Zeilen in der Rasteransicht basierend auf der Anzahl der Rasterzeilen

Auswählen von Spalten aus einer Teilmenge basierend auf dem Maximum einer anderen Spalte in der Teilmenge in MySQL

Bedingtes Zählen einer bestimmten Anzahl von Elementen in einer Spalte basierend auf anderen Spalten und Zeilen

Kombinieren von Zeilen basierend auf einer Spalte

Fügen Sie einen Spaltenwert basierend auf der Auswahl einer Teilmenge von Zeilen hinzu

Teilen Sie eine lange Spalte basierend auf der festen Anzahl von Zeilen in SQL in mehrere Spalten auf

Löschen einer Teilmenge von Zeilen basierend auf anderen Variablen

Python DataFrame: Zuweisen von Werten zur Spalte basierend auf der Anzahl der vorhandenen Zeilen?

Neuordnung eines Faktors in r basierend auf einer Teilmenge der Zeilen

Teilmenge einer Zeile basierend auf der Spalte mit ähnlichem Namen

SQL Server Summieren Sie eine bestimmte Anzahl von Zeilen basierend auf einer anderen Spalte

Zählen Sie die Anzahl der Zeilen basierend auf einem Muster in einer Spalte

Pandas Dataframe - Zeichnet die Anzahl der Zeilen basierend auf der kumulierten Summe in einer Spalte mit einer Bedingung auf

Pandas-Datenrahmen gruppieren nach einer Spalte und aktualisieren basierend auf der Anzahl die Zeilen einer anderen Spalte einzeln

Zusammenführen von Zeilen in einer Spalte basierend auf Pandas der zweiten Spalte

Ändern Sie die Tabellenbreite basierend auf der Anzahl der Zeilen in einer anderen Tabelle mithilfe von Javascript

Teilmenge basierend auf mehreren Variablen in einer Spalte

Verwenden von dplyr mutuate (oder eines anderen Pakets) zum Erstellen einer neuen Spalte basierend auf der Anzahl bestimmter Werte in jeder Zeile

TOP Liste

  1. 1

    So legen Sie mit dem Interface Builder unterschiedliche führende Speicherplätze für unterschiedliche Geräte fest

  2. 2

    Wie konvertiere ich einen Vektor von Bytes (u8) in eine Zeichenfolge?

  3. 3

    Wie kann ich in SCSS mehrere Klassen zu einer einzigen kombinieren?

  4. 4

    Eclipse Oxygen - Projekte verschwinden

  5. 5

    Wie konvertiert man einen Datenrahmen im langen Format in eine Liste mit einem geeigneten Format?

  6. 6

    Wie kann ich den Kaskadenmodus global einstellen?

  7. 7

    Wie erstelle ich einen neuen übergeordneten Knoten außerhalb der .ref (/ path) in der Firebase-Echtzeitdatenbank mithilfe von Cloud-Funktionen (Typescript)?

  8. 8

    So erhalten Sie eine gleichmäßige Höhe für alle Eingabefelder

  9. 9

    Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

  10. 10

    Speichern Sie ein MPAndroidChart-Diagramm in einem Bild, ohne es in einer Aktivität anzuzeigen

  11. 11

    Gruppieren Sie Datenrahmenspalten nach ihrem Datum (die Spaltentitel enthalten) und fassen Sie die Instanzen von Einsen und Nullen in R . zusammen

  12. 12

    ElasticSearch BulkShardRequest ist aufgrund von org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor fehlgeschlagen

  13. 13

    Tic Tac Toe-Spiel im React-Reset-Button funktioniert nicht

  14. 14

    Tomcat - Leiten Sie den alten Kontextstamm zum neuen Kontextstamm um

  15. 15

    Wie wählt man Unterschiede mit drei Tabellen aus?

  16. 16

    Ärgerliches Problem mit yaml, das ich nicht lösen kann

  17. 17

    Wie kann ich meine Tabelle abfragen, um sie in mySQL nach 2 Feldern zu gruppieren?

  18. 18

    So berechnen Sie die Verfügbarkeit von Anwendungen (SLA)

  19. 19

    Fügen Sie eine weitere Schaltfläche zu gwt Suggest Box hinzu

  20. 20

    Modbus Python Schneider PM5300

  21. 21

    Wie kann eine gleichmäßige Lastverteilung in ElasticSearch mit Indizes mit unterschiedlicher Anzahl von Shards erreicht werden?

heißlabel

Archiv