Erstellen einer Zufallsstichprobe aus einem Datenrahmen mit einer verschachtelten Struktur

Aurelie Calabrese

Diese Frage basiert auf dem hier gefundenen SO-Beitrag

Ich versuche, eine zufällige Stichprobe von Zeilen in einem Datenrahmen unter Verwendung einer Verschachtelungsbedingung zu extrahieren.

Verwenden des folgenden Dummy-Datensatzes (geändert von iris):

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          5.3         2.9          1.5         0.2  setosa
5          5.2         3.7          1.3         0.2  virginica
6          4.7         3.2          1.5         0.2  virginica
7          3.9         3.1          1.4         0.2  virginica
8          4.7         3.2          1.3         0.2  virginica
9          4.0         3.1          1.5         0.2  versicolor
10         5.0         3.6          1.4         0.2  versicolor
11         4.6         3.1          1.5         0.2  versicolor
12         5.0         3.6          1.5         0.2  versicolor

Der folgende Code funktioniert gut, um ein einfaches Beispiel von 2 Zeilen zu nehmen:

iris[sample(nrow(iris), 2), ]

Ich möchte jedoch eine Stichprobe von 2 Zeilen für jede Ebene einer bestimmten Variablen ziehen. Erstellen Sie beispielsweise eine Zufallsstichprobe von 2 Zeilen für jede Ebene der Variablen 'Species' wie folgt:

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
4          5.3         2.9          1.5         0.2  setosa
6          4.7         3.2          1.5         0.2  virginica
7          3.9         3.1          1.4         0.2  virginica
11         4.6         3.1          1.5         0.2  versicolor
12         5.0         3.6          1.5         0.2  versicolor

Danke für Ihre Hilfe!

Gregor Thomas

Sehr einfach mit dplyr:

library(dplyr)
iris %>%
    group_by(Species) %>%
    sample_n(size = 2)

#   Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
# 1          4.6         3.4          1.4         0.3     setosa
# 2          5.2         3.5          1.5         0.2     setosa
# 3          6.5         2.8          4.6         1.5 versicolor
# 4          5.7         2.8          4.5         1.3 versicolor
# 5          5.8         2.8          5.1         2.4  virginica
# 6          7.7         2.6          6.9         2.3  virginica

Sie können nach beliebig vielen Spalten gruppieren

CO2 %>% group_by(Type, Treatment) %>% sample_n(size = 2)

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

PHP - Erstellen einer verschachtelten Baummenüstruktur aus einem flachen Array

Erstellen eines Datenrahmens mit Pandas aus einer verschachtelten Struktur in Python

Teilmenge aus einem Datenrahmen mit Auferlegen einer neuen Struktur

Erstellen einer Funktion aus einem Datenrahmen mit einer Funktion

Dekodieren einer verschachtelten JSON-Struktur mit einer dynamischen Variablen aus einem API-Aufruf

Entfernen von Zeilen in einer verschachtelten Struktur in einem Spark-Datenrahmen mit PySpark (Details im Text)

Erstellen einer Struktur aus einem Array

Erstellen einer UL aus einem verschachtelten Array

Erstellen einer verschachtelten Struktur in graphql

Erstellen Sie ein Wörterbuch aus einer verschachtelten Struktur (mit Arrays anderer Strukturen) Swift

Erstellen einer Struktur mit einem Array (Matrizen)

Funktionelles Erstellen eines verschachtelten Objekts aus einer flachen Struktur

Erstellen Sie einen Datenrahmen aus einem Datenrahmen in einer Liste mit dem Maximalwert in einer Spalte in R.

Entfernen von Nullen und leeren Objekten gemischter Datentypen aus einem Wörterbuch mit einer verschachtelten Struktur

Abrufen von JSON-Elementen mit einem bestimmten Schlüsselnamen aus einer komplexen verschachtelten Struktur in Postgres

Erstellen einer Textzeichenfolge aus einem Datenrahmen

Erstellen einer Zusammenfassung aus einem Datenrahmen

Erstellen einer verschachtelten Struktur mit Backbone-Relational

Erstellen einer Spalte in einem Datenrahmen mit Werten aus einem anderen Datenrahmen in R.

Erstellen Sie eine neue Spalte aus einer Funktion in einem Pandas-Datenrahmen mit Werten aus Datenrahmen

Erstellen Sie eine Liste von Datenrahmen mit AICc-Werten aus einer verschachtelten Liste von Modellen

So erstellen Sie einen Pandas-Datenrahmen mit verschachtelten Spalten aus einer Liste verschachtelter Dikte

Erstellen einer JSON-Struktur aus dem Datenrahmen

Erstellen Sie einen Pandas-Datenrahmen aus einer verschachtelten Liste

Extrahieren bestimmter Zeilen aus einem verschachtelten Datenrahmen mithilfe von map mit einer if else-Bedingung

Datenrahmen mit Namen aus einer Liste erstellen

Erstellen Sie einen Datenrahmen mit bestimmten Zeichenfolgen in einer Spalte aus einem übergeordneten Datenrahmen

Erstellen Sie einen Datenrahmen mit bestimmten Zeichenfolgen in einer Spalte aus einem übergeordneten Datenrahmen

Zufallsstichprobe aus einer Tabelle

TOP Liste

  1. 1

    Wie aktualisiere ich ein Feld in einer Raumdatenbank mit einem Repository und einem Ansichtsmodell?

  2. 2

    Wie füge ich mehrere Spalten in einer Spalte mit derselben Tabelle in SQL Server zusammen?

  3. 3

    Wie kann man Gitterquadrate dazu bringen, die Farbe zu ändern?

  4. 4

    Ich kann nicht verstehen, wie man Go-Code in mehreren Dateien kompiliert

  5. 5

    Zählen Sie die Vorkommen jedes Werts in einem Tupel in Python

  6. 6

    Gibt es eine sauberere Möglichkeit, Konstruktorargumente und Instanzeigenschaften einer Klasse in Typescript zu definieren?

  7. 7

    So implementieren Sie Pushwoosh mit ionic 2

  8. 8

    Wie wird der Wert im Dropdown-Menü basierend auf den ausgewählten Daten / IDs angezeigt?

  9. 9

    Tomcat - Leiten Sie den alten Kontextstamm zum neuen Kontextstamm um

  10. 10

    Ändern Sie den Knotenpfad in das aktuelle Verzeichnis

  11. 11

    So erstellen Sie ein Array von Objekten aus zwei Arrays von Objekten mit einem gemeinsamen Schlüssel - JavaScript

  12. 12

    Rufen Sie die ID aus der Datagrid-Ansicht ab und zeigen Sie die Daten in Textfeldern einem anderen Formular an

  13. 13

    base js: Wie füge ich einem Objekt eine Eigenschaft auf die 'alte' Weise hinzu?

  14. 14

    Ersetze einen Teil einer Zeichenfolge durch eine Pandas-Spalte als Muster

  15. 15

    Blättern Sie auf Radio Click zur Abschnitts-ID

  16. 16

    CBCentralManager wird nach dem Verbinden neu gestartet

  17. 17

    Scherz, wie man eine Funktion verspottet, die von einer verspotteten Funktion zurückgegeben wird

  18. 18

    django-allauth Empfängersignal zum Hinzufügen einer Gruppenberechtigung zum Benutzer bei der Anmeldung

  19. 19

    Tic Tac Toe-Spiel im React-Reset-Button funktioniert nicht

  20. 20

    AQL: Teilweise Übereinstimmung in einer Reihe von Zeichenfolgen

  21. 21

    So summieren Sie die Werte zweier Tabellen und gruppieren sie nach Datum

heißlabel

Archiv