Weisen Sie eine neue Spalte basierend auf eindeutigen Wertekombinationen in anderen Spalten zu

Yusef_S

Ich habe einen Datensatz mit Vogelbeobachtungsaufzeichnungen, ungefähr 300.000 Zeilen, mit 7 Spalten. Ich möchte eine neue Spalte erstellen, die auf den eindeutigen Kombinationen von 3 anderen Spalten basiert, die alle Faktorvariablen sind - "gridref", das 1 km große Gitterquadrat, in dem sich der Datensatz befindet. "Beobachter", die Person, die die Beobachtung gemacht hat, und "Datum", Datum der Beobachtung. Ich möchte eine neue Spalte "visit_ID" für jeden eindeutigen "Besuch" eines 1 km langen Rasterquadrats erstellen, dh für jede eindeutige Kombination aus Rasterref, Beobachter und Datum.

Ich habe versucht, den folgenden Code zu verwenden:

birds_raw$vid <- as.integer(interaction(birds_raw$gridref, birds_raw$observer, birds_raw$date))

Dies gibt die folgende Fehlermeldung zurück:

Error: cannot allocate vector of size 636.1 Gb
In addition: Warning message:
In ans * length(l) : NAs produced by integer overflow

Ich bin sicher, es muss einen einfachen Weg geben, dies zu erreichen. Kann mir bitte jemand helfen?

Giovanni Colitti

Sie können dies effizient tun mit data.table:

library(data.table)
birds_raw <-
  data.table(
    other_var = factor(c("other 1", "other 2", "other 3", "other 4")),
    gridref = factor(c("grid 1", "grid 2", "grid 1", "grid 1")),
    observer = factor(c("person 1", "person 2", "person 2", "person 1")),
    date = factor(c("date 1", "date 2", "date 1", "date 1"))
  )
birds_raw[, visit_id := .GRP, by = c("gridref", "observer", "date")][]

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am
0

Lass mich ein paar Worte sagen

0Kommentare
LoginNach der Teilnahme an der Überprüfung

Verwandte Artikel

Python Pandas: Erstellen Sie eine neue Spalte mit Mindestwerten basierend auf eindeutigen Bezeichnern in anderen Spalten

Weisen Sie eine neue Spalte basierend auf bestimmten Bedingungen zu

Erstellen Sie eine neue Spalte basierend auf anderen Spalten

Weisen Sie eine neue Spalte basierend auf Werten in einer separaten Spalte zu

Erstellen Sie eine neue Pandas-Spalte basierend auf der Bedingung in einer Spalte und weisen Sie den Wert aus mehreren Spalten im selben Datenrahmen zu

Pandas erstellen eine neue Spalte basierend auf anderen anderen Spalten

Weisen Sie der Spalte Werte basierend auf zwei anderen Spalten in Python zu

Weisen Sie eine ID in einer Spalte basierend auf der ID in einer anderen Spalte in R zu

So weisen Sie Werte für eine Spalte basierend auf den Werten einer anderen Spalte zu

Zählen Sie eine Spalte basierend auf dem eindeutigen Wert eines anderen Spalten-Pysparks

Dataframe erstellt eine neue Spalte basierend auf anderen Spalten

SQL erstellt eine neue Spalte basierend auf zwei anderen Spalten

Pandas, erstellen Sie eine neue Spalte basierend auf anderen Spalten in mehreren Zeilen

So erstellen Sie eine neue Spalte basierend auf Werten aus anderen Spalten in einem Pandas DataFrame

Erstellen Sie eine neue Spalte basierend auf mehreren Bedingungen in anderen Spalten in R

So erstellen Sie eine neue Spalte basierend auf Berechnungen in anderen Spalten in PySpark

So erstellen Sie eine neue Spalte basierend auf anderen Spalten mit if-Bedingungen in r

Erstellen Sie eine neue Spalte in R basierend auf den Bedingungen in zwei anderen Spalten

Erstellen Sie eine neue Spalte mit dplyr basierend auf Zeichenfolgenwerten in allen anderen Spalten in einem Datenrahmen in R

So erstellen Sie eine neue Spalte in einem DataFrame basierend auf Werten von zwei anderen Spalten

Erstellen Sie eine neue Spalte basierend auf anderen Spalten in vorhandenen Datenrahmen

Julia DataFrames: Erstellen Sie eine neue Spalte von Arrays basierend auf anderen Spalten

Erstellen Sie eine neue Spalte basierend auf NA-Werten in anderen Spalten

Erstellen Sie eine neue Spalte in Pandas DataFrame basierend auf anderen Spalten

Erstellen Sie eine neue Spalte basierend auf den Bedingungen in anderen Spalten

Python groupby - Erstellen Sie eine neue Spalte basierend auf Werten in anderen Spalten

Fügen Sie df eine neue Spalte hinzu, basierend auf Werten in anderen Spalten

Erstellen Sie eine neue Spalte basierend auf anderen Spalten und einem Wörterbuch

Pandas - Erstellen Sie eine neue Spalte mit einem Wert basierend auf dem Namen der anderen Spalten

TOP Liste

  1. 1

    So legen Sie mit dem Interface Builder unterschiedliche führende Speicherplätze für unterschiedliche Geräte fest

  2. 2

    Fügen Sie eine weitere Schaltfläche zu gwt Suggest Box hinzu

  3. 3

    Wie konvertiere ich einen Vektor von Bytes (u8) in eine Zeichenfolge?

  4. 4

    Wie kann ich in SCSS mehrere Klassen zu einer einzigen kombinieren?

  5. 5

    Wie konvertiert man einen Datenrahmen im langen Format in eine Liste mit einem geeigneten Format?

  6. 6

    Speichern Sie ein MPAndroidChart-Diagramm in einem Bild, ohne es in einer Aktivität anzuzeigen

  7. 7

    Gruppieren Sie Datenrahmenspalten nach ihrem Datum (die Spaltentitel enthalten) und fassen Sie die Instanzen von Einsen und Nullen in R . zusammen

  8. 8

    Tomcat - Leiten Sie den alten Kontextstamm zum neuen Kontextstamm um

  9. 9

    Eclipse Oxygen - Projekte verschwinden

  10. 10

    Wie wählt man Unterschiede mit drei Tabellen aus?

  11. 11

    Tic Tac Toe-Spiel im React-Reset-Button funktioniert nicht

  12. 12

    So berechnen Sie die Verfügbarkeit von Anwendungen (SLA)

  13. 13

    ElasticSearch BulkShardRequest ist aufgrund von org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor fehlgeschlagen

  14. 14

    Wie kann ich den Kaskadenmodus global einstellen?

  15. 15

    Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

  16. 16

    So erhalten Sie eine gleichmäßige Höhe für alle Eingabefelder

  17. 17

    Wie erstelle ich einen neuen übergeordneten Knoten außerhalb der .ref (/ path) in der Firebase-Echtzeitdatenbank mithilfe von Cloud-Funktionen (Typescript)?

  18. 18

    Was ist schneller: SUM über NULL oder über 0?

  19. 19

    Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

  20. 20

    Kann ich ein Tkinter-Canvas erstellen, das mehrere Zeilen in einem Text-Widget umfasst?

  21. 21

    Ärgerliches Problem mit yaml, das ich nicht lösen kann

heißlabel

Archiv