Pivot-Tabelle mit mehreren Spalten erstellen und nach eindeutigen Vorkommen aggregieren

E.M.K. Gepostet am Dev

EMK

Es fällt mir schwer, mich damit auseinanderzusetzen oder online eine Richtlinie zu finden.

Ich habe Mitgliedsdaten. Ich möchte sehen, wie viele Mitglieder in einem bestimmten Monat bestehen, bevor sie ihre Mitgliedschaft kündigen. Ich kann sehen, in welchem Monat sie beigetreten sind, und ich kann sehen, wie lange sie aktiv sind, indem ich mir ihre Transaktionsnummer anschaue (sie erhöht sich jeden Monat um 1). Wenn ich also die Transaktionsnummern für jeden Monat nachverfolge, kann ich einen Wasserfall darüber erhalten, wie viele Personen in diesem Monat beigetreten sind und wie hoch der Drop-off war.

Der Clou ist, dass es manchmal mehrere Transaktionen innerhalb eines Monats durch dasselbe Mitglied gibt, aber ich möchte dieses Mitglied nur einmal zählen, also müsste ich dieses Mitglied nur einmal zählen.

Name | Joined Month | Transaction no
Adam | Jan          | 1
Adam | Jan          | 2
Adam | Jan          | 2
Ben  | Jan          | 1
Ben  | Jan          | 2
Ben  | Jan          | 3
Ben  | Jan          | 4
Cathy| Jan          | 1
Donna| Feb          | 1
Donna| Feb          | 2
Donna| Feb          | 3
Evan | Mar          | 1
Evan | Mar          | 1
Frank | Mar         | 1
Frank | Mar         | 2

Bei einer Aggregation für verschiedene Elemente mit Monaten als Spalten würde das Ergebnis etwa so aussehen:

Transaction# | Jan | Feb | March
1            | 3   | 1   | 2 
2            | 2   | 1   | 1
3            | 1   | 1   | 0
4            | 1   | 0   | 0

Alle Tipps oder Hinweise in die richtige Richtung wären sehr hilfreich. Sollte ich reshape2 oder ein ähnliches Paket verwenden? Hoffentlich habe ich die Erklärung oder die Formatierung nicht zerlegt, bitte zögern Sie nicht, Fragen zu stellen.

Vielen Dank!

Dean

Unten sehen Sie ein reproduzierbares Beispiel, das die Funktionen von Ordensverse dplyr::n_distinctund tidyr::spread.

Ich habe Ihre Daten zuerst als Tibble dargestellt (oder Sie könnten genauso gut einen Datenrahmen verwenden).

Als nächstes gruppieren wir nach Transactionnound JoinedMonthvor dem Zählen verschiedener Namen. Um es in Tabellenform zu erhalten, verwenden wir tidyr::spread. Wenn Sie die resultierenden Spalten in Monatsreihenfolge haben möchten, ist es wichtig, sicherzustellen, dass Ihr Datenrahmen sie als geordnete Faktoren enthält.

library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
library(tibble)
library(tidyr)

x <- tribble(
        ~Name , ~JoinedMonth,  ~Transactionno,
        "Adam" , "Jan"         , 1,
        "Adam" , "Jan"          , 2,
        "Adam" , "Jan"          , 2,
        "Ben"  , "Jan"          , 1,
        "Ben"  , "Jan"          , 2,
        "Ben"  , "Jan"          , 3,
        "Ben"  , "Jan"          , 4,
        "Cathy", "Jan"          , 1,
        "Donna", "Feb"          , 1,
        "Donna", "Feb"          , 2,
        "Donna", "Feb"          , 3,
        "Evan" , "Mar"          , 1,
        "Evan" , "Mar"          , 1,
        "Frank" , "Mar"         , 1,
        "Frank" , "Mar"         , 2  

)

x %>%
  group_by(Transactionno, JoinedMonth) %>% 
  summarise(ct = n_distinct(Name)) %>% 
  tidyr::spread(JoinedMonth, ct, fill = 0)
#> # A tibble: 4 x 4
#> # Groups:   Transactionno [4]
#>   Transactionno   Feb   Jan   Mar
#>           <dbl> <dbl> <dbl> <dbl>
#> 1            1.    1.    3.    2.
#> 2            2.    1.    2.    1.
#> 3            3.    1.    1.    0.
#> 4            4.    0.    1.    0.

Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.

Bei Verstößen wenden Sie sich bitte [email protected] Löschen.

bearbeiten am2021-07-4

Lass mich ein paar Worte sagen

0Kommentare

LoginNach der Teilnahme an der Überprüfung

Vorheriger Beitrag:Ich kann nicht herausfinden, warum Wix die alte Version nicht überschreibt

TOP Liste

Artikel

Pivot-Tabelle mit mehreren Spalten erstellen und nach eindeutigen Vorkommen aggregieren

Pivot-Tabelle mit mehreren Spalten erstellen und nach eindeutigen Vorkommen aggregieren

So legen Sie mit dem Interface Builder unterschiedliche führende Speicherplätze für unterschiedliche Geräte fest

Fügen Sie eine weitere Schaltfläche zu gwt Suggest Box hinzu

Wie konvertiere ich einen Vektor von Bytes (u8) in eine Zeichenfolge?

Wie kann ich in SCSS mehrere Klassen zu einer einzigen kombinieren?

Wie konvertiert man einen Datenrahmen im langen Format in eine Liste mit einem geeigneten Format?

Speichern Sie ein MPAndroidChart-Diagramm in einem Bild, ohne es in einer Aktivität anzuzeigen

Gruppieren Sie Datenrahmenspalten nach ihrem Datum (die Spaltentitel enthalten) und fassen Sie die Instanzen von Einsen und Nullen in R . zusammen

Tomcat - Leiten Sie den alten Kontextstamm zum neuen Kontextstamm um

Eclipse Oxygen - Projekte verschwinden

Wie wählt man Unterschiede mit drei Tabellen aus?

Tic Tac Toe-Spiel im React-Reset-Button funktioniert nicht

So berechnen Sie die Verfügbarkeit von Anwendungen (SLA)

ElasticSearch BulkShardRequest ist aufgrund von org.elasticsearch.common.util.concurrent.EsThreadPoolExecutor fehlgeschlagen

Wie kann ich den Kaskadenmodus global einstellen?

Python: Spalten mit demselben Namen zusammenführen, wobei der Mindestwert beibehalten wird

So erhalten Sie eine gleichmäßige Höhe für alle Eingabefelder

Wie erstelle ich einen neuen übergeordneten Knoten außerhalb der .ref (/ path) in der Firebase-Echtzeitdatenbank mithilfe von Cloud-Funktionen (Typescript)?

Was ist schneller: SUM über NULL oder über 0?

Wie kann ich eine verschachtelte Schleife mit lapply in R ersetzen?

Kann ich ein Tkinter-Canvas erstellen, das mehrere Zeilen in einem Text-Widget umfasst?

Ärgerliches Problem mit yaml, das ich nicht lösen kann