Ich habe eine Tabelle:
ID Latitude Longitude Visit_Date
1850 46.72187 -114.7254 7/1/2017
1850 46.72187 -114.7254 12/7/2018
1850 46.72187 -114.7254 6/13/2018
1850 46.72186 -114.7250 6/13/2018
1850 46.72186 -114.7250 6/8/2019
1850 46.72186 -114.7250 10/26/2019
Ich möchte eine Tabelle erstellen, die eine Zeile für jeden einzelnen Lat-Long und den Zeitrahmen hat, in dem die ID in diesem Lat-Long war. Also idealerweise eine Ausgabe wie diese:
ID Latitude Longitude Start End
1850 46.72187 -114.7254 7/1/2017 6/13/2018
1850 46.72186 -114.7250 6/13/2018 10/26/2019
Ich bin ein wenig verloren, wie ich das bewerkstelligen kann. Ich dachte daran, die Funktion shift() zu verwenden, um Zeilen von einer anderen zu subtrahieren, und wenn der lat long != 0 ist, dann wäre dies ein eindeutiger lat long. Ich dachte auch, dass die Funktion unique() nützlich wäre, aber ich bin mir nicht sicher, welche Richtung am besten wäre. Jede Hilfe wird nützlich sein. Danke!
Mit dplyr können Sie ziemlich einfach zusammenfassende Statistiken erstellen:
df1 %>%
mutate(Visit_Date = as.Date(Visit_Date, format = "%m/%d/%Y")) %>%
group_by(ID, Latitude, Longitude) %>%
summarise(Start = min(Visit_Date),
End = max(Visit_Date))
Dieser Artikel stammt aus dem Internet. Bitte geben Sie beim Nachdruck die Quelle an.
Bei Verstößen wenden Sie sich bitte [email protected] Löschen.
Lass mich ein paar Worte sagen