以下是数据集:
> head(u1spdf)
coordinates A Latitude Longitude Altitude Date.No..Of.days DateTime geodist tdiff
1 (116.3184, 39.9847) 1 39.98470 116.3184 492 39744.12 2008-10-23 02:53:04 0.00000 0
2 (116.3184, 39.98468) 2 39.98468 116.3184 492 39744.12 2008-10-23 02:53:10 3.52000 6
3 (116.3184, 39.98469) 3 39.98469 116.3184 492 39744.12 2008-10-23 02:53:15 2.83000 5
4 (116.3184, 39.98469) 4 39.98469 116.3184 492 39744.12 2008-10-23 02:53:20 2.74000 5
5 (116.3183, 39.98465) 5 39.98465 116.3183 492 39744.12 2008-10-23 02:53:25 11.03000 5
6 (116.318, 39.98461) 6 39.98461 116.3180 493 39744.12 2008-10-23 02:53:30 20.81404 5
我需要giodist
大于200m且tdiff
大于1200秒的条目
geodist
是2点之间的距离,并且tdiff
是2点之间的时间差
我已经为此执行以下算法:
i <- 0
pointNum <- nrow(u1spdf) #the number of GPS points
while (i < pointNum) {
j <- i+1; Token <- 0;
while (j < pointNum) {
cdist <- u1spdf$geodist[i+1] #calculated the distance between points
#message("cdist: ",cdist)
if (cdist > 200 | cdist ==0) {
ctime <- u1spdf$tdiff[i+1] #calculated the time span between two points
#message("ctime: ",ctime)
if (ctime > 1200 | ctime ==0 ) {
print(u1spdf[i+1, ])
i <- j
Token <- 1
}
}
break
j <- j+1
}
if (Token!=1) {
i <- i+1
}
该算法给出了以下输出:
coordinates A Latitude Longitude Altitude Date.No..Of.days DateTime geodist tdiff
149 (116.2868, 39.99578) 149 39.99578 116.2868 716 39744.17 2008-10-23 04:08:07 1727.514 3772
coordinates A Latitude Longitude Altitude Date.No..Of.days DateTime geodist tdiff
471 (116.3202, 40.00478) 471 40.00478 116.3202 105 39744.4 2008-10-23 09:42:25 690.0795 18453
需要将此输出作为1个数据帧或每次重复其标头
你能建议我如何获得以上作为数据集的输出
R非常适合与其他对象建立索引...
meets_conditions = (u1spdf$geodist > 200 & u1spdf$tdiff > 1200)
your_desired_output = u1spdf[meets_conditions, ]
为了提供解释,它meets_conditions
是一个二进制向量,其长度与数据帧中的行数相同u1spdf
。它指示哪些行满足指定条件。随后,我们可以使用它来指示我们要从原始数据框中选择哪些行,以分配给名为的新数据框your_desired_output
,也可以u1spdf[meets_conditions, ]
直接在其他函数中使用,例如print(u1spdf[meets_conditions, ])
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句