R：如何在毫秒级别重新采样日期时间变量？

ℕʘʘḆḽḘ

我有一个如下的数据框

library(dplyr)
library(lubridate)
time = c('2013-01-03 22:04:21.549', '2013-01-03 22:04:21.549', '2013-01-03 22:04:21.559', '2013-01-03 22:04:23.559' )
value = c(1,2,3,4)

data <- data_frame(time, value)
data <-data %>%  mutate(time = ymd_hms(time))

# A tibble: 4 × 2
                     time value
                   <dttm> <dbl>
1 2013-01-03 22:04:21.549     1
2 2013-01-03 22:04:21.549     2
3 2013-01-03 22:04:21.559     3
4 2013-01-03 22:04:23.559     4

我想每200毫秒对该数据帧重新采样一次。

也就是说，平均value每200毫秒一次。

我知道可以lubridate::floor_date(time, '1 second')用尽second精度，但是不能用milliseconds。

在上面的示例中，row 1，2和3应该分组在一起，而row4应该单独存在（请注意，彼此2之间相差几秒钟）。

有任何想法吗？谢谢！

红外光谱

您对xts解决方案的评论要求将其“重新插入”数据框，这一事实使我认为您需要合并结果或按时间分组的列。那就是ave函数在base R中的功能。可能有一个dplyr等效项，但是我更像是base-R-guy：编辑：

 data$ms200mn <- ave(data$value, 
                     cut( arg <- as.numeric(data$time) , 
                                breaks=seq( floor(arg[1]), ceil(arg[4]), by=0.2) ),
                     FUN=mean)
>  data
# A tibble: 4 × 3
                 time value ms200mn
               <dttm> <dbl>   <dbl>
1 2013-01-03 22:04:21     1       2
2 2013-01-03 22:04:21     2       2
3 2013-01-03 22:04:21     3       2
4 2013-01-03 22:04:23     4       4

这实际上并没有适当地称为“采样”（或重采样），而是聚合。seq.POSIXt-function没有“ msec”选项（因此需要转换为数字秒），并且不允许小数秒。

解释：

cut(arg <- as.numeric(data$time), breaks=seq( floor(arg[1]), ceil(arg[4]), by=0.2) )

它是按一系列中断定义的组中的项目“分类”或“分类”，这些中断序列从第一个项目的下方开始，到最后一个项目的上方结束。将arg要创建的需要-值，因为（原因我不明白），不能使用原始“日期时间”变量可以由所使用的seq功能。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-4

我来说两句

0 条评论

登录后参与评论

上一篇：使用ngFor索引递增[ngStyle] attr？

TOP 榜单

文章

R：如何在毫秒级别重新采样日期时间变量？

R：如何在毫秒级别重新采样日期时间变量？

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称