如何在 R 中标记带有不规则错误符号的规则时间序列？

堕落的领主

我有一个直接的时间序列序列，例如：

library(lubridate)
start = parse_date_time("2018-01-01","%Y-%m-%d")
end = parse_date_time("2018-01-02","%Y-%m-%d")
series = seq(start,end,by=600)

> series
[1] "2018-01-01 00:00:00 UTC" "2018-01-01 00:10:00 UTC" "2018-01-01 00:20:00 UTC" "2018-01-01 00:30:00 UTC"
[5] "2018-01-01 00:40:00 UTC" "2018-01-01 00:50:00 UTC" "2018-01-01 01:00:00 UTC" "2018-01-01 01:10:00 UTC"
[9] "2018-01-01 01:20:00 UTC" "2018-01-01 01:30:00 UTC" "2018-01-01 01:40:00 UTC" "2018-01-01 01:50:00 UTC"
[13] "2018-01-01 02:00:00 UTC" "2018-01-01 02:10:00 UTC" "2018-01-01 02:20:00 UTC" "2018-01-01 02:30:00 UTC"...

而且我还有一个不规则状态的向量，例如：

error = data.frame(
on = parse_date_time(c("2018-01-01 00:13:57","2018-01-01 01:01:44"),"%Y-%m-%d %H:%M:%S"),
off = parse_date_time(c("2018-01-01 00:21:32","2018-01-01 02:33:45"),"%Y-%m-%d %H:%M:%S")
)

> error
                   on                 off
1 2018-01-01 00:13:57 2018-01-01 00:21:32
2 2018-01-01 01:01:44 2018-01-01 02:33:45

我怎样才能像下面那样用错误标记我的系列？

> flag 
                         series        error
  [1] "2018-01-01 00:00:00 UTC"         "OK"
  [2] "2018-01-01 00:10:00 UTC"         "OK"
  [3] "2018-01-01 00:20:00 UTC"      "ERROR"
  [4] "2018-01-01 00:30:00 UTC"      "ERROR"
  [5] "2018-01-01 00:40:00 UTC"         "OK"
  [6] "2018-01-01 00:50:00 UTC"         "OK"
  [7] "2018-01-01 01:00:00 UTC"         "OK"
  [8] "2018-01-01 01:10:00 UTC"      "ERROR"
  [9] "2018-01-01 01:20:00 UTC"      "ERROR"
 [10] "2018-01-01 01:30:00 UTC"      "ERROR"
 [11] "2018-01-01 01:40:00 UTC"      "ERROR"
 [12] "2018-01-01 01:50:00 UTC"      "ERROR"
 [13] "2018-01-01 02:00:00 UTC"      "ERROR"
 [14] "2018-01-01 02:10:00 UTC"      "ERROR"
 [15] "2018-01-01 02:20:00 UTC"      "ERROR"
 [16] "2018-01-01 02:30:00 UTC"      "ERROR"
 [17] "2018-01-01 02:40:00 UTC"      "ERROR"
 [18] "2018-01-01 02:50:00 UTC"         "OK"

卡鲁姆你

这是一个使用的解决方案map_lgl，因为lubridate间隔dplyr对我来说很有趣。请注意，我使用ceiling_dateonoff来重现您想要的输出，尽管我不清楚为什么最后一行算作ERROR因为，例如，输出"2018-01-01 00:30:00 UTC"中的第4 行在第一个offvalue 之后"2018-01-01 00:21:32"。关键部分只是使用interval（或替代地，on %--% off）创建区间，然后使用any(%within%)返回逻辑值，以确定系列中的给定值是否在错误区间之一内。ifelse让我们将值转换为字符标志。

library(tidyverse)
library(lubridate)
#> 
#> Attaching package: 'lubridate'
#> The following object is masked from 'package:base':
#> 
#>     date
start = parse_date_time("2018-01-01","%Y-%m-%d")
end = parse_date_time("2018-01-02","%Y-%m-%d")
series = seq(start,end,by=600)
error = data.frame(
  on = parse_date_time(c("2018-01-01 00:13:57","2018-01-01 01:01:44"),"%Y-%m-%d %H:%M:%S"),
  off = parse_date_time(c("2018-01-01 00:21:32","2018-01-01 02:33:45"),"%Y-%m-%d %H:%M:%S")
) %>%
  mutate(
    off = ceiling_date(off, unit = "10 minutes"),
    intvs = interval(on, off)
  )

series %>%
  tibble(dttm = .) %>%
  bind_cols(status = map_lgl(series, ~ any(. %within% error$intvs))) %>%
  mutate(status = ifelse(status == TRUE, "ERROR", "OK")) %>%
  print(n = 20)
#> # A tibble: 145 x 2
#>    dttm                status
#>    <dttm>              <chr> 
#>  1 2018-01-01 00:00:00 OK    
#>  2 2018-01-01 00:10:00 OK    
#>  3 2018-01-01 00:20:00 ERROR 
#>  4 2018-01-01 00:30:00 ERROR 
#>  5 2018-01-01 00:40:00 OK    
#>  6 2018-01-01 00:50:00 OK    
#>  7 2018-01-01 01:00:00 OK    
#>  8 2018-01-01 01:10:00 ERROR 
#>  9 2018-01-01 01:20:00 ERROR 
#> 10 2018-01-01 01:30:00 ERROR 
#> 11 2018-01-01 01:40:00 ERROR 
#> 12 2018-01-01 01:50:00 ERROR 
#> 13 2018-01-01 02:00:00 ERROR 
#> 14 2018-01-01 02:10:00 ERROR 
#> 15 2018-01-01 02:20:00 ERROR 
#> 16 2018-01-01 02:30:00 ERROR 
#> 17 2018-01-01 02:40:00 ERROR 
#> 18 2018-01-01 02:50:00 OK    
#> 19 2018-01-01 03:00:00 OK    
#> 20 2018-01-01 03:10:00 OK    
#> # ... with 125 more rows

由reprex 包(v0.2.0)于2018年 3 月 15 日创建。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-25

我来说两句

0 条评论

登录后参与评论

上一篇：组件：从`TComboBox`更新`Items`

TOP 榜单

文章

如何在 R 中标记带有不规则错误符号的规则时间序列？

如何在 R 中标记带有不规则错误符号的规则时间序列？

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u