我想将.ics文件导入R,但是当我尝试这样做时...
sneak_cal <- read.delim("iCal-TribeEvents.ics", sep = ":", header=FALSE, stringsAsFactors = FALSE, strip.white = TRUE, na.strings = "")
...我最终也拆分了网站的字符串(属于X-ORIGINAL-URL
或UID
字段),这是不可取的
即https
和//www.kicksonfire.com
最终目的是使数据成为整齐的格式,其中每一行代表一个单一的数据VEVENT
,我认为这将由一个唯一的数据表示UID
,而不会丢失任何信息(例如URL)
是否建议使用另一种方法,例如预定义作为键的字段并将该键的值或空白与之匹配?由于.ics
文件每次都具有相同的预期字段,因此使用这些字段作为模板读取数据似乎很有意义,但是我不知道该怎么做。
这是一个例子
x <- readLines("https://www.kicksonfire.com/releases/?ical=1&tribe_display=list", warn = FALSE)
stopifnot(!any(grepl("^\\s+", x))) # disregarding value fields that have linefeeds for the sake of simplicity
keyval <- do.call(rbind, regmatches(x, regexpr(":", x, fixed = TRUE), invert = TRUE))
keyval <- keyval[which.max(keyval[,1]=="BEGIN" & keyval[,2]=="VEVENT"):tail(which(keyval[,1]=="END" & keyval[,2]=="VEVENT"), 1),]
keyval <- cbind.data.frame(keyval, id=cumsum(keyval[,1]=="BEGIN" & keyval[,2]=="VEVENT"))
df <- reshape(keyval, timevar="1", idvar="id", direction = "wide")
head(df[,c(3,4,9)])
# 2.DTSTART;VALUE=DATE 2.DTEND;VALUE=DATE 2.SUMMARY
# 1 20170422 20170423 Air Jordan 11 Low GS Blue Moon
# 14 20170422 20170423 Air Jordan 5 Premium Pure Platinum
# 27 20170427 20170428 Nike Air VaporMax Asphalt
# 40 20170427 20170428 Nike Air VaporMax Oreo
# 53 20170427 20170428 Nike WMNS Air VaporMax White Ice Blue
# 66 20170427 20170428 wings+horns x adidas NMD R2 Light Grey
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句