我有一个需要验证的 URLS .csv 文件。
我想将 GET 的 httr 应用于数据框的每一行。
> websites
website
1 www.msn.com
2 www.wazl.com
3 www.amazon.com
4 www.rifapro.com
我确实找到了类似的问题并尝试应用提供的答案;但是不工作。
> apply(websites, 1, transform, result=GET(websites$website))
Error: length(url) == 1 is not TRUE
> apply(websites, websites[,1], GET())
Error in handle_url(handle, url, ...) :
Must specify at least one of url or handle
我不确定我做错了什么。
你可以做类似的事情
websites <- read.table(header=T, text="website
1 www.msn.com
2 www.wazl.com
3 www.amazon.com
4 www.rifapro.com")
library(httr)
urls <- paste0(ifelse(grepl("^https?://", websites$website, ig=T), "", "http://"),
websites$website)
lst <- lapply(unique(tolower(urls)), function(url) try(HEAD(url), silent = T))
names(lst) <- urls
sapply(lst, function(x) if (inherits(x, "try-error")) -999 else status_code(x))
# http://www.msn.com http://www.wazl.com http://www.amazon.com http://www.rifapro.com
# 200 -999 405 -999
不需要GET
请求恕我直言。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句