RI中的Web Scraping无法从以下网站获取R中具有正确表格格式的csv文件

FaRz1 Ezpz

Rcode:

library(purrr)
library(rvest)
 url_base <-"https://www.franchisedirect.com/top100globalfranchises/rankings?page=%d"
  map_df(1:5,function(i){
    page <- read_html(sprintf(url_base,i))
    data.frame(Rank = html_text(html_nodes(page,".top500listingTableIndustry , .top500listingTableCountry , .top500listingTableName , .tablesaw-cell-content , .top500listingTableRank"))
    )
    }) -> F100
温尼修斯·萨比诺(Winicius Sabino)

试试这个

library(rvest)
library(dplyr)
table <- list()
for(i in 1:5){
  url = paste0("https://www.franchisedirect.com/top100globalfranchises/rankings? page=",i)
  webpage = read_html(url)
  table[[i]] <- as.data.frame(html_table(html_nodes(webpage, "table"))) 
  cat("page ",i, " complete", "\n")
}
table2 <- bind_rows(table)

for(i in 1:dim(table2)[2]){
   table2[,i] <- gsub("\\\n", "", table2[,i])
}

write.csv(table2, "table.csv")

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

无法在Pandas Python中以CSV格式删除具有不同表格格式的行

尝试抓取以下网站时,csv文件中的格式问题

在JAX-WS RI中懒惰地验证传入的Web服务请求的一部分

JAXB RI ClassFactory中的空指针异常

从网站获取表格中的数据并使用 perl 将其输出为表格格式

我在RI中收到警告消息,不明白

gem install rails -v 4.1.0卡在ri文档中

ri中记录的关键字方法参数在哪里?

如何在drupal 7中将上传的csv文件显示为表格格式

如何解析显示在csv文件中的表格格式的文本?

无法在以下网址中工作?

在RI中,希望在文件夹中找到最新的xlsx文件,然后从该文件导入数据

在RI中,无法将列名称分配给数据框

Jira中的表格格式对齐

表格格式的xml中的数据

将bash脚本中的输出文件格式化为HTML表格格式

Web Scraping Python BeautifulSoup 获取网站中每个网页的元素

正确格式化 CSV 文件,以便正确地从 CSV 中获取数据

在Python中使用csv模块的单元格中的表格格式

无法从表格中获取正确的日期

获取我的箭头函数输出并在React的渲染组件中以表格格式显示它

如何从命令输出中获取特定元素,然后以表格格式显示?

如何在JSP文件中以表格格式显示列表内容?

Shell中的文本文件到HTML表格格式

有哪些方法可以以非表格格式在Angular中显示JSON数据?

如何使用 R 中的网络爬虫修复数据读取和表格格式问题

Internet Explorer阻止了来自以下网站的该应用程序中的内容

QUERY函数无法正确计算Google表格中具有OR条件的匹配值

在Java的System.out中以表格格式输出