我正在从网页中提取日期并且很难提取文本
date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()')
## prints ##
# {xml_nodeset (1)}
# [1] 2017-03-27
我尝试添加``[[(1L)
或date_[[1]]
但是这个打印
{xml_node}
<text>
我只想提取 2017-03-27
只需使用 html_text
正如函数名称所说,html_nodes
返回指向节点的指针。要从中提取信息,请使用html_text
和html_attr
将第一行更改为:
date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') %>% html_text()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句