从 xml 节点集中提取文本

拉斐尔

我正在从网页中提取日期并且很难提取文本

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()')
## prints ## 
# {xml_nodeset (1)}
# [1]  2017-03-27 

我尝试添加``[[(1L)date_[[1]]但是这个打印

{xml_node}
<text>

我只想提取 2017-03-27

伦特洛普

只需使用 html_text

正如函数名称所说,html_nodes返回指向节点的指针。要从中提取信息,请使用html_texthtml_attr

将第一行更改为:

date_ <- html_nodes(page_, xpath = '//*[@id="particular_con"]/div[2]/text()') %>% html_text()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章