Xpath：如何使用XPath提取链接名称

mrajesh016 发表于 Dev

17

第016章

<table class="genre-table" width="100%" cellpadding="0" cellspacing="0" border="0">
<tbody>
  <tr class="odd">
    <td width="50%">
       <h3>
            <a href="http://www.imdb.com/genre/action/?ref_=gnr_mn_ac_mp">Action <span class="normal">»</span>
            </a>     
       </h3>

我想从中提取动作一词，如何编写相关的xpath，请帮忙

我尝试过这个，但没有什么打印出来只是空白->

    print genre.xpath('//*[@class="genre-table"]/tbody/tr[1]/td[1]/h3/a/text()')

查尔斯·达菲

给出的作品：

>>> import lxml.etree
>>> content='''
<table class="genre-table" width="100%" cellpadding="0" cellspacing="0" border="0">
<tbody>
  <tr class="odd">
    <td width="50%">
       <h3>
            <a href="http://www.imdb.com/genre/action/?ref_=gnr_mn_ac_mp">Action <span class="normal"></span>
            </a>
       </h3></td></tr></tbody></table>'''
>>> genre = lxml.etree.fromstring(content)
>>> print genre.xpath('//*[@class="genre-table"]/tbody/tr[1]/td[1]/h3/a/text()')
['Action ', '\n            ']

发生此轮事件有两个常见原因：

您正在从浏览器提供的DOM的角度构建查询，因此您的实际文档与您在此处剪切粘贴的文档不匹配。浏览器说谎（或者更确切地说，重新格式化HTML以匹配理想的DOM模型）。使用curl | less。
在本文档的其他部分中定义了XML命名空间，此处未给出。在查询中指定它们（如果存在）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-26

我来说两句

0 条评论

登录后参与评论

上一篇：从JavaScript中的索引向后遍历数组

相关文章

使用Xpath1.0提取操作名称

如何使用Nokogiri（以及XPATH和CSS）提取HTML链接和文本

使用Xpath有时如何从包含链接的表单元中提取数据？

如何使用xpath从具有相同类名的多个div中提取链接

xpath提取YouTube视频名称？

如何使用 Xpath 提取以 : 开头的属性？

如何从该站点使用 xpath 提取 YTD？

如何使用xpath或查询从xml提取数据

如何使用XPATH从html提取文本

如何使用imacros xpath提取特定文本

如何使用Xpath提取RSS URL

如何使用xpath提取[无标签词]？

使用XPath从XML知道字段值时如何提取属性名称

如何从这个匈牙利网上商店中使用XPATH在Python中提取啤酒名称？

如何使用XPath自动单击链接

使用 Xpath 提取属性

使用xpath提取图像

使用Xpath提取文本

如何使用XPath忽略名称空间

如何使用xpath查找根元素名称

如何从XPATH检索名称

使用XPath提取td值

使用 Scrapy / XPath 提取数据

使用xpath提取信息

无法使用XPath选择链接

如何在提取xpath时避免使用特定标签

如何使用xpath提取最里面的值？

如何使用Java中的XPath从XML提取特定节点？

如何使用不带HTML标记的XPath提取文本？

TOP 榜单

文章

热门标签

归档