有什么办法可以通过 HTML、selenium、python 选择元素

Shin euichul 发表于 Dev

新义哲

我正在通过 selenium、python 制作爬行应用程序，但我被卡住了。

在此处输入图片说明

如图所示，我可以选择文本（带下划线）。但我需要的是文本旁边的数字。

但在 F12 铬

在此处输入图片说明

numbers(red cricle) 有类名，但类名都是一样的。没有可用于通过 selenium 选择数字的指标。（据我所知）

所以我试图找到任何通过硒通过 HTML 选择元素的方法。但我找不到任何。有什么办法吗？

如果我要找的东西不存在，我很抱歉。我只知道 python 和 selenium ..所以如果我不能处理这个，请告诉我。

- -编辑

我觉得我的解释不好。我需要的是先找到文本，而不是收集数字（两个）。但有大量的文字。我只是截图一点。所以我可以通过它的特定 ID（很多）来定位文本。但是我怎样才能得到嵌套到文本中的数字。这是我的问题。抱歉解释不好

如果 BeautifulSoup 可以处理这个问题，请告诉我。谢谢你的帮助。

特别感谢克里斯汀

她的代码解决了我的问题。

克里斯汀

您可以使用 XPath 索引来完成选择第一个td元素。鉴于屏幕截图，您可以选择第一个td包含2,.167如下：

cell = driver.find_element_by_xpath("//tr[td/a[text()='TEXT']]/td[@class='txt-r'][1]")
print(cell.text)

你应该用TEXT你在截图中加下划线的字符替换——我没有这个键盘，所以我不能为你输入文本。

上面的 XPath 将查询所有表格行，选择具有所需文本的行，然后查询txt-r具有行内类的表格单元格。因为这两个td元素都有 class txt-r，所以您只想选择其中一个，使用由指示的索引[1]。该[1]会挑头td，用文字2,167。

用户要求的完整样本：

# first get all text on the page
all_text_elements = driver.find_elements_by_xpath("//a[contains(@class, 'link-resource')]")

# iterate text elements and print both numbers that are next to text
for text_element in all_text_elements:

    # get the text from web element
    text = text_element.text

    # find the first number next to it (2,167 from sample HTML)
    first_number = driver.find_element_by_xpath("//tr[td/a[text()='" + text + "']]/td[@class='txt-r'][1]")
    print(first_number.text)

    # find 2nd number (0 from sample HTML)
    second_number = driver.find_element_by_xpath("//tr[td/a[text()='" + text + "']]/td[@class='txt-r'][2]")
    print(second_number.text)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-07-31

我来说两句

0 条评论

登录后参与评论

上一篇：C# 登录 XML 循环错误的密码

TOP 榜单

文章

有什么办法可以通过 HTML、selenium、python 选择元素

有什么办法可以通过 HTML、selenium、python 选择元素

计算数据帧R中的字符串频率

Android Studio Kotlin：提取为常量

Excel 2016图表将增长与4个参数进行比较

获取并汇总所有关联的数据

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

将加号/减号添加到jQuery菜单

算术中的c ++常量类型转换

TYPO3：将 Formhandler 添加到新闻扩展

TreeMap中的自定义排序

如何开始为Ubuntu开发

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

无法使用 envoy 访问 .ssh/config

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

遍历元素数组以每X秒在浏览器上显示

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

尝试在Dell XPS13 9360上安装Windows 7时出错

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称