Python，Selenium：当ul列表过长时，无法通过xpath查找元素

Deth 发表于 Dev

德思

我正在尝试创建一个程序来提取我在Instagram上关注的所有人。我正在使用Python，Selenium和Chromedriver。

为此，我首先获得关注人数，然后单击“关注”按钮：

nb_abonnements = int(webdriver.find_element_by_xpath('/html/body/span[1]/section[1]/main/div[1]/header/section[1]/ul/li[3]/a/span').text)

sleep(randrange(1,3))
abonnements = webdriver.find_element_by_xpath('/html/body/span[1]/section[1]/main/div[1]/header/section[1]/ul/li[3]/a')
abonnements.click()

然后，我使用以下代码获取关注者并滚动弹出页面，以防万一找不到：

followers_panel = webdriver.find_element_by_xpath('/html/body/div[3]/div/div/div[2]')
while i < nb_abonnements:
    try:
        print(i)
        followed = webdriver.find_element_by_xpath('/html/body/div[3]/div/div/div[2]/ul/div/li[{}]/div/div[2]/div/div/div/a'.format(i+1)).text
        #the followeds are in an ul-list
        i += 1
        followed_list.append(followed)
        except NoSuchElementException:
        webdriver.execute_script(
            "arguments[0].scrollBy(0,400)",followers_panel
        )
        sleep(7)

问题是一旦我12岁，程序就会引发异常并滚动。从那里开始，他仍然找不到下一个跟随者，并且陷入了一个循环，在循环中他除了滚动以外什么也不做。我已经检查了IG页面的源代码，事实证明该路径仍然有效，但是显然我无法像以前那样访问这些元素，这可能是因为我正在访问它们的ul-list已变为long（程序的第5行）。

我无法解决该问题。希望您会有所帮助。

更新：DOM看起来像这样：

该ul是追随者清单。在li小号包含信息我试图提取物（用户名）。即使我自己一个人走在网页上，打开弹出窗口，稍微滚动并加载所有内容，也无法通过在DOM的搜索栏中手动键入xpath来找到所需的元素。尽管路径是正确的，但我可以通过查看DOM进行检查。

我已经尝试过各种用于硒的webdriver，目前我正在使用chromedriver 2.45.615291。我还明确指定了等待元素显示（WebDriverWait(webdriver, 10).until(EC.presence_of_element_located((By.XPATH, '/html/body/div[3]/div/div/div[2]/ul/div/li[{}]/div/div[2]/div/div/div/a'.format(i+1))))）的时间，但我只收到了一个超时异常：selenium.common.exceptions.TimeoutException: Message:。

似乎一旦ul列表过长（这是从我向下滚动足以加载新人的那一刻起），我就无法通过其XPATH访问列表的任何元素，即使是已经加载的元素在我开始滚动之前。

德思

我提供了一种解决方案：我只是通过XPATH访问元素，如下所示：find_element_by_xpath("(//*[@class='FPmhX notranslate _0imsa '])[{}]".format(i))。我不知道为什么它不能以其他方式起作用，但是像这样，它可以正常工作。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-22

我来说两句

0 条评论

登录后参与评论

上一篇：如何使用Retrofit / Gson在JSON中反序列化相同类型但具有不同字段名称的对象列表？

TOP 榜单

文章

Python，Selenium：当ul列表过长时，无法通过xpath查找元素

Python，Selenium：当ul列表过长时，无法通过xpath查找元素

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接