有没有办法在 python 中使用 selenium 来抓取地址栏中的页面 url(或其中的一部分)?

francesco_cocchi

我正在处理一个庞大的电影数据集,我正在尝试从 IMDB 网站获取每部电影的 IMDb ID。selenium在 Python 中使用。我查了,但在电影页面中找不到 IMDB 代码。它包含在页面的链接中,在地址栏中,我不知道如何抓取它。有没有这样做的方法?

这是页面的示例:

在此处输入图像描述

我需要获取网址的下划线部分。

有谁知道该怎么做?

昆都克

如果你想获取title电影的 url,你需要先获取current_url然后使用 pythonsplit()函数,你可以获得倒数第二个字符串。

currenturl=driver.current_url.split("/")[-2]
print(currenturl)

这将返回tt1877830

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

有没有办法使用 selenium 从 Python 中的 Javascript 调用中获取项目列表?

有没有办法在 PYTHON 中使用 selenium 向上滚动网页中的特定 div 元素?

有没有办法在Python中使用熊猫(或其他库)提取数据框的一部分?

有没有办法使用 Selenium + Python 一次打开多个选项卡?

有没有办法在fortran中读取文件的一部分?

有没有办法隐藏从Wagtail管理页面树创建的URL的一部分?

有没有办法在Python3.8中使用rgb颜色?

有没有办法在侧边栏中添加主导航的一部分?

在 Python 中运行 selenium 时,有没有办法隐藏浏览器?

有没有办法让程序在 Selenium Python 中遇到错误时继续运行

有没有办法在vscode上隐藏我的python代码的一部分?

有没有办法使用另一个 Python 文件中定义的变量?

Selenium 从整个页面中查找元素,而不仅仅是其中的一部分(Python)

有没有办法将 javascript 变量用作 PHP SQL 页面的一部分?

有没有办法在MongoDB中返回文档中数组的一部分?

有没有办法在mdraid5设置中仅重建磁盘的一部分?

有没有办法在颤动中仅更改图标颜色的一部分?

有没有办法在Python中使用PhantomJS?

使用Python刮取Linkedin连接,但只有一部分显示-Selenium和BeautifulSoup

有没有办法从另一个 JS 文件中读取 JS 代码作为 JS 文件的一部分?(该应用程序使用 NodeJS)

有没有办法抓取使用python加载的数据

有没有办法使用python在Pandas DataFrame中使用行索引范围选择列的特定部分

有没有办法使用 yq 命令更改 URL 中的 ip 地址

如何使用Python在Selenium和Web驱动程序中获取文本的一部分

在 Python 中,有没有办法在内部函数体中使用外部函数中的变量?

有没有办法使用python列出json中未知数量的元素?

有没有办法使用 Python 从 JSON 文件中删除某些字符串?

有没有办法使用python通过elementtree中的id属性过滤xml

有没有办法使用 Python 在 Excel 中执行像 SQL 这样的 Select 语句?