我正在处理一个庞大的电影数据集,我正在尝试从 IMDB 网站获取每部电影的 IMDb ID。我selenium在 Python 中使用。我查了,但在电影页面中找不到 IMDB 代码。它包含在页面的链接中,在地址栏中,我不知道如何抓取它。有没有这样做的方法?
selenium
这是页面的示例:
我需要获取网址的下划线部分。
有谁知道该怎么做?
如果你想获取title电影的 url,你需要先获取current_url然后使用 pythonsplit()函数,你可以获得倒数第二个字符串。
title
current_url
split()
currenturl=driver.current_url.split("/")[-2] print(currenturl)
这将返回tt1877830
tt1877830
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
点击生成二维码
我来说两句