如何使用相对路径提取href的绝对URL?

黎安东

我正在尝试从此链接中提取下载链接

这是该链接的页面来源(在Google Chrome中查看):

在此处输入图片说明

当我在../matlab/licensing.pdf页面源上指向时,将https://www.mathworks.com/help/pdf_doc/matlab/licensing.pdf出现一个链接

我检查了,../matlab/licensing.pdf但是链接没有出现在右侧。因此,我无法在Python中使用regrex提取此链接。

请帮助我从页面源中提取此链接。

亚当·Er8

尝试使用urllib.parse.urljoin

例:

import urllib.parse

base = r"https://www.mathworks.com/help/pdf_doc/install/index.html"
link_in_html = r"../matlab/licensing.pdf"

result = urllib.parse.urljoin(base, link_in_html)

print(result)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章