Python3 Beautiful Soup获取HTML标签锚

菲利普离子多里内尔

我正在尝试使用BS4和Python保存和替换<translate>HTML文件中第一个标签的内容

现在,我正在尝试执行以下操作:

translate_bs4 = bs4_object.find('translate')
translate_key = '{{ key }}'
translate_initial = str(title_bs4)
translate_bs4.string = translate_key

我的测试用例是:

<translate>tag with <other_tag>some text</other_tag></translate>
<much_longer_file>...</much_longer_file>

HTML是下列之一:

<translate>{{ key }}</translate>
<much_longer_file>...</much_longer_file>

但的价值translate_initial

<translate>tag with <other_tag>some text</other_tag></translate>

而不是预期的

tag with <other_tag>some text</other_tag>

我知道可以使用正则表达式轻松提取它,但是我想要更多与DOM相关的解决方案。

维塔莉·马尔杜(Vitalie Maldur)

试试这个:

translate_bs4 = bs4_object.find('translate')
translate_initial = translate_bs4.decode_contents(formatter="html")

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用python beautiful soup从HTML下面获取标签和ID信息

Python:使用 Beautiful Soup 从 HTML 标签中提取图像源

如何使用Python Beautiful Soup获取html的标记名称?

Python抓取(Beautiful Soup)以从此HTML获取数据

Python 3 Beautiful Soup查找带有冒号的标签

使用Beautiful Soup获取所有HTML标签

Python Beautiful Soup提取HTML元数据

在python中使用Beautiful Soup解析html

python3下载Beautiful Soup中的最新链接

如何使用Python和Beautiful Soup修复html列表片段中缺少的ul标签

使用 Beautiful Soup Python 在 HTML 代码的 'img' 标签内打印 'id' 值

Beautiful Soup或Python请求库未检测到某些标签

Python Beautiful Soup:如何提取标签旁边的文本?

使用python检查孩子在Beautiful Soup 4中的标签

使用Python和Beautiful Soup如何捕获空标签

Beautiful Soup 正在引入不存在的标签 Python

无法使用Python的Beautiful Soup从特定的span标签提取文本

在 Python 中使用 Beautiful Soup 添加缺少的子标签

Python Beautiful Soup 4使用.select()获取子元素

使用 Beautiful Soup Python 获取没有属性的跨度文本

使用 Python 和 Beautiful Soup 从表中获取列

如何使用Beautiful Soup从HTML获取文本

Python Beautiful Soup-基于HTML中的文本寻找价值

在 Beautiful Soup 中使用 Python 字典修改 HTML 元素

如何使用Beautiful Soup在html页面中的两个标签之间获取内容?

Python/Requets/Beautiful Soup 基本刮痧

Python Beautiful Soup无法找到表格

使用Beautiful Soup Python进行Web抓取

Web抓取python的Beautiful-soup