在关键字之间找到字符串的一部分

瑞安·布罗曼（Ryan Broman）

因此，我的代码从URL检索HTML文件并将其另存为文本文档。

urllib.urlretrieve("http://www.testlink.com", "example.txt")
retrieve = open("example.txt", "r")

然后，我希望它从包含关键字的行中提取特定文本。该字符串如下所示：

<b class="whb">This is the text I want to retrieve</b> This is additional text that I don't want.

目前，我的代码显示ENTIRE行，如下所示：

for line in retrieve.readlines():
    if '<b class="whb">' in line:
        print line

如何指定要打印的行的哪一部分？我想要介于b class =“ whb”和/ b之间的内容。

谢谢你。

豪尔赫

正如我在评论中所说，我将使用BeautifulSoup。这是一个小例子：

from bs4 import BeautifulSoup

html_doc = "<b class='whb'>This is the text I want to retrieve</b> This is additional text that I don't want."

soup = BeautifulSoup(html_doc, 'html.parser')

print soup.b.text

如果您有一个html_doc带有多个<b>标签的较大HTML文档，则可以将最后一行替换为：

print soup.find("b", {"class":"whb"}).text

如果html_doc有多个<b class='whb'>选项卡，而您想全部使用，则使用findAll()：

all_bs = [b.text for b in soup.findAll("b", {"class":"whb"})]

BeautifulSoup是功能强大的功能强大的网络抓取工具。请阅读文档以找到您在特定情况下需要的东西。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-04-4

我来说两句

0 条评论

登录后参与评论

如果字符串的开头以关键字开头，则输出字符串的一部分

在TypeScript中使用关键字regex获取字符串的一部分

PHP在关键字前后提取字符串的一部分，然后替换除关键字之外的所有内容

如何找到子字符串字符串的一部分

matlab函数替换已知字符之间的字符串的最后一部分

PDO 全文搜索 - 即使字符串中的关键字的一部分在 db 列中也能获得结果

PHP提取字符串的一部分（如果找到）

如何使用preg_match提取找到的字符串的一部分？

如何找到字符串的一部分并将其回显？

删除字符串的一部分

替换字符串的一部分

选择字符串的一部分

隔离字符串的一部分

反转字符串的一部分

Lexer将标识符的一部分识别为关键字

Google Apps脚本，用于删除包含关键字一部分的行

在Java中的索引之间替换字符串的一部分

字符串的一部分制作等于串的另一部分

更改仅知道字符串一部分的数组中值的一部分

Java-提取两个特殊字符之间的字符串的一部分

Javascript - 提取位于两个特殊字符之间的字符串的一部分

获取在PHP中两个特定字符之间的字符串的一部分

字符串的一部分与字典键字符串匹配

C在字符串中获取一部分字符串

MySQL选择带\的字符串-字符串是IN（）的一部分

在子字符串之后删除字符串的一部分

获取包含给定子字符串的字符串的一部分

遍历字符串时消耗一部分字符串

在字符串数组中查找字符串的一部分

TOP 榜单

文章

在关键字之间找到字符串的一部分

在关键字之间找到字符串的一部分

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID