在关键字之间找到字符串的一部分

瑞安·布罗曼(Ryan Broman)

因此,我的代码从URL检索HTML文件并将其另存为文本文档。

urllib.urlretrieve("http://www.testlink.com", "example.txt")
retrieve = open("example.txt", "r")

然后,我希望它从包含关键字的行中提取特定文本。该字符串如下所示:

<b class="whb">This is the text I want to retrieve</b> This is additional text that I don't want.

目前,我的代码显示ENTIRE行,如下所示:

for line in retrieve.readlines():
    if '<b class="whb">' in line:
        print line

如何指定要打印的行的哪一部分?我想要介于b class =“ whb”和/ b之间的内容。

谢谢你。

豪尔赫

正如我在评论中所说,我将使用BeautifulSoup这是一个小例子:

from bs4 import BeautifulSoup

html_doc = "<b class='whb'>This is the text I want to retrieve</b> This is additional text that I don't want."

soup = BeautifulSoup(html_doc, 'html.parser')

print soup.b.text

如果您有一个html_doc带有多个<b>标签的较大HTML文档,则可以将最后一行替换为:

print soup.find("b", {"class":"whb"}).text

如果html_doc有多个<b class='whb'>选项卡,而您想全部使用,则使用findAll()

all_bs = [b.text for b in soup.findAll("b", {"class":"whb"})]

BeautifulSoup是功能强大的功能强大的网络抓取工具。阅读文档以找到您在特定情况下需要的东西。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如果字符串的开头以关键字开头,则输出字符串的一部分

在TypeScript中使用关键字regex获取字符串的一部分

PHP在关键字前后提取字符串的一部分,然后替换除关键字之外的所有内容

如何找到子字符串字符串的一部分

matlab函数替换已知字符之间的字符串的最后一部分

PDO 全文搜索 - 即使字符串中的关键字的一部分在 db 列中也能获得结果

PHP提取字符串的一部分(如果找到)

如何使用preg_match提取找到的字符串的一部分?

如何找到字符串的一部分并将其回显?

删除字符串的一部分

替换字符串的一部分

选择字符串的一部分

隔离字符串的一部分

反转字符串的一部分

Lexer将标识符的一部分识别为关键字

Google Apps脚本,用于删除包含关键字一部分的行

在Java中的索引之间替换字符串的一部分

字符串的一部分制作等于串的另一部分

更改仅知道字符串一部分的数组中值的一部分

Java-提取两个特殊字符之间的字符串的一部分

Javascript - 提取位于两个特殊字符之间的字符串的一部分

获取在PHP中两个特定字符之间的字符串的一部分

字符串的一部分与字典键字符串匹配

C在字符串中获取一部分字符串

MySQL选择带\的字符串-字符串是IN()的一部分

在子字符串之后删除字符串的一部分

获取包含给定子字符串的字符串的一部分

遍历字符串时消耗一部分字符串

在字符串数组中查找字符串的一部分