我想找到所有链接标题(使用 bs4 进行抓取)包含字符串:“新闻”或“报告”(标题包含两个词应该是结果)
我试过:
search = re.compile(r"news")
search1 = re.compile(r"reporting")
for text in box.find_all("p",text= search or search1):
#dosth
和
search = re.compile("news.+reporting")
for text in box.find_all("p",text= search or search1):
#dosth
但是这两个代码只返回与“新闻”匹配而不与“报道”匹配,所以想知道如何做到这一点?提前致谢!
你应该看看这样的东西
search = re.compile(r"reporting|news")
for text in box.find_all("p",text=search):
#dosth
注意|
字符,它or
在正则表达式中充当。的|
可用于or
任何任意的正则表达式的表达式和表达的基团。查看文档以获取更多信息。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句