用于检查推文中是否存在标签的正则表达式

畅通无阻

我想检查以下推文中是否同时存在hashtag#python#confhashtag:

tweets = ['conferences you would like to attend #python #conf',
          'conferences you would like to attend #conf #python']

我已经尝试过下面的代码,但是与推文不匹配。

import re
for tweet in tweets:
    if re.search(r'^(?=.*\b#python\b)(?=.*\b#conf\b).*$', tweet):
        print(tweet)

如果我#从正则表达式中删除符号,则两个推文都匹配,但也将匹配带有非标签pythonconf单词的推文

虚假的

\b在单词的开头或结尾匹配。#根据re模块文档不被视为单词

\b

匹配空字符串,但仅在单词的开头或结尾处匹配。单词定义为字母数字或下划线字符的序列,因此单词的结尾由空格或非字母数字的非下划线字符指示。请注意,形式上,\ b定义为\ w和\ W字符之间的边界(反之亦然)或\ w与字符串的开头/结尾之间的边界

尝试遵循以下正则表达式(^.*$是不必要的):

(?=.*#python\b)(?=.*#conf\b)

>>> tweets = ['conferences you would like to attend #python #conf',
...           'conferences you would like to attend #conf #python',
...           'conferences you would like to attend #conf #snake']
>>>
>>> import re
>>> for tweet in tweets:
...     if re.search(r'(?=.*#python\b)(?=.*#conf\b)', tweet):
...         print(tweet)
...
conferences you would like to attend #python #conf
conferences you would like to attend #conf #python

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

是否存在用于检测有效正则表达式的正则表达式?

检查是否存在与正则表达式匹配的数组键

用于检查字符串是否仅包含零的正则表达式

熊猫数据框使用正则表达式检查值是否存在

正则表达式用于修剪标签周围的空白

构建用于密码检查的正则表达式

使用正则表达式从推文中提取主题标签的更快方法

SQL正则表达式检查JSON数组中是否存在至少一项

Ruby,使用正则表达式检查数组中是否存在项目

Presto / MySQL-用于检查列值是否为字母数字的正则表达式

用于检查条件语句python的正则表达式

用于检查字符串中是否存在一个或多个特殊字符的正则表达式

用于检查单元格内容是否与格式匹配的公式,正则表达式?

用于检查URL的条件正则表达式

用于检查是否在2个范围内找到IP的正则表达式

正则表达式。检查N个字符组中是否存在特定字符

正则表达式,用于在标签内输入属性

PHP正则表达式,用于检查MM / DD是否在适当范围内

正则表达式用于HTML标签内的文本

Python正则表达式:是否存在用于搜索多个模式出现的符号?

Javascript-使用正则表达式检查某个数组键是否存在

用于在标签后匹配文本的正则表达式

用于检查文件类型的正则表达式

使用正则表达式检查是否存在新行

用于检查 JavaScript 输入是否为特定格式的正则表达式?

用于插入 span 标签的正则表达式

正则表达式 - 检查是否存在但不包含它

正则表达式检查句子中是否存在特定的多个单词

正则表达式计算推文中的公司主题标签(例如 $SPY)