正则表达式计算推文中的公司主题标签(例如 $SPY)

水晶关

我可以使用正则表达式(例如#APPL)计算推文中标签的数量。

import re
from collections import Counter

def count_tags(tweet):
    pattern = '#[A-Za-z0-9]+'
    return len(re.findall(pattern,tweet))

print(count_tags('#TSLA #APPL #FB up today.'))
>>> 3

但我似乎无法使用相同的代码来计算股票标签的数量(例如 $AAPL)?

import re
from collections import Counter

def count_tags(tweet):
    pattern = '$[A-Za-z0-9]+'
    return len(re.findall(pattern,tweet))

print(count_tags('$TSLA $APPL $FB up today.'))
>>> 0
莫斯托法·里兹万

因为,$是一个正则表达式符号,表示字符串的结尾,所以你需要转义你的 $ 符号:

\$[A-Za-z0-9]+

演示

修改来源:

import re
from collections import Counter

def count_tags(tweet):
    pattern = '\$[A-Za-z0-9]+'
    return len(re.findall(pattern,tweet))

print(count_tags('$TSLA $APPL $FB up today.'))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用正则表达式从推文中提取主题标签的更快方法

主题标签的正则表达式

用于检查推文中是否存在标签的正则表达式

通过正则表达式删除主题标签js

Python正则表达式获取推文中所有不是@mention或#hashtag的单词

在 RapidMiner 中使用正则表达式从推文中排除用户名

正则表达式组合标签

正则表达式替换标签

HTML标签的正则表达式

正则表达式的<a>标签列表

交叉标签的正则表达式

正则表达式提取公司名称

正则表达式从名称中删除公司类型

Laravel:使用正则表达式进行公司验证

使用正则表达式提取控股公司

Spyscope Java RuntimeException没有用于标签spy / p的读取器功能

带有表情符号的主题标签的Javascript正则表达式

使用正则表达式解析句子中的主题标签

主题标签会干扰正则表达式中的前瞻吗?

如何修复提及和主题标签的正则表达式?

正则表达式提取主题标签具有两个点分隔部件

用于在组中捕获主题标签的正则表达式

Flutter/Dart - 用于删除主题标签和空格的正则表达式?

为主题标签改进正则表达式以生成链接

用于检测没有特殊字符的主题标签的正则表达式字符串

正则表达式,以匹配从左到右和从右到左两种语言的主题标签

使用正则表达式从非ASCII字符串中提取主题标签

正则表达式不检测字符而不是空格后的主题标签

正则表达式匹配中英文主题标签