我可以使用正则表达式(例如#APPL)计算推文中标签的数量。
import re
from collections import Counter
def count_tags(tweet):
pattern = '#[A-Za-z0-9]+'
return len(re.findall(pattern,tweet))
print(count_tags('#TSLA #APPL #FB up today.'))
>>> 3
但我似乎无法使用相同的代码来计算股票标签的数量(例如 $AAPL)?
import re
from collections import Counter
def count_tags(tweet):
pattern = '$[A-Za-z0-9]+'
return len(re.findall(pattern,tweet))
print(count_tags('$TSLA $APPL $FB up today.'))
>>> 0
因为,$
是一个正则表达式符号,表示字符串的结尾,所以你需要转义你的 $ 符号:
\$[A-Za-z0-9]+
修改来源:
import re
from collections import Counter
def count_tags(tweet):
pattern = '\$[A-Za-z0-9]+'
return len(re.findall(pattern,tweet))
print(count_tags('$TSLA $APPL $FB up today.'))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句