如何检查字符串列表中的字符串是否在pandas dataframe列中

dls

我正在做文本分析。我的任务是计算列表中每个“坏词”出现在数据框列中的字符串中的次数。我能想到的是使用.isin().contains()逐字检查。但是单词列表的长度超过40000。因此循环将太慢。有一个更好的方法吗?

戈洛米

尽管您说循环可能太慢,但由于列表的范围,它似乎是最有效的方法。试图使其尽可能简单。可以根据您的需要随意修改打印语句。

text = 'Bad Word test for Terrible Word same as Horrible Word and NSFW Word and Bad Word again'
bad_words = ['Bad Word', 'Terrible Word', 'Horrible Word', 'NSFW Word']

length_list = []

for i in bad_words:
    count = text.count(i)
    length_list.append([i, count])


print(length_list)

输出:

[['Bad Word', 2], ['Terrible Word', 1], ['Horrible Word', 1], ['NSFW Word', 1]]

另外,您的输出作为字符串可以是:

length_list = []

for i in bad_words:
    count = text.count(i)
    print(i + ' count: ' + str(count))

输出:

Bad Word count: 2
Terrible Word count: 1
Horrible Word count: 1
NSFW Word count: 1

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

检查字符串列表中的字符串是否在Pandas DataFrame列中

如何检查字符串列表中的任何字符串是否是字符串的子字符串?

如何检查字符串列表及其索引中是否存在特定字符串

Spring Expression Language检查字符串列表中是否包含字符串

检查字符串列表的所有元素是否在字符串中的最快方法

检查字符串列表中是否出现字符串的最短方法

使用powershell检查字符串列表中是否存在字符串

Python:检查字符串列表中的字符串是否不包含变量

如何检查字符串是否以Java中的字符串列表中的任何条目结尾

如何检查字符串是否存在于 Gatling Scala 的字符串列表中

检查字符串是否为字符串列表中的子字符串的最快方法

检查字符串是否不包含Python中子字符串列表中的任何子字符串

如何检查字符串是否在pandas DataFrame中较长的字符串中?

如何用Groovy检查字符串是否是字符串列表中任何字符串的一部分?

如何检查字符串列表中是否存在字符并返回特定值?

如何检查字符串列表中的多个单词?

如何检查字符串是否具有列表中的子字符串?

如何检查字符串是否包含列表中的字符串?

检查字符串列表中的所有字符串在Inno Setup中是否都相同

检查字符串是否遵循python正则表达式中的特定字符串列表

检查字符串列表中是否有另一个字符串

Dart检查字符串列表中的一部分字符串是否包含元素

如何检查一行是否包含字符串列表中的特定字符串?

如何检查字符串列表中的特定单词是否包含在字符串中,但不应包含在其他任何单词之间?

检查字符串列表中的字符

检查字符串中是否存在列表元素

检查字符串中是否包含单词列表

用python检查字符串是否在列表中

检查字符串是否在列表中