如果句子中有重复的单词如何删除行

yanbiceps

我有一个清单

top = ['GME', 'MVIS', 'TSLA', 'AMC']

我有一个数据集

                            dt  ...                                               text
0       2021-03-19 20:59:49+06  ...  I only need TSLA TSLA TSLA TSLA to hit 20 eod to make up for a...
1       2021-03-19 20:59:51+06  ...                                 Oh this isn’t good
2       2021-03-19 20:59:51+06  ...  lads why is my account covered in more GME ...
3       2021-03-19 20:59:51+06  ...  I'm tempted to drop my last 800 into some TSLA...

所以我想要做的是检查句子中的行中是否包含超过 3 个单词,我想删除这一行

谢谢你的帮助

阿德里安

让我们编写一个函数来确定在给定的句子中是否有超过 3 个来自列表 "top" 的单词:

def check_words(sentence,top):
    words = sentence.split()
    count = 0
    for word in words :
        if word in top :
             count+=1
    return(count>3)

然后你想创建一个列 True/False 是否句子包含列表中的 3 个以上的单词。让我们使用熊猫数据框结构:

dataframe['Contains_3+_words'] = dataframe.apply(lambda r : check_words(r.text,top), axis=1)

然后我们只保留列表中没有包含 3 个以上单词的句子的行:

dataframe = dataframe[dataframe['Contains_3+_words']==False]]

此外,您可以删除我们创建的列:

dataframe.drop(['Contains_3+_words'], axis=1, inplace=True)      

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何删除在熊猫中有英语句子的行

如果多个列中的任何一个在Pandas中有重复的行,则删除行

如果字符串中有特定单词,如何从列表中删除字符串

如何删除要删除的句子末尾带有#或$的单词(Regex)

删除所有包含重复单词的行

如果句子中的所有单词均为小写,如何返回“是”?

从C中的句子中删除重复的单词

从文件中的句子中删除重复的单词

如果B列中有重复项,则删除整行

如果特定列中有重复值,则删除整行

删除笔画后如何删除单词,单词在文本文件中每个句子行

熊猫:如果句子包含同一行中其他列的单词,则删除行

如果搜索栏中有单词,如何禁用过渡?

如果数组中有重复值,则删除所有重复值

如何删除列中有“ - ”的行?

如何使用记事本++删除每一行上所有重复的单词?

有没有办法将值放在预设的句子上,如果有重复的单词,将其替换?

删除带有 2 个单词的重复行

选择其中有所选单词的句子

删除行中重复的单词

用PHP中的句子删除数组中的重复单词

删除行(如果有重复的行)

如何使用Awk删除行之间的重复单词

如何从文本句子中删除重复字符?

Give命令删除重复的行,但是重复的行在.txt文件中有一些变化

如何删除有点重复的行?

如果行在 python 中重复,则删除所有行

删除重复的行,如果包含所有相同的值

如果行中有特定的单词,我想隐藏特定的单元格