删除数据框中每一行列中字符串中的重复单词

加文·菲茨帕特里克(Gavin Fitzpatrick)

我正在尝试删除每行数据框中字符串中的重复单词。

说我的数据框看起来像这样:

In:
Yes Yes Absolutely
No No Nope   
Win Win Lose



  for row in df.iterrows():
        row["Sentence"] = (list(set(row["Sentence"])))

Desired Out:
Yes Absolutely
No Nope
Win Lose

如何清除每一行以删除重复的字符串。我已经尝试了上面的代码。

任何指向任何文档或资源的链接,如果可以引导我朝正确的方向前进,将不胜感激。谢谢。

ky

您可以使用(假设列名称为0):

from collections import OrderedDict
df[0].str.split().apply(lambda x: ','.join(OrderedDict.fromkeys(x).keys()))

0    Yes,Absolutely
1           No,Nope
2          Win,Lose

注意,您可以将set用作:

df[0].str.split().apply(lambda x: ','.join(list(set(x))))

但是set不能保证顺序。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

从数据框的每一行中删除日期时间字符串

为熊猫数据框的每一行替换一列中的字符串

如何从熊猫数据框中的列中的每一行中删除重复值

从另一数据框的一列中的另一个单词列表中删除数据框的一列中的每一行中的单词

根据列中的字符值删除数据框中的重复行之一

根据特定列中的指定字符串删除数据框中的行

从列数据框中的字符串中删除单词

如何在pyspark的数据框中的每一行中查找字符串

删除每一行中的字符串

删除数据框列(R)中的一部分字符串

为数据框中的每一行创建json字符串

使用R删除数据框中每一行的模式

在Python数据框中的每一行的两个子字符串之间选择字符串

如何根据数据框中的相似行(字符串)删除数据框的某些行

如何使用python计算数据帧中每一行中某些字符串/单词的出现

Python / Pandas:从列表中的字符串匹配中删除数据框中的行

根据其中一列中的子字符串删除数据帧的行

删除数据框中重复字符的行

从熊猫数据帧的每一行中的单词中删除多个字符组合

消除数据框中的重复行,并保留具有特定字符串值的行

根据列删除数据框中的行重复项

从Python数据框的一列中的每一行中删除前x个字符

删除数据框中任何向量中包含字符串的行

如何在pandas数据框中创建新列,并用不同的方式替换每一行中的一部分字符串?

如何从字符串中的每一行中删除最后一个逗号?

为熊猫数据框中的每一行从左侧提取子字符串到特定字符?

使用字符串中字符的位置来删除数据框列中的部分字符串

使用Regex Python删除数据框中字符串的前2个单词和后2个单词

从R中数据框的列中删除字符串中的某些单词