更改R中已过滤的data.frame中一列中的所有值

Mactilda

我的数据框架非常混乱,其中一列的值是人类可以理解的,但计算机却无法理解,有点像下面的内容。

df<-data.frame("id"=c(1:10), 
           "colour"=c("re d", ", red", "re-d","green", "gre, en", ", gre-en",  "blu e", "green", ", blue", "bl ue"))

我可以过滤df str_detect

df %>% filter(str_detect(tolower(colour), pattern = "gr")) 

但是我想将所有过滤后的结果重命名为相同的值,这样我就可以对其进行纠缠。
有什么建议?
我试图与模式分开,但未成功。

编辑:不是全部。和我正在使用的df中不需要空格。可以说,在组成的df中写入绿色的正确方法是“ gr。een”。

EDIT2:
想要的结果与伪造的颜色拼写只是为了获得一个主意:

id     colour
1      r. ed
2      r. ed
3      r. ed
4      gr. een
6      gr. een
7      gr. een
8      blu. e
9      gr. een           
10     blu. e
安东尼奥斯

您可以使用mgsub多个模式替换多个单词:

df<-data.frame("id"=c(1:10), 
               "colour"=c("re d", ", red", "re-d","green", "gre, en", 
                          ", gre-en",  "blu e", "green", ", blue", "bl ue"))

library(textclean)

df$colour = mgsub(df$colour, 
                  pattern =  c(".*gr.*", ".*re.*", ".*bl.*"), 
                  replacement =  c("gr. een", "r. ed", "blu. e"), fixed = F)

df

#     id  colour
# 1   1   r. ed
# 2   2   r. ed
# 3   3   r. ed
# 4   4 gr. een
# 5   5 gr. een
# 6   6 gr. een
# 7   7  blu. e
# 8   8 gr. een
# 9   9  blu. e
# 10 10  blu. e

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何获取Data Frame Python中除一列以外的所有列?

如何用起始值500更新oracle中一列的所有行并在oracle中递增

用R中的一列中的所有值对创建表,并计算唯一值

根据R中一列中的连续值有条件地插入行

将行插入到临时表中,其中一列没有重复值

SELECT在其中一列中具有指定值的行

如何在python中打印元组列表中一列的所有值?

R-无法计算data.frame中已过滤列的平均值

R汇总data.frame,其中一列中的日期和时间格式错误

删除其中一列中带有“ $-”的数据框中的所有行

SQL筛选一列中的所有值,但不在另一列中

删除熊猫数据框中所有元素的最佳方法是什么?其中一列中的值在另一列中存在多次。

将R中一列的所有整数相除

CQL(cassandra)-仅选择其中一列中具有最大值的行

使用VBA替换CSV文件中一列中的所有值

如果R中data.frame的一列中存在两个指定值,如何保留一组的所有行

带走数据框中一列中的所有先前值

将R中data.frame的每一列中的所有值求和

将一列的值与另一列中的所有值进行比较

查找其中一列属于同一值并且另一列满足SQL Server 2008中的条件的所有行

删除R中一列中字符后的所有内容

如何从同一列中获取所有值?

截断一列中的所有非数字值

如何获取sqlite3中一列的所有值?

过滤一列并在所有过滤行的另一列中插入值

检查 R data.frame 列在另一列中是否有相等的值

如何计算Google表格中一列单元格中的所有项目?

我如何在python中获取数据集中一列的所有记录的sigmoid?

合并在其中一列中具有共同值的行