抑制r中data.frame的列中的重复值

丹尼斯语

我有一个简单的data.frame

mydf <- read.csv("mydf.csv")
mydf

                         SOC        Preferred.Term       Serious       Non.Serious
           cardiac disorders             dizziness             0                 0
           cardiac disorders    dizziness postural             0                 1
           cardiac disorders          palpitations             0                 0
           cardiac disorders              dyspnoea             0                 1
           cardiac disorders     oedema peripheral             0                 0
               eye disorders lacrimation increased             0                 3
               eye disorders              eye pain             0                 0
               eye disorders             mydriasis             0                 0
               eye disorders        vision blurred             0                 0
               eye disorders     visual impairment             0                 1
              oral disorders         dental caries             0                 0
              oral disorders        tooth fracture             0                 0

您可以看到标题为SOC的列有多个重复项。我想将其表示为一个表格,其中我仅在SOC列中显示任何唯一术语的第一个实例。换句话说,我希望表格看起来像这样:

                         SOC        Preferred.Term       Serious       Non.Serious
           cardiac disorders             dizziness             0                 0
                                dizziness postural             0                 1
                                      palpitations             0                 0
                                          dyspnoea             0                 1
                                 oedema peripheral             0                 0
               eye disorders lacrimation increased             0                 3
                                          eye pain             0                 0
                                         mydriasis             0                 0
                                    vision blurred             0                 0
                                 visual impairment             0                 1
              oral disorders         dental caries             0                 0
                                    tooth fracture             0                 0

是否有一种简单/快速的方法来修改我的data.frame以删除第一列中的重复项?

或者,R中是否有某种类型的演示文稿包可以创建一个表,以消除第一列中的重复项?

感谢您的任何建议。

27 ϕ 9

假设变量SOC已排序且具有类字符的简单方法

mydf$SOC[duplicated(mydf$SOC)] <- ""

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章