将数据框中的组除以单独组的中位数

斯科特·沃沙尔

我有一个包含一列group_ID和class，多个数字功能以及一些字符元数据的数据框，即：

group_ID  class  var1  var2  var3  metadata
a         foo    1     324   3     cat
a         bar    1.3   34    53    dog
a         baz    31    34    5     elephant
b         foo    34    34    943   dolphin
b         bar    94    51    23    chipmunk
b         baz    985   595   43    badger
c         foo    43    93    23    tapir
c         bar    43    23    23    monkey
c         baz    40    53    512   duck

我想计算foo每个类别的中位数group_ID，然后将每行除以与匹配的中位数group_ID。

在此示例中，每行只有1行foo，因此中位数将与初始值相同，但实际上，每行class和都有许多行group_ID。

有没有简单的方法可以做到这一点？到目前为止，我最大的尝试是为中位数创建一个单独的数据foo框，然后按group_ID拆分并在一个可怕的循环中进行扫描，但最终我丢失了元数据列。这似乎是很常规的事情，所以我确定我丢失了一些东西。

任何帮助，将不胜感激。

蜡烛和橙色

我们可以用mutate_eachfromdplyr来除以条件。

library(dplyr)
df %>% group_by(group_ID) %>%
  mutate_each(funs(./median(.[class == "foo"])), var1:var3)
# Source: local data frame [9 x 6]
# Groups: group_ID
# 
#   group_ID class       var1       var2        var3 metadata
# 1        a   foo  1.0000000  1.0000000  1.00000000      cat
# 2        a   bar  1.3000000  0.1049383 17.66666667      dog
# 3        a   baz 31.0000000  0.1049383  1.66666667 elephant
# 4        b   foo  1.0000000  1.0000000  1.00000000  dolphin
# 5        b   bar  2.7647059  1.5000000  0.02439024 chipmunk
# 6        b   baz 28.9705882 17.5000000  0.04559915   badger
# 7        c   foo  1.0000000  1.0000000  1.00000000    tapir
# 8        c   bar  1.0000000  0.2473118  1.00000000   monkey
# 9        c   baz  0.9302326  0.5698925 22.26086957     duck

万一OP希望将它们添加为新/附加列并保持先前的数据不变，则可以将上述方法修改为：

df %>% 
  group_by(group_ID) %>%
  mutate_each(funs(./median(.[class == "foo"])), setNames(var1:var3, paste0("varN", 1:3)))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-1

我来说两句

0 条评论

登录后参与评论

上一篇：Windows 10上Visual Studio 2015 Community Edition的修复安装错误

获取熊猫数据框组的中位数

Python-pandas将NA替换为数据框中一组的中位数或均值

组中SQLITE的中位数

PySpark组中的中位数/分位数

如何根据组中位数更改数据中的值

将R中的组的中位数分别乘以条件

如何将数据框A中的每一列除以数据框B中同一列的中位数？

中位数在数据框中

在 R 中按组乘以中位数的值

组合场景以在 R 中按组替换中位数

计算 AWS Athena 表中每个组的中位数

如何计算R中组中位数之间的列差异

计算R中特定列组的观测值的中位数

找到一组数据的中位数并应用于该组的成员

熊猫数据框的中位数

使用字典将数字数据映射到 Pandas 数据框中的 bin 以用于单独的组

计算组内的移动中位数

基于长格式的组计算中位数

熊猫计算列上的组的中位数

如何将熊猫数据框的值除以第一行的每一组？

熊猫数据框将每个组的最大值除以一个函数

计算90％百分位数并用R中的组中位数代替

计算R中数据框中行和列的中位数

计算数据框中多列的中位数

熊猫获得高于组中位数的组数

枚举数据框中的组

如何在 R 中按组迭代地将数据框列中的所有先前观察除以最后一次观察，然后存储结果

将特定行插入数据框中的其他组

将功能应用于数据框中的每个组

TOP 榜单

文章

将数据框中的组除以单独组的中位数

将数据框中的组除以单独组的中位数

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序