熊猫将多索引与另一列相乘

命运的选择

假设我有一个看起来像这样分组的框架。

                                                  q_n   q_N       q_f
level_id year   level_name       question value                      
0        2020   Level_1          q1_1     1.0     0.0  82.0  0.000000
                                          2.0     0.0  82.0  0.000000
                                          3.0     3.0  82.0  0.036585
                                          4.0    33.0  82.0  0.402439
                                          5.0    46.0  82.0  0.560976
                                 q1_2     1.0     1.0  82.0  0.012195
                                          2.0     4.0  82.0  0.048780
                                          3.0    11.0  82.0  0.134146
                                          4.0    34.0  82.0  0.414634
                                          5.0    32.0  82.0  0.390244

我想为每个组计算一个平均值，所以每个组内的value时间q_n和它们的总和除以q_N（组内的每一行都应该得到相同的平均值）。

我尝试做这样的事情：

df['q_m'] = ((df['q_n']*df.index.get_level_values('value')) / (df['q_n'].groupby(['year', 'level_name', 'question']).transform('sum')))

但是该部门的上限没有得到适当的总结。如何能够做到一列q_m，对于q1_1有每行4.52每一行和4.12 q1_2？

用于检测：

df.reset_index().to_records()

rec.array([(0, 0, 2020., 'level_1', 'q1_1', 1.,  0., 82., 0.        , 0.        ),
           (1, 0, 2020., 'level_1', 'q1_1', 2.,  0., 82., 0.        , 0.        ),
           (2, 0, 2020., 'level_1', 'q1_1', 3.,  3., 82., 0.03658537, 0.1097561 ),
           (3, 0, 2020., 'level_1', 'q1_1', 4., 33., 82., 0.40243902, 1.6097561 ),
           (4, 0, 2020., 'level_1', 'q1_1', 5., 46., 82., 0.56097561, 2.80487805),
           (5, 0, 2020., 'level_1', 'q1_2', 1.,  1., 82., 0.01219512, 0.01219512),
           (6, 0, 2020., 'level_1', 'q1_2', 2.,  4., 82., 0.04878049, 0.09756098),
           (7, 0, 2020., 'level_1', 'q1_2', 3., 11., 82., 0.13414634, 0.40243902),
           (8, 0, 2020., 'level_1', 'q1_2', 4., 34., 82., 0.41463415, 1.65853659),
           (9, 0, 2020., 'level_1', 'q1_2', 5., 32., 82., 0.3902439 , 1.95121951)],
          dtype=[('index', '<i8'), ('level_id', '<i8'), ('year', '<f8'), ('level_name', 'O'), ('question', 'O'), ('value', '<f8'), ('q_n', '<f8'), ('q_N', '<f8'), ('q_f', '<f8'), ('q_m', '<f8')])

df.to_dict()

{'q_n': {(0, 2020.0, 'Level_1', 'q1_1', 1.0): 0.0,
  (0, 2020.0, 'Level_1', 'q1_1', 2.0): 0.0,
  (0, 2020.0, 'Level_1', 'q1_1', 3.0): 3.0,
  (0, 2020.0, 'Level_1', 'q1_1', 4.0): 33.0,
  (0, 2020.0, 'Level_1', 'q1_1', 5.0): 46.0,
  (0, 2020.0, 'Level_1', 'q1_2', 1.0): 1.0,
  (0, 2020.0, 'Level_1', 'q1_2', 2.0): 4.0,
  (0, 2020.0, 'Level_1', 'q1_2', 3.0): 11.0,
  (0, 2020.0, 'Level_1', 'q1_2', 4.0): 34.0,
  (0, 2020.0, 'Level_1', 'q1_2', 5.0): 32.0},
 'q_N': {(0, 2020.0, 'Level_1', 'q1_1', 1.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_1', 2.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_1', 3.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_1', 4.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_1', 5.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_2', 1.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_2', 2.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_2', 3.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_2', 4.0): 82.0,
  (0, 2020.0, 'Level_1', 'q1_2', 5.0): 82.0},
 'q_f': {(0, 2020.0, 'Level_1', 'q1_1', 1.0): 0.0,
  (0, 2020.0, 'Level_1', 'q1_1', 2.0): 0.0,
  (0, 2020.0, 'Level_1', 'q1_1', 3.0): 0.036585365853658534,
  (0, 2020.0, 'Level_1', 'q1_1', 4.0): 0.4024390243902439,
  (0, 2020.0, 'Level_1', 'q1_1', 5.0): 0.5609756097560976,
  (0, 2020.0, 'Level_1', 'q1_2', 1.0): 0.012195121951219513,
  (0, 2020.0, 'Level_1', 'q1_2', 2.0): 0.04878048780487805,
  (0, 2020.0, 'Level_1', 'q1_2', 3.0): 0.13414634146341464,
  (0, 2020.0, 'Level_1', 'q1_2', 4.0): 0.4146341463414634,
  (0, 2020.0, 'Level_1', 'q1_2', 5.0): 0.3902439024390244},
 'q_m': {(0, 2020.0, 'Level_1', 'q1_1', 1.0): 0.0,
  (0, 2020.0, 'Level_1', 'q1_1', 2.0): 0.0,
  (0, 2020.0, 'Level_1', 'q1_1', 3.0): 0.10975609756097561,
  (0, 2020.0, 'Level_1', 'q1_1', 4.0): 1.6097560975609757,
  (0, 2020.0, 'Level_1', 'q1_1', 5.0): 2.8048780487804876,
  (0, 2020.0, 'Level_1', 'q1_2', 1.0): 0.012195121951219513,
  (0, 2020.0, 'Level_1', 'q1_2', 2.0): 0.0975609756097561,
  (0, 2020.0, 'Level_1', 'q1_2', 3.0): 0.4024390243902439,
  (0, 2020.0, 'Level_1', 'q1_2', 4.0): 1.6585365853658536,
  (0, 2020.0, 'Level_1', 'q1_2', 5.0): 1.951219512195122}}

广黄

似乎您转换了错误的系列：

df['q_m'] = ((df['q_n']*df.index.get_level_values('value'))
     .groupby(['year','level_name','question'])
     .transform('sum')
     .div(df['q_N'])
)

输出：

                                            q_n   q_N       q_f       q_m
level_id year   level_name question value                                
0        2020.0 Level_1    q1_1     1.0     0.0  82.0  0.000000  4.524390
                                    2.0     0.0  82.0  0.000000  4.524390
                                    3.0     3.0  82.0  0.036585  4.524390
                                    4.0    33.0  82.0  0.402439  4.524390
                                    5.0    46.0  82.0  0.560976  4.524390
                           q1_2     1.0     1.0  82.0  0.012195  4.121951
                                    2.0     4.0  82.0  0.048780  4.121951
                                    3.0    11.0  82.0  0.134146  4.121951
                                    4.0    34.0  82.0  0.414634  4.121951
                                    5.0    32.0  82.0  0.390244  4.121951

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-15

我来说两句

0 条评论

登录后参与评论

熊猫将多索引与另一列相乘

熊猫将多索引与另一列相乘

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接