在熊猫分组中排序（多索引）

Jbachlombardo

编辑：放入样本数据df和预期的输出。编辑2：我对数据进行了一些修改，以使结果在每种情况下都不都是与“ cc”相关联的最大数字。

我的问题是：

我有一个数据框，其中有两个索引列，分别按（索引1，索引2）和三个列（X，Y，Z）分组
我创建了一个groupby并对其应用了一个函数（将groupby对象中的所有列缩放为1）
我对结果数据框求和，以获得每一行的总和

df为：

df = pd.DataFrame({'Index1': ['A', 'A', 'A', 'B', 'B', 'B'],
                'Index2': ['aa', 'bb', 'cc', 'aa', 'bb', 'cc'],
                'X': [1, 2, 7, 3, 6, 1],
                'Y': [2, 3, 6, 2, 4, 1],
                'Z': [3, 5, 9, 1, 2, 1]})

然后代码是：

df_scored = pd.DataFrame()   #new df to hold results
cats = [X, Y, Z]             #categories (columns of df) to be scaled
grouped = df.groupby([Index 1, Index 2]).sum()
for cat in cats :
    df_scored[cat] = grouped.groupby(level = 0)[cat].apply(lambda x: x / x.max())
df_scored['Score'] = df_scored.sum(axis = 1)

这将产生：

                      X         Y         Z     Score
Index1 Index2                                        
A      aa      0.142857  0.333333  0.333333  0.809524
       bb      0.285714  0.500000  0.555556  1.341270
       cc      1.000000  1.000000  1.000000  3.000000
B      aa      0.500000  0.500000  0.500000  1.500000
       bb      1.000000  1.000000  1.000000  3.000000
       cc      0.166667  0.250000  0.500000  0.916667

现在，我想按索引1的每个分组对结果df_scored排序（以便索引2在索引1的每个组内按“分数”排序），并以此作为所需结果：

                      X         Y         Z     Score
Index1 Index2                                        
A      cc      1.000000  1.000000  1.000000  3.000000
       bb      0.285714  0.500000  0.555556  1.341270
       aa      0.142857  0.333333  0.333333  0.809524
B      bb      1.000000  1.000000  1.000000  3.000000
       aa      0.500000  0.500000  0.500000  1.500000
       cc      0.166667  0.250000  0.500000  0.916667

我该怎么做呢？

我在这里和这里都已经看到了其他一些问题，但是在这种情况下却没有使它对我有用。

社交病

在代码末尾添加

df_scored.sort_values('Score', ascending= False).sort_index(level='Index1', sort_remaining=False)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-27

我来说两句

0 条评论

登录后参与评论

上一篇：是否可以将自定义视图添加到您无法访问项目文件的现有MVC站点？

熊猫多索引排序

熊猫多索引分组依据

熊猫中的多索引排序

熊猫分组并按索引计数排序

如何对熊猫进行多索引分组？

熊猫多索引平均和分组

用两列在大熊猫分组中排序

按日期分组不能在熊猫中排序？

如何正确排序多索引熊猫DataFrame

对多索引熊猫数据框进行排序

在熊猫中交换/排序多索引列

重新排序多索引熊猫数据框

熊猫多索引按与X不同的索引值分组

在熊猫中排序

根据特定索引对多索引熊猫数据框进行排序

筛选多索引分组大熊猫数据框

如何在熊猫多索引中按小时分组

熊猫数据框多索引和分组依据

对多索引数据透视表熊猫进行排序

熊猫多索引嵌套排序和百分比

将多索引排序到完整深度（熊猫）

在熊猫的多索引级别内按列排序

如何自定义排序熊猫多索引？

每组对熊猫多索引进行一次排序

从熊猫数据透视表重新排序多索引中的级别？

在python熊猫中排序行

python熊猫分组排序

熊猫分组索引

按熊猫分组索引

TOP 榜单

文章

在熊猫分组中排序（多索引）

在熊猫分组中排序（多索引）

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局