我有一个未排序的数据框。我想列进行排序A
,B
,C
和D
降序(从大到小),但是它们必须保持面额小组。例如,它应该排序列面额100 A
,B
,C
和D
所以因此行0,1,2变为0,2,1。
Index Denomination A B C D
0 100 5 0 0 0
1 100 0 0 1 0
2 100 0 2 0 0
3 200 5 2 0 0
4 200 5 0 1 0
5 200 0 4 0 0
6 200 10 0 0 0
7 200 0 2 1 0
8 200 0 0 2 0
排序级别的顺序必须是A
,B
,C
然后D
。重新标记Index
并不重要。结果数据框应为:
Index Denomination A B C D
0 100 5 0 0 0
2 100 0 2 0 0
1 100 0 0 1 0
6 200 10 0 0 0
3 200 5 2 0 0
4 200 5 0 1 0
5 200 0 4 0 0
7 200 0 2 1 0
8 200 0 0 2 0
这可以在excel中完成,方法是选择行,然后应用自定义排序,但是我需要使用数据框在python中完成。
这应该做到这一点:
df.sort_values(by=['Denomination', 'A', 'B', 'C', 'D'],
ascending=[True, False, False, False, False])
Out:
Denomination A B C D
0 100 5 0 0 0
2 100 0 2 0 0
1 100 0 0 1 0
6 200 10 0 0 0
3 200 5 2 0 0
4 200 5 0 1 0
5 200 0 4 0 0
7 200 0 2 1 0
8 200 0 0 2 0
按Denomination
升序排序;如果是平局,则按A
降序排序;如果是平局,则按B
降序排序,依此类推。
如果不对“名称”列进行排序,而应按组的出现顺序将其保留,则可以执行以下操作:
df.groupby('Denomination')['Denomination'].transform(pd.Series.first_valid_index)
Out:
0 0
1 0
2 0
3 3
4 3
5 3
6 3
7 3
8 3
Name: Denomination, dtype: int64
这将返回一个新列以跟踪组。您可以将此列添加到DataFrame中,并且可以具有最高优先级。
(df.assign(denomination_group =
df.groupby('Denomination')['Denomination'].transform(pd.Series.first_valid_index))
.sort_values(by=['denomination_group', 'A', 'B', 'C', 'D'],
ascending=[True, False, False, False, False])
.drop('denomination_group', axis=1))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句