感谢有关如何根据熊猫中的倍数列表对给定的多列进行排序的任何提示,如下所示
import pandas as pd
sort_a=['a','d','e']
sort_b=['s1','s3','s6']
sort_c=['t1','t2','t3']
df=pd.DataFrame(zip(['a', 'e', 'd','a','a','d','e'], ['s3', 's1', 's6','s6','s3','s3','s1'], ['t3', 't2', 't1','t2','t2','t3','t3']),columns=["a", "b", "c"])
与排序列,也就是说,a
,c
,d
这个想法就像 sort
df.sort(['a', 'c', 'd'], ascending = [sort_a, sort_c, sort_b])
预期输出
a b c
a s3 t2
a s3 t3
a s6 t2
d s3 t3
d s6 t1
e s1 t2
e s1 t3
一种选择是为每一列创建类别并排序:
categories = {col : pd.CategoricalDtype(categories=cat, ordered=True)
for col, cat
in zip(df.columns, [sort_a, sort_b, sort_c])}
df.astype(categories).sort_values([*df.columns])
a b c
0 a s3 t3
2 d s6 t1
1 e s1 t2
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句