我有一个数据框,像这样的df
a b c
1 0 2
5 7 8
4 1 3
3 4 6
5 2 5
.......
现在我要用以下范围替换这些数据
0-3 = 1
4-6 = 2
7-9 = 3
列值小于10,因此范围在0-9之间。
我想将上述数据框值替换为范围类别,并且输出应如下所示
a b c
1 1 1
2 3 3
2 1 1
1 2 2
2 1 2
.......
因此,如果df中的任何值在0-3之内,则应替换为1;如果在4-6中的任何值,则将其替换为2,依此类推。我怎样才能做到这一点?
pd.cut
与apply
ie一起使用
df.apply(lambda x : pd.cut(x,[-1,3,6,9],labels=[1,2,3]))
abc 0 1 1 1 1 2 3 3 2 2 1 1 3 1 2 2 2 4 2 1 2
@coldspeed建议的非基于应用的解决方案:
pd.DataFrame(pd.cut(df.values.reshape(-1,),[-1,3,6,9],labels=[1,2,3]).codes.reshape(df.shape)+1,columns=df.columns)
要么
pd.DataFrame(pd.cut(np.hstack(df.values),[-1,3,6,9],labels=[1,2,3]).codes.reshape(df.shape)+1,columns=df.columns)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句