熊猫:按范围对列值进行分类

asdfkjasdfjk

我有一个数据框,像这样的df

a  b  c
1  0  2
5  7  8
4  1  3
3  4  6
5  2  5
.......

现在我要用以下范围替换这些数据

0-3 = 1
4-6 = 2
7-9 = 3

列值小于10,因此范围在0-9之间。

我想将上述数据框值替换为范围类别,并且输出应如下所示

a  b  c
1  1  1
2  3  3
2  1  1
1  2  2
2  1  2
.......

因此,如果df中的任何值在0-3之内,则应替换为1;如果在4-6中的任何值,则将其替换为2,依此类推。我怎样才能做到这一点?

巴拉斯

pd.cutapplyie一起使用

df.apply(lambda x : pd.cut(x,[-1,3,6,9],labels=[1,2,3]))
   abc 
0 1 1 1 
1 2 3 3 
2 2 1 1 
3 1 2 2 2 
4 2 1 2

@coldspeed建议的非基于应用的解决方案:

pd.DataFrame(pd.cut(df.values.reshape(-1,),[-1,3,6,9],labels=[1,2,3]).codes.reshape(df.shape)+1,columns=df.columns)

要么

pd.DataFrame(pd.cut(np.hstack(df.values),[-1,3,6,9],labels=[1,2,3]).codes.reshape(df.shape)+1,columns=df.columns)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章