将pandas df排序为单独的列

用户9394674

我想sort一pandas df成单独的columns基础上，当值columns的变化。对于df下面的内容，columns当值更改时，我可以将df分为几类Col B。但是，我试图添加，Col C以便在Col B和中值都更改时Col C。

import pandas as pd

df = pd.DataFrame({
        'A' : [10,20,30,40,40,30,20,10,5,10,15,20,20,15,10,5],
        'B' : ['X','X','X','X','Y','Y','Y','Y','X','X','X','X','Y','Y','Y','Y'],
        'C' : ['W','W','Z','Z','Z','Z','W','W','W','W','Z','Z','Z','Z','W','W'],                                         
        })

d = df['B'].ne(df['B'].shift()).cumsum()
df['C'] =  d.groupby(df['B']).transform(lambda x: pd.factorize(x)[0]).add(1).astype(str)
df['D'] = df.groupby(['B','C']).cumcount()
df = df.set_index(['D','C','B'])['A'].unstack([2,1])
df.columns = df.columns.map(''.join)

输出：

   X1  Y1  X2  Y2
D                
0  10  40   5  20
1  20  30  10  15
2  30  20  15  10
3  40  10  20   5

如您所见，column每次中有新值时，这都会创建一个新值Col B。但是我Col C也在尝试合并。因此应该每次都Col B和和都发生变化Col C。

预期输出：

   XW1  XZ1  YZ1  YW1  XW2  XZ2  YZ2  YW2
0   10   30   40   20    5   15   20   10
1   20   40   30   10   10   20   15    5

BEN_YO

只需根据您的需求一一创建帮助列。

df['key']=df.B+df.C# create the key
df['key2']=(df.key!=df.key.shift()).ne(0).cumsum() # make the continue key into one group
df.key2=df.groupby('key').key2.apply(lambda x : x.astype('category').cat.codes+1)# change the group number to 1 or 2 
df['key3']=df.groupby(['key','key2']).cumcount() # create the index for pivot
df['key']=df.key+df.key2.astype(str) # create the columns for pivot

df.pivot('key3','key','A')#yield  
Out[126]: 
key   XW1  XW2  XZ1  XZ2  YW1  YW2  YZ1  YZ2
key3                                        
0      10    5   30   15   20   10   40   20
1      20   10   40   20   10    5   30   15

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-5

我来说两句

0 条评论

登录后参与评论

上一篇：当找不到图片时，启动Spyder和JupyterNotebook会导致importError

将pandas df排序为单独的列

将pandas df排序为单独的列

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）