Pivot将Pandas DataFrame融化回宽视角？

艾莉森LT

我有一个类似于以下内容的DataFrame调用df：（其中所有值都是字符串）：

        id        type       variable
---------------------------------------------
         A         a          item_1
         A         a          item_2
         A         a          item_3
         A         b          item_4
         A         b          item_5
         A         b          item_6
         A         c          item_7
         A         c          item_8
         A         c          item_9

我想将其转换为：

type  a                     |b                       |c
id
------------------------------------------------------------------------------

A     item_1|item_2|item_3 | item_4 | item_5 |item_6| item_7 |item_8 | item_9

基本上，我想将列type并variable安排在多层列中。这显然是一个快照，但基本上我对每个9个不同的值id在df

我尝试了以下代码：

df.pivot(index = 'id', columns = 'type', values = 'variable')

但是出现以下错误：

ValueError: Index contains duplicate entries, cannot reshape

我敢肯定有一个相当简单的解决方案，我只是没有想到！我将不胜感激任何帮助。谢谢

BEN_YO

cumcount在此处创建一个帮助键（通过使用）以消除错误Index contains duplicate

df.assign(helpkey=df.groupby('type').cumcount()).set_index(['id','type','helpkey']).variable.unstack([-2,-1])
Out[138]: 
type          a                       b                       c          \
helpkey       0       1       2       0       1       2       0       1   
id                                                                        
A        item_1  item_2  item_3  item_4  item_5  item_6  item_7  item_8   
type             
helpkey       2  
id               
A        item_9

我们也可以使用 crosstab

pd.crosstab(index=df.id,columns=[df.type,df.groupby('type').cumcount()],values=df.variable,aggfunc='sum')
Out[144]: 
type        a                       b                       c                
col_1       0       1       2       0       1       2       0       1       2
id                                                                           
A      item_1  item_2  item_3  item_4  item_5  item_6  item_7  item_8  item_9

或pivot_table：

df.assign(helpkey=df.groupby('type').cumcount()).pivot_table(index='id',columns=['type','helpkey'],values='variable', aggfunc='sum')

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-29

我来说两句

0 条评论

登录后参与评论

上一篇：使用bash，sed或awk将三行或更多行改为两行

Python Pandas Dataframe融化

Pivot Pandas Dataframe添加列

转换Pandas DataFrame：Un Pivot

重置从groupby或pivot创建的pandas DataFrame的索引？

python pandas dataframe groupby或pivot_table

Python Pandas DataFrame融化多索引多层次

如何最好地使用pandas.DataFrame.pivot？

将pandas宽列重塑为长

如何将列名作为标识符融化 pd.dataframe？

在没有pd.pivot的情况下将熊猫数据帧从长到宽

使用 reshape () 和 pivot_long() 将宽数据转换为长数据时出错

与Python Pandas融化相反

将Pandas Dataframe写入MySQL

将Pandas DataFrame写入MySQL

Python Pandas Pivot - 将 Aggc 列值更改为行

将 Pandas pivot_table 函数转换为 Polars pivot 函数

融化熊猫DataFrame

如何融化Spark DataFrame？

如何用小时列融化pandas.DataFrame并以15分钟为间隔进行划分

使用 Pandas 将数据帧从长转换为宽

将pandas df从长到宽转换为稀疏矩阵

使用 Pandas 将列作为日期从长到宽

Pandas Groupby将ndarrays的嵌套数组分配回dataframe

将Pandas DataFrame转换为单行DataFrame

如何使用Group by，Pivot_table，Stack和Unstack重塑Pandas Dataframe

在当前语言环境编码中，将一个宽字符从stdin回传到stdout

将Pandas多索引DataFrame与Singleindexed Pandas DataFrame合并

将融化的桌子改回桌子

将API转换为Pandas DataFrame

TOP 榜单

文章

Pivot将Pandas DataFrame融化回宽视角？

Pivot将Pandas DataFrame融化回宽视角？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局