Pandas pivot_table：“合并”列值

基督教

假设我有下表：

from datetime import datetime
import pandas as pd

d = [[datetime(year=2021, month=1, day=1, minute=5), "A", "new", 3],
     [datetime(year=2021, month=1, day=1, minute=5), "B", "new", 6],
     [datetime(year=2021, month=1, day=1, minute=5), "C", "new", 7],
     [datetime(year=2021, month=1, day=1, minute=15), "A", "old", 6],
     [datetime(year=2021, month=1, day=1, minute=15), "B", "old", 2],
     [datetime(year=2021, month=1, day=1, minute=15), "C", "old", 14],
    ]

df = pd.DataFrame(data=d, columns=["Time", "Article", "Status", "Qty"])

我想重组这些数据，每个“时间”值都有一行，然后对于每篇文章都有“数量”和“状态”列。

这我几乎可以使用pivot_table实现，如下所示：

pd.pivot_table(data=df, index=["Time"], columns=["Article"], values=["Status", "Qty"], aggfunc="last")

这为我产生以下输出：

	数量			地位
文章	一种	乙	C	一种	乙	C
时间
2021-01-01 00:05:00	3	6	7	新的	新的	新的
2021-01-01 00:15:00	6	2	14	老的	老的	老的

但是，我希望这按文章分组，而不是按值列分组。所以就像它会由以下代码生成：

arrays = [
    ["A", "A", "B", "B", "C", "C", "qux", "qux"],
    ["Qty", "Status", "Qty", "Status", "Qty", "Status"],
]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=["Article", "Value"])
data_pivot=[
    [3, "new", 6, "new", 6, "new"],
    [6, "old", 2, "old", 14, "old"]
]
pd.DataFrame(data=data_pivot, columns=index, index=[datetime(year=2021, month=1, day=1, minute=5), datetime(year=2021, month=1, day=1, minute=15)])

文章	一种		乙		C
价值	数量	地位	数量	地位	数量	地位
2021-01-01 00:05:00	3	新的	6	新的	6	新的
2021-01-01 00:15:00	6	老的	2	老的	14	老的

简单地在 pivot_table-call 中切换 values- 和 columns- 关键字也没有给我预期的输出。

不幸的是，我在命名这个问题时遇到了麻烦，所以我很难找到现有的解决方案（因此，这个问题的标题可能很奇怪），所以如果这已经被问过很多次，我很抱歉。

耶斯列

使用DataFrame.swaplevel有DataFrame.sort_index：

df = df.swaplevel(1,0,axis=1).sort_index(axis=1)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-16

我来说两句

0 条评论

登录后参与评论

上一篇：Angular，当用户单击按钮或多次提交时如何处理？

Pandas pivot_table 列标题顺序

Pandas pivot_table 力列结构？

Pandas pivot_table：定义列

Python Pandas pivot_table - 一列中的值计数

使用pivot_table时NaN列pandas变成空行

Pandas NaN由pivot_table引入

python pandas dataframe groupby或pivot_table

Python Pandas pivot_table：意外结果

如何使用pandas从一个带有pivot_table的列中创建列

如何将pandas pivot_table中的值与不同的索引进行比较？

Pandas Pivot_Table：非数字值的行计算百分比

如何在pandas中的pivot_table之后获取多级索引的列？

Python Pandas Pivot_Table列一级错误名称

Python PANDAS：pivot_table在同一级别上是否包含多个列？

Pandas中pivot_table时设置多级列的层次结构

pivot_table: pandas - 如何转换数据框和访问列的数据透视输出？

Pandas pivot_table 將行重新排列為列

Pandas pivot_table 在适当的层次结构中重新排列列

如何在python中合併來自pandas的pivot_table的兩列？

DASK Pivot_Table和Pandas Pivot_Table Python之间的区别

Python Pandas Pivot_Table多个时间索引

使用 Pandas 分组、转置或什至 pivot_table

Pandas `pivot_table` 使用 `decimal.Decimal` 類型

如何在pivot_table聚合后映射pandas结果？

如何在Pandas Pivot_table中填充索引

pandas - 保留顺序时的 pivot_table 失败

提高 Pandas pivot_table 中的谐波平均效率

Pandas pivot_table 日期时间顺序错误

手动设置索引顺序时，手动设置pivot_table（Pandas plot）中的列顺序

TOP 榜单

文章

Pandas pivot_table：“合并”列值

Pandas pivot_table：“合并”列值

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID