旋转两列数据框

current_panda

题

我有一个数据框 untidy

  attribute value
0       age    49
1       sex     M
2    height   176
3       age    27
4       sex     F
5    height   172

该'attribute'列中的值会定期重复。所需的输出是tidy

  age sex height
0  49   M    176
1  27   F    172

（行和列的顺序或其他标签无关紧要，我可以自己清理。）

实例化代码：

untidy = pd.DataFrame([['age', 49],['sex', 'M'],['height', 176],['age', 27],['sex', 'F'],['height', 172]], columns=['attribute', 'value'])
tidy = pd.DataFrame([[49, 'M', 176], [27, 'F', 172]], columns=['age', 'sex', 'height'])

尝试次数

这看起来像一个简单的枢轴操作，但是我的初始方法引入了NaN值：

>>> untidy.pivot(columns='attribute', values='value')                                                                                                       
attribute  age height  sex
0           49    NaN  NaN
1          NaN    NaN    M
2          NaN    176  NaN
3           27    NaN  NaN
4          NaN    NaN    F
5          NaN    172  NaN

一些混乱的尝试来解决此问题：

>>> untidy.pivot(columns='attribute', values='value').apply(lambda c: c.dropna().reset_index(drop=True))
attribute age height sex
0          49    176   M
1          27    172   F

>>> untidy.set_index([untidy.index//untidy['attribute'].nunique(), 'attribute']).unstack('attribute')
          value           
attribute   age height sex
0            49    176   M
1            27    172   F

惯用的方法是什么？

耶斯列尔

使用pandas.pivot与GroupBy.cumcount新的索引值和rename_axis用于删除列名：

df = pd.pivot(index=untidy.groupby('attribute').cumcount(),
              columns=untidy['attribute'], 
              values=untidy['value']).rename_axis(None, axis=1) 
print (df)
  age height sex
0  49    176   M
1  27    172   F

另一个解决方案：

df = (untidy.set_index([untidy.groupby('attribute').cumcount(), 'attribute'])['value']
            .unstack()
            .rename_axis(None, axis=1))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-25

我来说两句

0 条评论

登录后参与评论

上一篇：如何使用自动布局从情节提要中动态获得视图的y位置

仅在pandas数据框中旋转两列并添加其中一列

旋转熊猫数据框以每列返回两个值

如何根据页眉重塑数据框或取消旋转，然后插入两列

使用多列旋转 Pandas 数据框

旋转不带groupBy列的Spark数据框

旋转数据框时的列顺序

将单行数据框中的所有列“更长地旋转”成两个“值”列

旋转并合并两个 Pandas 数据框

熊猫枢轴旋转并加入两个数据框

在R中的数据框中旋转行和列

重塑数据框，按组旋转和扩展列

旋转pandas数据框并获取无轴列

熊猫合并数据框并旋转创建新列

Python数据框：在同一列上旋转

旋转Pandas数据框后无法读取列

使用列表作为列中的值旋转数据框？

如何旋转带有后缀列的数据框？

每行数据框比较两列

合并两列不同的数据框

使用OR根据两列过滤数据框

减去数据框中的两列

划分未堆叠数据框的两列

Python - 比较数据框中的两列

Concat数据框的两列值

数据框两列的协方差

用两列解开熊猫数据框

两列熊猫数据框的交集

熊猫数据框：乘以两列

比较熊猫数据框中的两列

TOP 榜单

文章

旋转两列数据框

旋转两列数据框

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用