使用 Pandas 将数据帧从长转换为宽

floss 发表于 Dev

牙线

我的样本df看起来像这样

student_id,      year,       grade,    school   
1001           20002001        1         abc  
1001           20012002        2         abc 
1001           20022003        3         abc 
1001           20032004        4         abc  

1002           19992000        2         abc    
1002           20002001        3         abc         
1002           20012002        4         abc         

1003           20022003        4         abc          

1004           20022003        3         abc         
1004           20032004        4         abc

这df是目前的long格式。我想要做的是将数据转换成一种wide格式，应该是这样的：

student_id,    grade_19992000,    grade_20002001,    grade_20012002,    grade_20022003,    grade_20032004,    school_19992000,   school_19992000,   school_20012002,    school_20022003,    school_20032004     
1001                NaN                  1                  2                  3              4                       NaN                 abc                 abc                 abc                 abc
1002                2                    3                  4                 NaN            NaN                     abc                 abc                 abc                 NaN                 NaN 
1003                NaN                 NaN                NaN                 4             NaN                     NaN                 NaN                 NaN                  abc                    NaN 
1004                NaN                 NaN                NaN                 3             4                     NaN                 NaN                 abc                  abc                    NaN

这既不重复也不与其他问题相关。我尝试了所有可用的选项。

我做了什么？

我尝试使用df.pivot(index='', columns'', values='')，但它没有按照我的意愿格式化数据
例如：对于student_id相同的，它为另一个year创建一个具有相同列名student_id的新列，依此类推......

有人可以提供一些关于如何实现我想要的输出的见解吗？

寡妇

你可以pivot; 只有你需要 2 列作为值：

out = df.pivot('student_id', 'year', ['grade', 'school'])
out.columns = [f'{x}_{y}' for x,y in out.columns]

输出：

           grade_19992000 grade_20002001 grade_20012002 grade_20022003  \
student_id                                                               
1001                  NaN              1              2              3   
1002                    2              3              4            NaN   
1003                  NaN            NaN            NaN              4   
1004                  NaN            NaN            NaN              3   

           grade_20032004 school_19992000 school_20002001 school_20012002  \
student_id                                                                  
1001                    4             NaN             abc             abc   
1002                  NaN             abc             abc             abc   
1003                  NaN             NaN             NaN             NaN   
1004                    4             NaN             NaN             NaN   

           school_20022003 school_20032004  
student_id                                  
1001                   abc             abc  
1002                   NaN             NaN  
1003                   abc             NaN  
1004                   abc             abc

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-04-18

我来说两句

0 条评论

登录后参与评论

上一篇：对于从公共 GitHub 存储库引用的包，Npm install on GitHub Pull Request 失败

如何使用dplyr操纵长表数据进行关联，但不将数据转换为宽格式

使用 Pandas 将数据帧从长转换为宽

使用 Pandas 将数据帧从长转换为宽

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序