如何将Pandas数据框旋转为具有混合数据类型和可能的双重值的新格式

贝努

我正在处理一个大型数据集。我从数据集中的表中提取所有数据，如下所示（输出1）：

Label                                                 Value

Time
2010-01-01 00:00:30.560    AAAAA                     [3] 
2010-01-01 00:00:30.560    BB                    -2.6000 
2010-01-01 00:00:30.560    C                      -2.2000 
2010-01-01 00:00:30.560    DD                      0.0000 
2010-01-01 00:00:40.160    GG                      1_2_3

我的目标是将其更改为并取出虚拟变量Label和value，并将时间作为索引

  Time                      AAAA   BB     C   DD   GG
2010-01-01 00:00:30.560      3    -2.6  -2.2   0   NaN
2010-01-01 00:00:40.160     NaN    NaN   NaN  NaN 1_2_3

我的代码如下所示：

logparser = parse_filter_logfile('CleanLog2.txt')
df = pd.DataFrame(logparser, columns = ['Time', 'Label', 'Value'])
df['Time'] = pd.to_datetime(df['Time'], format="%Y%m%d_%H:%M:%S.%f") #I get Output 1 here

H=df.set_index(['Time', 'Label']).unstack(-1)  #error I get the error: Index contains duplicate entries, cannot reshape

我尝试了几件事，但是没有任何运气。当我使用这个我得到这个错误

df.pivot(index='Time', columns='Code') #Error: Index contains duplicate entries, cannot reshape

当我使用这个我得到这个错误：

df.pivot(index='Time', columns='Code',aggfunc='mean') #pivot() got an unexpected keyword argument 'aggfunc'

如果有人可以提供帮助，我将不胜感激。提前致谢

我使用的更新

 H=df.pivot_table(index='Time', columns='Code', values='Value',aggfunc='first')

这样就解决了问题。

加布里埃尔·A

您要使用pivot_table而不是pivot。没有示例数据很难说，但这应该可行

pd.pivot_table(df,values="Value",index='Time', columns='Code',aggfunc='mean')

如果您有非数字数据，则应单独处理，然后将其与数字数据合并。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-28

我来说两句

0 条评论

登录后参与评论

上一篇：批量归一化：固定样本还是按维度划分的不同样本？

如何将Pandas数据框旋转为具有混合数据类型和可能的双重值的新格式

如何将Pandas数据框旋转为具有混合数据类型和可能的双重值的新格式

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u