如何将Pandas数据框旋转为具有混合数据类型和可能的双重值的新格式

贝努

我正在处理一个大型数据集。我从数据集中的表中提取所有数据,如下所示(输出1):

Label                                                 Value

Time
2010-01-01 00:00:30.560    AAAAA                     [3] 
2010-01-01 00:00:30.560    BB                    -2.6000 
2010-01-01 00:00:30.560    C                      -2.2000 
2010-01-01 00:00:30.560    DD                      0.0000 
2010-01-01 00:00:40.160    GG                      1_2_3

我的目标是将其更改为并取出虚拟变量Label和value,并将时间作为索引

  Time                      AAAA   BB     C   DD   GG
2010-01-01 00:00:30.560      3    -2.6  -2.2   0   NaN
2010-01-01 00:00:40.160     NaN    NaN   NaN  NaN 1_2_3

我的代码如下所示:

logparser = parse_filter_logfile('CleanLog2.txt')
df = pd.DataFrame(logparser, columns = ['Time', 'Label', 'Value'])
df['Time'] = pd.to_datetime(df['Time'], format="%Y%m%d_%H:%M:%S.%f") #I get Output 1 here

H=df.set_index(['Time', 'Label']).unstack(-1)  #error I get the error: Index contains duplicate entries, cannot reshape

我尝试了几件事,但是没有任何运气。当我使用这个我得到这个错误

df.pivot(index='Time', columns='Code') #Error: Index contains duplicate entries, cannot reshape

当我使用这个我得到这个错误:

df.pivot(index='Time', columns='Code',aggfunc='mean') #pivot() got an unexpected keyword argument 'aggfunc'

如果有人可以提供帮助,我将不胜感激。提前致谢

我使用的更新

 H=df.pivot_table(index='Time', columns='Code', values='Value',aggfunc='first')

这样就解决了问题。

加布里埃尔·A

您要使用pivot_table而不是pivot。没有示例数据很难说,但这应该可行

pd.pivot_table(df,values="Value",index='Time', columns='Code',aggfunc='mean')

如果您有非数字数据,则应单独处理,然后将其与数字数据合并。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

类型错误:数组数据类型和格式说明符不匹配。如何将具有不同值类型的数据框保存为 txt 文件?

删除具有混合数据类型的值

如何将具有混合数据类型的 3D 数组加载到 Tensorflow 中进行训练?

将pandas数据框旋转为具有多层的长格式

删除pandas数据框中具有混合数据类型的所有行,这些数据类型包含多列中的特定字符串

具有混合数据类型的列的 groupby 数据

具有混合数据类型的列表的Numpy dtype

CSV 过滤具有混合数据类型的列

从数组创建具有混合数据类型的表

如何将熊猫数据框的数据类型更改为具有定义格式的字符串?

从具有嵌套结构的字典中删除混合数据类型的空值和空对象

如何对具有混合数据类型和数据结构的列表进行子集设置?

如何将混合数据类型(int,float,char等)存储在数组中?

将具有混合数据类型的数据帧中所有出现的True / False转换为1/0

在R中:具有混合数据类型的数据帧的类型转换

java - 如何解决由具有混合数据类型的数据文件引起的 InputMismatchException

如何将具有多个聚合字段和多个索引字段的pandas数据框旋转到python中的sumIfs?

具有混合数据类型的TensorFlow数据集生成器

如何在熊猫数据框中修改混合数据类型列中的数值?

如何将 Pandas 数据框转为多级列

在一个混合数据类型的系列中,如何将偶尔的列表和字典转换为字符串?

混合数据类型,函数和对象

C#中具有混合数据类型的数组

转换具有单个混合数据类型数组的单个字符串

在Swagger中定义具有混合数据类型的属性

使用Boost.Spirit解析具有混合数据类型的OBJ文件?

Power-Query中具有混合数据类型的“自定义”列

pandas.Dataframe()混合数据类型和奇怪的.fillna()行为

具有对象数据类型但浮点值的数据框