熊猫：将任何列索引级别的列添加到multiindex

Moritz 发表于 Dev

莫里兹

我想将缺少级别（index = 1）的列添加到数据帧的每个父级别（index = 0）。对于一个简单的数据框，效果很好

index = [['A', 'B', 'C', 'D'], ['a', 'b', 'a', 'b']]
cols = [['AC', 'AC', 'BC', 'DC', 'CC'], ['ac', 'aac', 'bc', 'ac', 'bc']]
data = np.random.random((4, 5))
df = pd.DataFrame(data=data, index=index, columns=cols)
df.columns.names = ['col_name_0', 'col_name_1']

数据框：

col_name_0        AC                  BC        DC        CC
col_name_1        ac       aac        bc        ac        bc
A a         0.169402  0.899434  0.644941  0.330402  0.805702
B b         0.933743  0.994497  0.060507  0.609129  0.545999
C a         0.064937  0.686350  0.740594  0.985218  0.717699
D b         0.151031  0.932294  0.948751  0.538251  0.085700

处理步骤：

feature_index = [index for index, item in enumerate(df.columns.names) if item == 'col_name_1'][0]
all_features = df.columns.levels[feature_index].to_list()

for idx, item in df.groupby(level=0, axis=1):
    features = item.columns.get_level_values(1).to_list()
    missing = list(set(all_features) - set(features))
    for m_item in missing:
        df[idx, m_item] = np.nan * np.ones(df.shape[0])

处理后的df：

col_name_0        AC                BC      ...  CC            DC              
col_name_1       aac        ac  bc aac  ac  ...  ac        bc aac        ac  bc
A a         0.561247  0.353270 NaN NaN NaN  ... NaN  0.733714 NaN  0.343174   NaN
B b         0.699053  0.696892 NaN NaN NaN  ... NaN  0.144768 NaN  0.267141 NaN
C a         0.624581  0.064629 NaN NaN NaN  ... NaN  0.856559 NaN  0.772735 NaN
D b         0.563903  0.192823 NaN NaN NaN  ... NaN  0.071497 NaN  0.000361 NaN

但是，对于具有多个列级别的数据框（如以下所示），该方法将失败：

index = [['A', 'B', 'C', 'D'], ['a', 'b', 'a', 'b']]
cols = [['AC', 'AC', 'BC', 'DC', 'CC'], ['ac', 'aac', 'bc', 'ac', 'bc'], ['Xc', 'Xc', 'Xc', 'Xc', 'Xc']]
data = np.random.random((4, 5))
df = pd.DataFrame(data=data, index=index, columns=cols)
df.columns.names = ['col_name_0', 'col_name_1', 'col_name_2']

原始数据框：

col_name_0        AC                  BC        DC        CC
col_name_1        ac       aac        bc        ac        bc
col_name_2        Xc        Xc        Xc        Xc        Xc
A a         0.317022  0.700635  0.305712  0.934382  0.315501
B b         0.601277  0.726890  0.737907  0.571935  0.716260
C a         0.679046  0.314987  0.846560  0.962516  0.770071
D b         0.124029  0.626421  0.967531  0.193875  0.395897

处理步骤：

feature_index = [index for index, item in enumerate(df.columns.names) if item == 'col_name_1'][0]
all_features = df.columns.levels[feature_index].to_list()

for idx, item in df.groupby(level=0, axis=1):
    features = item.columns.get_level_values(1).to_list()
    missing = list(set(all_features) - set(features))
    for m_item in missing:
        df[idx, m_item] = np.nan * np.ones(df.shape[0])

错误信息：

ValueError: Item must have length equal to number of levels.

有什么想法可以使我的方法更通用以接受任何列级别？

贝尼

所以，你可以只使用stack和unstack

out = df.stack(level = 1).unstack().swaplevel(1, 2, axis = 1)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-20

我来说两句

0 条评论

登录后参与评论

上一篇：Mac OS 64位上的Delphi FMX dcpcrypt错误结果

将新索引添加到MultiIndex数据框熊猫的特定级别

如何将属性添加到任何级别的对象（列表，列表\ $框架，列表\ $框架\ $列）？

熊猫将时间列添加到日期索引

熊猫添加更高级别的列多索引

熊猫：将一个子级别添加到依赖于上一个级别的索引

将索引添加到生成的列

将pandas系列作为一列添加到多索引的DataFrame填充级别

熊猫，如何将Series添加到DataFrame列，其中系列索引与DataFrame列匹配？

熊猫：将行添加到DataFrame中，并在列中添加多索引

将根级别的“元数据”字段添加到ElasticSearch索引

将 Rank 列添加到 MultiIndex Dataframe

将列添加到Pandas MultiIndex DataFrame

熊猫：如何将列添加到多索引数据框？

熊猫（python）：如何将列添加到数据框以进行索引？

熊猫：最后将列添加到多索引数据框

删除后无法将列重新添加到熊猫多索引数据框

熊猫-向多索引添加列级别

将列添加到数据透视表（熊猫）

将列添加到没有标题的熊猫

熊猫-将缺失的列自动添加到数据框

将熊猫列添加到稀疏矩阵

将滚动窗口添加到熊猫每行中的列

熊猫将一日添加到列

如何将0添加到熊猫时间列

根据熊猫的状况将年添加到日期列

熊猫将列添加到未引用的数据框

将列添加到数据框熊猫上的组

将索引添加到列列表python

TOP 榜单

文章

熊猫：将任何列索引级别的列添加到multiindex

熊猫：将任何列索引级别的列添加到multiindex

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException