如何在Pandas MultiIndex DataFrame中联接列值？

曼加拉维特（VítorMangaravite）

如何在MultiIndex pandas DataFrame中以相同名称连接列中的值？

data = [['1','1','2','3','4'],['2','5','6','7','8']]
df = pd.DataFrame(data, columns=['id','A','B','A','B'])
df = df.set_index('id')
df.columns = pd.MultiIndex.from_tuples([('result','A'),('result','B'),('student','A'),('student','B')])

df
   result    student   
        A  B       A  B
id                     
1       1  2       3  4
2       5  6       7  8

所需结果：

        A       B
id                     
1       "1 3"   "2 4"
2       "5 7"   "6 8"

耶斯列尔

新答案：

对于由第二级连接值MultiIndex的列使用groupby带agg：

#select columns define in list
df = df[['result','student']]
df1 = df.astype(str).groupby(level=1, axis=1).agg(' '.join)
print (df1)
      A    B
id          
1   1 3  2 4
2   5 7  6 8

旧答案：

您可以使用sort_index排序列，然后droplevel删除的第一级MultiIndex。

但是获取重复的列名称。

print (df)
   result    student    col   
        A  B       A  B   A  B
id                            
1       1  2       3  4   6  7
2       5  6       7  8   2  1

#select columns define in list
df = df[['result','student']]
print (df)
   result    student   
        A  B       A  B
id                     
1       1  2       3  4
2       5  6       7  8

df = df.sort_index(axis=1, level=1)
df.columns = df.columns.droplevel(0)
print (df)
    A  A  B  B
id            
1   1  3  2  4
2   5  7  6  8

所以更好的，唯一列名可以通过创建map具有join：

df = df.sort_index(axis=1, level=1)
df.columns = df.columns.map('_'.join)
print (df)
    result_A  student_A  result_B  student_B
id                                          
1          1          3         2          4
2          5          7         6          8

df = pd.concat([df['result'],df['student']], axis=1).sort_index(axis=1)
print (df)
    A  A  B  B
id            
1   1  3  2  4
2   5  7  6  8

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-25

我来说两句

0 条评论

登录后参与评论

上一篇：将表单的复选框标签附加到<p>元素中

Pandas MultiIndex：如何在MultiIndex列下对齐列

如何在MultiIndex Pandas DataFrame中设置索引值？

Pandas：如何在 MultiIndex 列中移动值

在表中联接列值-Pandas

如何在MultiIndex DataFrame上使用Pandas query（）方法？

筛选MultiIndex Pandas DataFrame

更新 Pandas MultiIndex DataFrame

无值的Pandas MultiIndex

根据列值对具有MultiIndex的pandas DataFrame进行排序

如何通过MultiIndex和值对Pandas DataFrame进行排序？

如何使用Pandas MultiIndex DataFrame中的先前值进行计算？

Pandas Dataframe Mul在Multiindex上

在MultiIndex DataFrame Pandas中选择子列

在创建MultiIndex列时合并Pandas DataFrame

对 pandas MultiIndex DataFrame 中的多级列求和

Python Pandas MultiIndex选择值

如何切片具有MultiIndex索引和MultiIndex列的Pandas DataFrame？

如何将Pandas Dataframe MultiIndex行转换为MultiIndex列？

如何使用 MultiIndex 列对 Pandas DataFrame 进行分组？

在MultiIndex列值上合并Pandas DataFrames

Pandas Groupby，MultiIndex，多列

如何展平MultiIndex列

如何重命名MultiIndex列？

如何在Python的Multiindex列中串联满足特定条件的Pandas数据框

如何在 Pandas DataFrame 中切换列 MultiIndex 但在内部级别分组？

如何在Pandas MultiIndex中增加级别？

Pandas DataFrame-如何检索MultiIndex级别的特定组合

在具有multiindex的pandas Dataframe中，如何按顺序过滤？

如何在MultiIndex DataFrame上实现非重叠滚动功能

TOP 榜单

文章

如何在Pandas MultiIndex DataFrame中联接列值？

如何在Pandas MultiIndex DataFrame中联接列值？

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u