遍历熊猫中的MultiIndex

Charles Dillon 发表于 Dev

查尔斯·狄龙

我有一个MultiIndexed DataFrame df1，并希望以一种循环的方式遍历它，以便在循环的每个实例中都有一个带有规则非分层索引的DataFrame，该索引是df1的子集，对应于外部索引条目。即，如果我有：

第一表

我想得到

第二表

我还不知道它们的名称实际上是什么（C1等，这里只是占位符），所以只想遍历我拥有的C _i值的数量。

我一直徘徊在iterrows各种循环中，没有得到任何明显的结果，也不知道该如何进行。我觉得应该有一个简单的解决方案，但找不到文件中看起来有用的任何东西，可能是由于我自己缺乏理解。

杰夫

使用此处的修改示例

In [30]: def mklbl(prefix,n):
        return ["%s%s" % (prefix,i)  for i in range(n)]
   ....: 

In [31]: columns = MultiIndex.from_tuples([('a','foo'),('a','bar'),
                                  ('b','foo'),('b','bah')],
                                   names=['lvl0', 'lvl1'])

In [33]: index = MultiIndex.from_product([mklbl('A',4),mklbl('B',2)])

In [34]: df = DataFrame(np.arange(len(index)*len(columns)).reshape((len(index),len(columns))),
               index=index,
               columns=columns).sortlevel().sortlevel(axis=1)

In [35]: df
Out[35]: 
lvl0     a         b     
lvl1   bar  foo  bah  foo
A0 B0    1    0    3    2
   B1    5    4    7    6
A1 B0    9    8   11   10
   B1   13   12   15   14
A2 B0   17   16   19   18
   B1   21   20   23   22
A3 B0   25   24   27   26
   B1   29   28   31   30

In [36]: df.loc['A0']
Out[36]: 
lvl0    a         b     
lvl1  bar  foo  bah  foo
B0      1    0    3    2
B1      5    4    7    6

In [37]: df.loc['A1']
Out[37]: 
lvl0    a         b     
lvl1  bar  foo  bah  foo
B0      9    8   11   10
B1     13   12   15   14

无需循环。

您也可以选择这些以返回帧（带有原始MI），例如 df.loc[['A1']]

如果要获取索引中的值：

In [38]: df.index.get_level_values(0).unique()
Out[38]: array(['A0', 'A1', 'A2', 'A3'], dtype=object)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-10-23

我来说两句

0 条评论

登录后参与评论

遍历熊猫中的列

熊猫MultiIndex中的鬼指数

替换MultiIndex（熊猫）中的值

在熊猫中查询MultiIndex DataFrame

从groupby熊猫中获取MultiIndex

遍历Multiindex

熊猫：在MultiIndex中从日期中选择

熊猫：折叠Multiindex数据框中的行

设置熊猫MultiIndex系列中的值

如何在熊猫中与MultiIndex串联

通过遍历列搜索熊猫中的元素

如何遍历熊猫中的索引列

如何遍历熊猫中的选定行

如何遍历Multiindex并在Pandas中乘以两列？

遍历MultiIndex级别的熊猫并进行分组依据以获取总计

在熊猫中对字符串类型MultiIndex进行排序

在熊猫MultiIndex DataFrame中按级别求和列

熊猫-用MultiIndex DataFrame中的系列除以DataFrame值

在熊猫DataFrame中基于MultiIndex提取组的头部

在熊猫数据框中重新排序MultiIndex的级别

如何查询熊猫中的MultiIndex索引列值

如何使用Multiindex汇总到熊猫列表中？

熊猫MultiIndex Series麻烦中的级别排序子集

熊猫MultiIndex DataFrame排序

熊猫Multiindex和Groupby

熊猫MultiIndex多维交集

熊猫复制multiIndex级别

通过MultiIndex选择熊猫

熊猫to_datetime与multiindex

TOP 榜单

文章

遍历熊猫中的MultiIndex

遍历熊猫中的MultiIndex

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面