在熊猫中切片MultiIndexed DataFrame

迪马·西杜科夫（Dima Sidukov）：

我有以下DataFrame命名的pop：

California  2000    33871648
            2010    37253956
New York    2000    18976457
            2010    19378102
Texas       2000    20851820
            2010    25145561

我想打印出加利福尼亚和德克萨斯州的2010年值。每当我尝试pop[['California','Texas'], 2010]遇到错误时，该'(['California', 'Texas'], 2010)' is an invalid key如何打印信息？

僵尸

TLDR

df.loc[(level_1_indices_list, level_2_indices_list), :]

在这种情况下：

df.loc[(['California','Texas'], ['2010']), :]

下面是一个更详细的版本。

# import packages & set seed
import numpy as np
import pandas as pd
np.random.seed(42)

创建示例数据框

使用熊猫文档：

arrays = [np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux']),
          np.array(['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two'])]

s = pd.Series(np.random.randn(8), index=arrays)

df = pd.DataFrame(np.random.randn(8, 4), index=arrays)

看起来像：

使用多索引切片

有了df您就可以做到：

df.loc[(['qux','foo'], 'one'), :]

为了保持符号一致性，您可以[]在切片的第二个元素上使用：

df.loc[(['qux','foo'], ['one']), :]

这将产生相同的结果。

这是：

（选择'one'等效于2010在中进行选择df。['qux','foo']应该等效于选择['California'，'Texas']。基于此，我认为您可以将此处的步骤应用于您的数据。）

这也可能会有所帮助。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-08-21

我来说两句

0 条评论

登录后参与评论

在熊猫中切片MultiIndexed DataFrame

在熊猫中切片MultiIndexed DataFrame

TLDR

创建示例数据框

使用多索引切片

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID