遍历熊猫的groupby字段

Luca 发表于 Dev

路卡

我一直在研究熊猫的公开数据集，其中包含美国各州的一些空气质量统计数据。

我将其数据集加载到pandas数据框中，并使用groupby来对事物进行分组state。所以像：

import pandas as pd
poll = pd.read_csv(`dataset.csv')
poll = poll.groupby(['State', 'Date Local']).mean()
ds_gb_state = poll.groupby(level='State')

打印此内容类似于：

                        V1         V2          V3        V4
State      Date Local
Alabama    2013-12-01  37.000000  24.000000   1.000000   6.000000
           2013-12-02  30.000000  12.000000   3.000000   6.000000
           2013-12-03  21.000000  11.000000   3.000000   3.000000
           2013-12-04  18.000000  13.000000   1.000000   2.000000
           2013-12-05  15.000000  13.000000   1.000000   2.000000
Alaska     2014-07-01   4.000000  16.000000   6.000000   3.000000
           2014-07-02   4.000000  15.000000   6.000000   3.000000
           2014-07-03   6.000000  19.000000  13.000000   3.000000

我的问题很简单。使用该ds_gb_state对象，如何找到所有状态的名称？在此对象中，列是V1, V2, V3 and V4，我可以很好地访问它们，但是是否可以枚举所有状态或从该对象中找到最小和最大日期？

海盗

a的主要组成部分pandas.MultiIndex是levels和labels属性。构造一个时，levels应FrozenList为pandas.Index对象的。更重要的是，这些Index对象应该是唯一的（这可以被故意破坏，但通常是True）。因此，您可以使用

ds_gb_state.index.levels[0]

Index(['Alabama', 'Alaska'], dtype='object', name='State')

假设第二级是dtype datetime

ds_gb_state.index.set_levels(pd.to_datetime(ds_gb_state.index.levels[1]), 1, True)

我们可以做同样的技巧来获得最小值。

ds_gb_state.index.levels[1].min()

Timestamp('2013-12-01 00:00:00')

尽管我相信@yatu的答案是完全值得的。它值得比较

该方法get_level_values利用levels和labels属性，并且等效于此

ds_gb_state.index.get_level_values(0)

Index(['Alabama', 'Alabama', 'Alabama', 'Alabama', 'Alabama', 'Alaska',
       'Alaska', 'Alaska'],
      dtype='object', name='State')

和

ds_gb_state.index.levels[0][ds_gb_state.index.labels[0]]

Index(['Alabama', 'Alabama', 'Alabama', 'Alabama', 'Alabama', 'Alaska',
       'Alaska', 'Alaska'],
      dtype='object', name='State')

因此，要获得唯一值，熊猫必须获取已经唯一的值切片，以便产生可能的非唯一值，而又要经历使其再次变得唯一的麻烦。我建议跳过不必要的步骤。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-7

我来说两句

0 条评论

登录后参与评论

上一篇：Unicode字符名称的官方存储库

TOP 榜单

文章

遍历熊猫的groupby字段

遍历熊猫的groupby字段

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用