了解Python Pandas中的groupby（）

Arnuld 发表于 Dev

阿诺德

我试图了解groupby（）操作。仅了解grouby分组数据是不够的，因为那只是第一步，我们对其进行了更多处理：

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon', 'Parrot', 'Parrot'], 
                   'Max Speed': [380., 370., 24., 26.],  
                   'Class': ['Prey', 'Prey', 'Not Prey', 'Not Prey']}) 

In [7]: df                                                                                                                                                                                                   
Out[7]: 
   Animal  Max Speed     Class
0  Falcon      380.0      Prey
1  Falcon      370.0      Prey
2  Parrot       24.0  Not Prey
3  Parrot       26.0  Not Prey

我知道groupby（）对原始数据集不起作用，它对副本起作用。我无法理解的是代码执行后的外观：

df.groupby('Class')

我可以从视觉上理解吗？我可以理解原始数据帧，因为我可以看到它是表，因此可以想象操作将如何继续进行。那么，当我们执行上述grouoby（）时会发生什么？是否创建一个新的Series或2个新的Columns，其中一个是“ Classs”，另一个是包含所有其他值的字符串？

我尝试查看官方文档的用户指南（https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html），但这无助于了解grouby（）操作后的外观

耶斯列尔

我想你可以检查一下：

GroupBy对象

groupby（）函数返回一个GroupBy对象，但本质上描述了原始数据集的行是如何拆分的。GroupBy对象groups变量是一个字典，其键是计算出的唯一组，而对应的值是属于每个组的轴标签。

如果仅运行df.groupby（'column_for_grouping'），您将获得一个看起来类似于的Python对象。您可能想知道DataFrameGroupBy对象在内部的外观。因此，通过遍历组，让我们在DataFrameGroupBy对象内按洲划分打印组。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。