了解Python Pandas中的groupby()

阿诺德

我试图了解groupby()操作。仅了解grouby分组数据是不够的,因为那只是第一步,我们对其进行了更多处理:

df = pd.DataFrame({'Animal': ['Falcon', 'Falcon', 'Parrot', 'Parrot'], 
                   'Max Speed': [380., 370., 24., 26.],  
                   'Class': ['Prey', 'Prey', 'Not Prey', 'Not Prey']}) 

In [7]: df                                                                                                                                                                                                   
Out[7]: 
   Animal  Max Speed     Class
0  Falcon      380.0      Prey
1  Falcon      370.0      Prey
2  Parrot       24.0  Not Prey
3  Parrot       26.0  Not Prey

我知道groupby()对原始数据集不起作用,它对副本起作用。我无法理解的是代码执行后的外观:

df.groupby('Class') 

我可以从视觉上理解吗?我可以理解原始数据帧,因为我可以看到它是表,因此可以想象操作将如何继续进行。那么,当我们执行上述grouoby()时会发生什么?是否创建一个新的Series或2个新的Columns,其中一个是“ Classs”,另一个是包含所有其他值的字符串?

我尝试查看官方文档的用户指南(https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html),但这无助于了解grouby()操作后的外观

耶斯列尔

我想你可以检查一下

GroupBy对象

groupby()函数返回一个GroupBy对象,但本质上描述了原始数据集的行是如何拆分的。GroupBy对象groups变量是一个字典,其键是计算出的唯一组,而对应的值是属于每个组的轴标签。

如果仅运行df.groupby('column_for_grouping'),您将获得一个看起来类似于的Python对象。您可能想知道DataFrameGroupBy对象在内部的外观。因此,通过遍历组,让我们在DataFrameGroupBy对象内按洲划分打印组。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章