我试图了解groupby()操作。仅了解grouby分组数据是不够的,因为那只是第一步,我们对其进行了更多处理:
df = pd.DataFrame({'Animal': ['Falcon', 'Falcon', 'Parrot', 'Parrot'],
'Max Speed': [380., 370., 24., 26.],
'Class': ['Prey', 'Prey', 'Not Prey', 'Not Prey']})
In [7]: df
Out[7]:
Animal Max Speed Class
0 Falcon 380.0 Prey
1 Falcon 370.0 Prey
2 Parrot 24.0 Not Prey
3 Parrot 26.0 Not Prey
我知道groupby()对原始数据集不起作用,它对副本起作用。我无法理解的是代码执行后的外观:
df.groupby('Class')
我可以从视觉上理解吗?我可以理解原始数据帧,因为我可以看到它是表,因此可以想象操作将如何继续进行。那么,当我们执行上述grouoby()时会发生什么?是否创建一个新的Series或2个新的Columns,其中一个是“ Classs”,另一个是包含所有其他值的字符串?
我尝试查看官方文档的用户指南(https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html),但这无助于了解grouby()操作后的外观
我想你可以检查一下:
GroupBy对象
groupby()函数返回一个GroupBy对象,但本质上描述了原始数据集的行是如何拆分的。GroupBy对象groups变量是一个字典,其键是计算出的唯一组,而对应的值是属于每个组的轴标签。
如果仅运行df.groupby('column_for_grouping'),您将获得一个看起来类似于的Python对象。您可能想知道DataFrameGroupBy对象在内部的外观。因此,通过遍历组,让我们在DataFrameGroupBy对象内按洲划分打印组。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句