我有一个熊猫数据框
df.columns
Index([u’car_id’,u’color’,u’make’,u’year’)]
我想创建一个新的FILTERABLE对象,该对象具有每个组的数量(颜色,品牌,年份);
grp = df[[‘color’,’make’,’year’]].groupby([‘color’,’make’,’year’]).size()
这将返回这样的东西
color make year count
black honda 2011 416
我希望能够对其进行过滤,但是当我尝试这样做时:
grp.filter(lambda x: x[‘color’]==‘black’)
我收到此错误
TypeError:“函数”对象不可迭代
如何利用“ groupby”对象将行过滤掉?
我认为您需要添加reset_index
,然后输出是DataFrame
。上次使用boolean indexing
:
df = df[['color','make','year']].groupby(['color','make','year'])
.size()
.reset_index(name='count')
df1 = df[df.color == 'black']
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句