我是python编程的初学者,试图弄清楚groupby操作中的组标签如何用作新数据帧的索引。例如,
df = pd.DataFrame({'Country': ['USA', 'USA', 'UK', 'China', 'Canada', 'Australia', 'UK', 'China', 'USA'],
'Year': [1979, 1983, 1987, 1991, 1995, 1999, 2003, 2007, 2011],
'Medals': [52, 30, 25, 41, 19, 17, 9, 14, 12]})
df:
Country Medals Year
0 USA 52 1979
1 USA 30 1983
2 UK 25 1987
3 China 41 1991
4 Canada 19 1995
5 Australia 17 1999
6 UK 9 2003
7 China 14 2007
8 USA 12 2011
c1 = df.groupby(df['Country'], as_index=True, sort=False, group_keys=True).size()
c1:
Country
USA 3
UK 2
China 2
Canada 1
Australia 1
我想使用上述c1结果完全以该格式创建一个新数据框,但我无法做到这一点。以下是我得到的:
d1 = pd.DataFrame(np.array(c1), columns=['Frequency'])
d1:
Frequency
0 3
1 2
2 2
3 1
4 1
我希望组标签作为索引,而不是默认的0、1、2、3和4。这正是我想要的:
Desired Output:
Frequency
USA 3
UK 2
China 2
Canada 1
Australia 1
请问我该如何实现?我想如果我用国家/地区创建标签并将其指定为索引,则可能会起作用。但是,我正在使用的原始数据有很多行,以至于我无法创建标签列表。任何想法将不胜感激。
编辑:让我们来看看你如何喜欢这个!
c1 = pd.DataFrame(c1.values, index=c1.index.values, columns=['Frequency'])
print(c1)
Frequency
USA 3
UK 2
China 2
Canada 1
Australia 1
c1.values
(就我们的目的而言)大致等效,np.array(c1)
但避免了导入numpy。
原始回答(不太有效,请留给后代):您可能正在寻找该set_index
方法。
它应该像这样工作:
c1 = df.groupby(df['Country'], as_index=True, sort=False, group_keys=True).size()
c2 = c1.set_index(['Country'])
让我知道这是否适合您!
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句