嗨,我有这样的数据框,time
列中有 71 个唯一值,列中有 721 个唯一值,lat
列中有 1440 个唯一lon
值,临时列中的所有值都是唯一的。
数据框示例:
time latitude longitude temp
1950-01-01 90.0 0.00 49654.792969
1950-01-01 90.0 0.25 49654.792969
. . . .
. . . .
73715040 rows * 4 cloumn
现在我想通过使用lat
和lon
列进行分组以获取所有时间段内所有将具有 的网格或对的所有 temp 值1038240 rows(721 lat*1440 lon)
,所以我这样做。
df = df.groupby(['latitude', 'longitude'])
现在,pandas.core.groupby.generic.DataFrameGroupBy object
我无法从中访问值。所以我试图将它转换为数据帧,df.apply(pd.DataFrame)
但这需要很多时间,而且我的内核崩溃了。那么有没有其他方法可以获得记录,或者我在这里做错了什么。如果可能,请建议替代方法。
这应该适合你:
df.groupby(['latitude', 'longitude']).aggregate(lambda x: ','.join(map(str, x)))
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句