我正在尝试清理一些数据
该数据框当前看起来像这样:
id data data2
0 12 NaN 50.0
1 12 a 50.0
2 12 a NaN
3 52 b NaN
4 52 NaN 20.0
5 52 NaN 20.0
我想折叠这些行以删除重复的条目,并在此特定情况下仅保留对ID的有效分组,而忽略NaN和以下内容:
id data data2
0 12 a 50
1 52 b 20
你需要:
df.groupby('id', as_index=False).first()
输出:
id data data2
0 12 a 50.0
1 52 b 20.0
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句