使用熊猫更新列中的缺失值

ComplexData 发表于 Dev

16

复杂数据

我有一个数据框df，其中两个列是“ city”和“ zip_code”：

df = pd.DataFrame({'city': ['Cambridge','Washington','Miami','Cambridge','Miami',
'Washington'], 'zip_code': ['12345','67891','23457','','','']})

如上所示，特定的城市在其中的一行中包含邮政编码，但是在另一行中的同一城市缺少邮政编码。我想基于其他行中该城市的邮政编码值来填充那些缺失的值。基本上，无论哪里缺少邮政编码，它都会在其他行中检查该城市的邮政编码，如果找到，则填充zip_code的值;如果找不到，则填充'NA'。

如何使用熊猫完成此任务？

博维尔上校

您可以申请：

import numpy as np

df['zip_code'] = df.replace(r'', np.nan).groupby('city')['zip_code'].fillna(method='ffill').fillna(method='bfill')

>>> df
         city zip_code
0   Cambridge    12345
1  Washington    67891
2       Miami    23457
3   Cambridge    12345
4       Miami    23457
5  Washington    67891

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-12

我来说两句

0 条评论

登录后参与评论

上一篇：Azure DocumentDB受限制的请求

相关文章

使用熊猫处理列中的缺失值

使用熊猫替换缺失值

根据熊猫中的缺失值创建一列

如何使用熊猫根据列模式填充缺失值？

使用字典参考另一列值来映射熊猫数据框的一列中的缺失值

熊猫使用查找字典更新列中的值

熊猫创建列并使用apply中的值进行更新

删除缺失值超过阈值熊猫的列

替换熊猫中列表中的缺失值

根据条件更新熊猫中的列值

熊猫根据另一列中的值导出列中的缺失值

填写熊猫数据框中的缺失值

在熊猫中填写缺失值错误？

找到熊猫中的缺失值（不是 NaN）

估算熊猫中类别的缺失值

在熊猫中按ID填充缺失值

填写熊猫数据框中的“缺失”值

在熊猫中填充另一列中某一列的缺失值

如何根据另一列中的间隔填充熊猫中其他列的缺失值？

使用error ='coerce'的熊猫缺失值

熊猫：更新列的值

在熊猫数据框中的相关列中同时填充缺失值

如何使用ndarray / model预测替换列中的缺失值

使用其他数据框填写列中的缺失值

熊猫/脾气暴躁-在另一列中填写缺失值

熊猫索引缺失值

更新数据框中的缺失值

使用dtype处理大熊猫中的缺失值以读取文件

如何使用指定间隔的移位来填充熊猫中的缺失值？

TOP 榜单

文章

热门标签

归档