如何使用用户函数在pandas中填充fillna（）

路易斯

这是我拥有的数据框的一部分：

Title | Age     
------+--------
Mr.   | 30
Mr.   | NaN
Mr.   | 32
Mrs.  | 28
Mrs.  | 16
Mr.   | 34
Mrs.  | NaN

编辑：我添加了最后一行，以澄清问题

我要估算NaN（第二行和最后一行），对于第二行，它应该使用其他“先生”的均值。在数据框中，因此在这种情况下应为32，在最后一行应使用其他“夫人”的平均值，因此应为22

计算均值就像做一样容易

value = df.loc[df["Title"] == "Mr."]["Age"].mean()

所以我写了一个叫做agefun的函数：

def agefun(df, t):
    return df.loc[df["Title"] == t]["Age"].mean()

现在，它如何工作，如何将这个函数与fillna（）函数一起使用？我想要类似的东西：

df['Age'].fillna(agefun(df, this_row_title))

但是，当然这是行不通的，我不知道如何告诉函数我喜欢该特定行中Title对应的值。

如何执行呢？

亚历山大大帝

变换保持与数据帧中原始序列相同的形状。

df['Age'] = df.groupby('Title').transform(lambda group: group.fillna(group.mean()))

>>> df
  Title  Age
0   Mr.   30
1   Mr.   32  # (30 + 32 + 34) / 3 = 32
2   Mr.   32
3  Mrs.   28
4  Mrs.   16
5   Mr.   34

在上面的示例中，它NaN通过计算组的平均值（即，其中Titleis为的所有行的平均值）使除第二行填充的第二行中的一个值之外的所有值保持不变Mr.。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-7

我来说两句

0 条评论

登录后参与评论

上一篇：在单个活动中使用多个GIF时出现内存不足错误

在pandas数据框中编写用户定义的fillna函数，以使用条件填充np.nan不同的值

如何使用用户函数在pandas中填充fillna（）

如何使用用户函数在pandas中填充fillna（）

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException