如何用熊猫数据框中第一行和相应行之间的列平均值填充特定值

pyd 发表于 Dev

我有这样的df，

A   B   C   D   E
1   2   3   0   2
2   0   7   1   1
3   4   0   3   0
0   0   3   4   3

我正在尝试在第一行和对应列的0值行之间用mean（）值替换所有0，

我的预期输出是

A       B       C           D       E
1.0     2.00    3.000000    0.0     2.0
2.0     1.00    7.000000    1.0     1.0
3.0     4.00    3.333333    3.0     1.0
1.5     1.75    3.000000    4.0     3.0

耶斯列尔

这是主要问题，mean如果0每列有多个，则需要先前的值，因此创建向量化解决方案确实有问题：

def f(x):
    for i, v in enumerate(x):
        if v == 0: 
            x.iloc[i] = x.iloc[:i+1].mean()
    return x

df1 = df.astype(float).apply(f)
print (df1)

     A     B         C    D    E
0  1.0  2.00  3.000000  0.0  2.0
1  2.0  1.00  7.000000  1.0  1.0
2  3.0  4.00  3.333333  3.0  1.0
3  1.5  1.75  3.000000  4.0  3.0

更好的解决方案：

#create indices of zero values to helper DataFrame
a, b = np.where(df.values == 0)
df1 = pd.DataFrame({'rows':a, 'cols':b})
#for first row is not necessary count means
df1 = df1[df1['rows'] != 0]
print (df1)
   rows  cols
1     1     1
2     2     2
3     2     4
4     3     0
5     3     1

#loop by each row of helper df and assign means
for i in df1.itertuples():
    df.iloc[i.rows, i.cols] = df.iloc[:i.rows+1, i.cols].mean()

print (df)
     A     B         C  D    E
0  1.0  2.00  3.000000  0  2.0
1  2.0  1.00  7.000000  1  1.0
2  3.0  4.00  3.333333  3  1.0
3  1.5  1.75  3.000000  4  3.0

另一个类似的解决方案（mean所有对中都有）：

for i, j in zip(*np.where(df.values == 0)):
    df.iloc[i, j] = df.iloc[:i+1, j].mean()
print (df)

     A     B         C    D    E
0  1.0  2.00  3.000000  0.0  2.0
1  2.0  1.00  7.000000  1.0  1.0
2  3.0  4.00  3.333333  3.0  1.0
3  1.5  1.75  3.000000  4.0  3.0

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-24

我来说两句

0 条评论

登录后参与评论

上一篇：如何避免将结果添加到列表的多个if语句

熊猫数据框：获取组中每个子组的第一行的平均值

如何用数据帧的NaN删除第一行和最后一行，并用上下两个值的平均值替换其余的NaN？

如何计算数据帧每一行中特定值的平均值？

如何用熊猫数据框中第一行和相应行之间的列平均值填充特定值

如何用熊猫数据框中第一行和相应行之间的列平均值填充特定值

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException