有条件地用其他数据框中的值替换熊猫中的列值

Dov 发表于 Dev

116

多夫

我有两个csv，当作为数据帧读取时，看起来像这样：

df:

   TargetIndex Current1 Current2 Current3
0            0       'D'      'D'      'G'
1            2        0       'E'      'F'
2            0       'A'      'E'      'F'
3            1        0        0        0
4            0       'A'       0       'A'
5            3       'G'       0        0
6            2       'F'      'E'       0
7            4        0        0        0


df2:

    TargetIndex Target1 Target2 Target3
0             1      'A'     'A'     'A'
1             2      'B'     'B'     'B'
2             3      'C'     'C'     'C'
3             4      'A'     'B'     'C'

我想做的是仅0将Current列中的值替换为列中的值Target。但是，仅在TargetIndex值不是的行上0。

我当然对Python缺乏经验，通常我会在excel中使用附加列和LOOKUP函数的组合，因此我很费劲。

我到目前为止已经做的是读了一堆线程在这里，并尝试各种用途.loc，.isin，.replace，和.map在其他的东西，但我发现它很难申请的条件TargetIndex != 0和CurrentX == 0。

我发现困难的另一件事是首先使用第二个数据帧，我试图使它成为一个.dict有限的成功，以至于我确实知道它是如何工作的，我不能完全应用它。

我确实设法将期望的结果反向工程为以下意大利面条代码：

df['Target1'] = df['TargetIndex'].map(df2.set_index('TargetIndex')['Target1'])
df['Target2'] = df['TargetIndex'].map(df2.set_index('TargetIndex')['Target2'])
df['Target3'] = df['TargetIndex'].map(df2.set_index('TargetIndex')['Target3'])
S1 = df.Current1 == 0
S2 = df.Current2 == 0
S3 = df.Current3 == 0
df.loc[S1, 'Current1'] = df['TargetIndex']
df.loc[S2, 'Current2'] = df['TargetIndex']
df.loc[S3, 'Current3'] = df['TargetIndex']
df.replace({'Current1': { 1 : 'A', 2 : 'B', 3 : 'C', 4 : 'A'}}, inplace=True)
df.replace({'Current2': { 1 : 'A', 2 : 'B', 3 : 'C', 4 : 'B'}}, inplace=True)
df.replace({'Current3': { 1 : 'A', 2 : 'B', 3 : 'C', 4 : 'C'}}, inplace=True)
df.drop(df.columns[[4, 5, 6]], axis=1, inplace=True)

确实确实产生了预期的结果：

df:

   TargetIndex Current1 Current2 Current3
0            0       'D'      'D'      'G'
1            2       'B'      'E'      'F'
2            0       'A'      'E'      'F'
3            1       'A'      'A'      'A'
4            0       'A'       0       'A'
5            3       'G'      'C'      'C'
6            2       'F'      'E'      'B'
7            4       'A'      'B'      'C'

但是，它需要手动输入要替换的内容，而当df2 csv包含5000多个行时，效率不高或不可行。必须有一种更好的方法来执行此操作，而我只是没有看到或正确地理解它，因此我认为我也可以问一下。

耶斯列尔

如果列数相同，则可以使用：

#create index with 
df1 = df1.set_index('TargetIndex')
df2 = df2.set_index('TargetIndex')
#set same columns names for align data
df2.columns = df1.columns

#replace 0 with NaNs and replace NaNs by df2
df = df1.mask(df1 == 0).combine_first(df2)
print (df)
            Current1 Current2 Current3
TargetIndex                           
0                'D'      'D'      'G'
0                'A'      'E'      'F'
0                'A'      NaN      'A'
1                'A'      'A'      'A'
2                'B'      'E'      'F'
2                'F'      'E'      'B'
3                'G'      'C'      'C'
4                'A'      'B'      'C'

如果顺序很重要，请添加reset_index排序：

df1 = df1.reset_index().set_index('TargetIndex')
df2 = df2.set_index('TargetIndex')
df2.columns = df1.columns[1:]

df = (df1.mask(df1 == 0)
        .combine_first(df2)
        .sort_values('index')
        .drop('index', 1)
        .reset_index()
        .fillna(0))
print (df)
   TargetIndex Current1 Current2 Current3
0            0      'D'      'D'      'G'
1            2      'B'      'E'      'F'
2            0      'A'      'E'      'F'
3            1      'A'      'A'      'A'
4            0      'A'        0      'A'
5            3      'G'      'C'      'C'
6            2      'F'      'E'      'B'
7            4      'A'      'B'      'C'

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-30

我来说两句

0 条评论

登录后参与评论

上一篇：安卓仅当传递了“ if statement”时，才滑动到下一个选项卡

有条件地用其他数据框中的值替换熊猫中的列值

有条件地用其他数据框中的值替换熊猫中的列值

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值