将一个熊猫数据帧合并到另一个熊猫数据帧,并从第二个数据帧中删除第一个数据帧中存在的值

Vishwajeet Mane

我有两个熊猫数据框,如下所示:-

DF1

     date1      hours   value    Field  count1
1   2021-01-15   9       eps       EPS          770915
2   2021-01-22   9       eps       EPS          797503

DF2

        date1       hours   value      Field    count1
  0     2021-01-09   9       eps        EPS     0
  1     2021-01-10   9       eps        EPS     0
  2     2021-01-11   9       eps        EPS     0
  3     2021-01-12   9       eps        EPS     0
  4     2021-01-13   9       eps        EPS     0
  5     2021-01-14   9       eps        EPS     0
  6     2021-01-15   9       eps        EPS     0
  7     2021-01-16   9       eps        EPS     0
  8     2021-01-17   9       eps        EPS     0
  9     2021-01-18   9       eps        EPS     0
 10     2021-01-19   9       eps        EPS     0
 11     2021-01-20   9       eps        EPS     0
 12     2021-01-21   9       eps        EPS     0
 13     2021-01-22   9       eps        EPS     0

我想要如下输出:-

结果:-

        date1       hours   value      Field    count1
  0     2021-01-09   9       eps        EPS     0
  1     2021-01-10   9       eps        EPS     0
  2     2021-01-11   9       eps        EPS     0
  3     2021-01-12   9       eps        EPS     0
  4     2021-01-13   9       eps        EPS     0
  5     2021-01-14   9       eps        EPS     0
  6     2021-01-15   9       eps        EPS     770915
  7     2021-01-16   9       eps        EPS     0
  8     2021-01-17   9       eps        EPS     0
  9     2021-01-18   9       eps        EPS     0
 10     2021-01-19   9       eps        EPS     0
 11     2021-01-20   9       eps        EPS     0
 12     2021-01-21   9       eps        EPS     0
 13     2021-01-22   9       eps        EPS     797503

列DF1和DF2的数据类型如下:-

date1          object
hours           int64 
value          object
Field          object
count1          int64

DF2始终包含14天,而DF1始终包含介于1到14之间的可变天。我希望结果数据框包含缺少的天字段,第二个数据框中的零。

耶斯列尔

使用concatDataFrame.drop_duplicates

df = (pd.concat([DF1, DF2], ignore_index=True)
        .drop_duplicates(['date1','hours','value','Field']))

如果有必要进行排序输出:

df = (pd.concat([DF1, DF2], ignore_index=True)
        .drop_duplicates(['date1','hours','value','Field'])
        .sorT_values(['date1','hours','value','Field']))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如果第一个数据帧中存在行,如何更新第二个数据帧的存在值

如何为第一个数据帧中匹配的特定列值的所有值获取第二个数据帧的数据?

如何仅将行从一个数据帧移动到第二个数据帧中不存在 ID 的另一个数据帧?

根据第二个数据帧中 2 列中的值,为第一个数据帧中的某些列添加后缀

R根据另一个中的值搜索第二个数据帧

根据第二个数据帧汇总一个数据帧

检查标签,一个数据帧中的位置是否落在标签中,不同长度熊猫的第二个数据帧的范围

如何根据第二个中的可能值范围合并两个数据帧,但保留第一个中的值?

从具有不同开始日期的第二个数据帧中过滤第一个数据帧的行

出现在第二个数据帧中的第一个数据帧的密钥并标记该事实

在第二个数据帧中映射负值,保留坐标并替换第一个数据帧

使用 Pyspark 查找第二个数据帧中未找到的行以及第一个数据帧的行号

pandas concat 将数据帧列表合并到另一个数据帧

合并数据帧,以便将一个数据帧中的值插入到另一个数据帧中匹配的行号中

从另一个数据帧中删除数据帧,该另一个数据帧是第一个数据帧的已过滤子集

将一个数据帧中的NA值替换为第二个数据帧中的值

将一个数据帧中的值匹配到不同长度的第二个数据帧中的值

检查第一个数据帧值以任何第二个数据帧值开始

使用第二个数据帧中的行连接数据帧,这些行在第一个数据帧中不存在,基于列的子集

在python熊猫中,如何合并两个数据帧,同时使用另一个的权重将值散布在一个数据中?

根据另一个数据帧中的值将数据帧的列相乘

在熊猫中,如何将一行数据帧插入另一个数据帧?

根据另一个数据帧中的值查找熊猫数据帧中的区间

根据来自另一个数据帧的条件更简单地删除熊猫数据帧中的行

Pyspark:内部连接两个 pyspark 数据帧并选择第一个数据帧中的所有列和第二个数据帧中的几列

提取熊猫数据帧中的特定列值比较另一个数据帧

映射两个数据帧,计算第二个数据帧中的时间戳在第一个数据帧的日期时间范围内的事件

两个数据帧之间的条件格式,在第二个数据帧中,如果条件对第一个数据帧有效,我想备注为真

使用setDT将一个数据帧中的许多列合并到另一数据帧中