大熊猫:根据现有列将列添加到DataFrame

迈克·H

我有2个用Python处理的pandas DataFrame,我想根据某个列(col_1)组合它们:

#df1
    col_1   col_2          
0       3       7            
1       4       8            
2       5       5    

#df2
  col_1    col_3 
0     4       78
1     5       89

并且输出应如下所示:

    col_1   col_2   col_3
0   3       7       0
1   4       8       78
2   5       5       89  

我不确定如何使用“最佳做法”进行此操作。

谢谢。

艾伦

假设您有:

df1=pd.DataFrame({'col_1': {0: 3, 1: 4, 2: 5}, 'col_2': {0: 7, 1: 8, 2: 5}})
df2=pd.DataFrame({'col_1': {0: 4, 1: 5}, 'col_3': {0: 78, 1: 89}})

您可以使用合并:

pd.merge(df1,df2,on='col_1',how='left').fillna(0)
Out[22]: 
   col_1  col_2  col_3
0      3      7    0.0
1      4      8   78.0
2      5      5   89.0

如果您需要col_3作为int(感谢piRSquared的建议):

pd.merge(df1,df2,on='col_1',how='left').fillna(0, downcast='infer')

Out[25]: 
   col_1  col_2  col_3
0      3      7      0
1      4      8     78
2      5      5     89

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

大熊猫-根据变量将值添加到列中,并将标题添加到mutltiindex(header)中

大熊猫-根据多行中的值将汇总列数据的行添加到数据框中

大熊猫递归read_csv,同时将列添加到每个

如何列分隔符添加到大熊猫数据帧显示

熊猫:根据现有数据,将一列添加到数据框,作为链接操作

将缺失观测值的变量添加到现有大熊猫df中,而不会丢失较大df中的观测值

根据现有列中的值将值添加到Pandas中的新列中

根据现有列与pyspark的交互将新列添加到数据框

根据现有列中的布尔值将列添加到pandas数据框

根据现有列的分类值将列添加到数据框

根据现有列的相邻值将列添加到Pandas数据框

根据现有列中的值将新列添加到 R tibble

根据R中现有列中的值将列添加到数据框

如何使用EF迁移将新列添加到现有表并根据现有列设置其值

将多个列添加到DataFrame并将其设置为等于现有列

根据熊猫的状况将年添加到日期列

根据数据将标识值添加到现有列

根据逗号将值0添加到现有列

将值添加到Spark DataFrame列中的现有嵌套json中

将StringType列添加到现有的Spark DataFrame,然后应用默认值

使用withColumn将两列添加到现有DataFrame

Apache Spark,将“ CASE WHEN ... ELSE ...”计算列添加到现有DataFrame

将生成的列添加到现有表Postgres

Impala将列添加到现有VIEW

无法将列添加到现有表

将新的枚举列添加到现有表

PostgreSQL将现有列添加到复合主键

将外键列添加到现有表

将列添加到现有余烬模型