我有以下数据框 1 df1:
index tech_1 tech_2 tech_3 .....
01_es NA NA 1
02_es 1 2 NA
03_es 2 1 2
04_es 1 NA 2
05_es NA NA NA
和另一个数据框 2 df2:
index id column_1 column_2 column_3
0 01_es data data data
1 02_es data data data
2 03_es data data data
3 04_es data data data
4 05_es data data data
每当 df1.index 将 df2.id 匹配到新的 df2.columns 时,我想将 df1“合并”到 df2 中,并将所有数据保留在 df2 上。我将用几个 df1.
新的df2:
index id column_1 column_2 column_3 tech_1 tech_2 tech_3
0 01_es data data data NA NA 1
1 02_es data data data 1 2 NA
2 03_es data data data 2 1 2
3 04_es data data data 1 NA 2
4 05_es data data data NA NA NA
df1 可能非常大,具有不同的列数,并且可能不是所有的行都是 df2.id。我有几个文件可以运行脚本。我该怎么做?
谢谢!
在此处查看文档https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.merge.html
如果保证dataframe df2 的id 列是唯一的,则可以将其设置为索引并进行合并。
df2.set_index('id').merge(df1, left_index=True, right_index=True)
现在对于 df1 中存在不同列的情况,您可以通过传递“how”参数进行合并来定义您的偏好,阅读文档了解详细信息。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句