我有两个数据框df1
和df2
。在df1
已经重复的文字WRT列name
,但列hobby
的变化。该df2
列中也有重复的文字name
。我想合并两个数据框并保留所有内容。
df1:
name hobby
mike cricket
mike football
jack chess
jack football
jack vollyball
pieter sleeping
pieter cyclying
我df2
是
df2:
name
mike
pieter
jack
mike
pieter
现在,我必须df2
与df1
onname
列合并,因此我的结果df3
应如下所示:
df3:
name hobby
mike cricket
mike football
pieter sleeping
pieter cyclying
jack chess
jack football
jack vollyball
mike cricket
mike football
pieter sleeping
pieter cyclying
IIUC,您要为分配一个订单df2
,在上合并name
,然后按上述顺序排序:
(df2.assign(rank=np.arange(len(df2)))
.merge(df1, on='name')
.sort_values('rank')
.drop('rank', axis=1)
)
输出:
name hobby
0 mike cricket
1 mike football
4 pieter sleeping
5 pieter cyclying
8 jack chess
9 jack football
10 jack vollyball
2 mike cricket
3 mike football
6 pieter sleeping
7 pieter cyclying
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句