我有以下基表,我想将其分成一个有番石榴表和一个没有番石榴表。我正在考虑使用标志来获取下面的中间表,但不确定从那里去哪里。
基表
user_id fruit
user1 passionfruit
user1 guava
user1 banana
user2 orange
user2 coconut
user3 guava
user4 melon
有番石榴
user_id fruit
user1 passionfruit
user1 guava
user1 banana
user3 guava
没有番石榴
user_id fruit
user2 orange
user2 coconut
user4 melon
中间表
user_id fruit has_guava
user1 passionfruit 0
user1 guava 1
user1 banana 0
user2 orange 0
user2 coconut 0
user3 guava 1
user4 melon 0
groupby
那就试试吧filter
。
df_ = (df.
groupby('user_id').
filter(lambda group: group['fruit'].eq('guava').any())
)
print(df_)
user_id fruit
0 user1 passionfruit
1 user1 guava
2 user1 banana
5 user3 guava
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句