我有一个带有两列的pandas数据框,如下所示:
A B
Yes No
Yes Yes
No Yes
No No
NA Yes
NA NA
我想基于这些值创建一个新列,以便如果有任何列值Yes
,则新列中的值也应为Yes
。如果两个列都具有该值No
,则新列也将具有该值No
。最后,如果两个列都具有value NA
,NA
则新列的输出也将具有。以上数据的示例输出为:
C
Yes
Yes
Yes
No
Yes
NA
我在数据帧的长度上编写了一个循环,然后检查每个值以获取新列。但是,要保存1000万条记录要花费很长时间。有没有更快的pythonic方法来实现这一目标?
就像是
df.fillna('').max(axis=1)
Out[106]:
0 Yes
1 Yes
2 Yes
3 No
4 Yes
5
dtype: object
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句