我有两个要关注的数据框:df_hours和new_df
我想检查整个数据帧(new_df)中是否不存在数据帧(df_hours)的字符串值。
例如,df_hours的'Category'列具有字符串值'A','B','C'等。我想检查new_df中是否不存在'A'。
我有2个for循环,并且在其中有以下if条件:
for i in range(len(df_hours)):
for j in range(len(df_hours_copy)):
if df_hours.iloc[i,1] == df_hours_copy.iloc[j,1] and (~df_hours.iloc[i,1].isin(new_df)):
我该如何编码if的第二部分(“ and”之后的部分)?
想法:通过下面的代码and
,我只想检查new_df中是否不存在该值,然后从中插入一些值df_hours
到new_df
。
您可以使用any
和列表推导来收集您系列中new_df中的所有缺失值:
[value for value in df_hours["Category"].unique() if not (new_df==value).any().any()]
调用.any()
一次将按列查找值。第二个调用将检查结果序列中是否有True。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句