我有一个列表,其中包含pandas Dataframe可以包含的所有可能的列。
possible_values = ['apples','banana','orange']
我试图执行检查,以便如果一个数据框没有按照上述列表包含所有列,则需要将该列添加到值设置为0的数据框中
例如,如果我拥有的数据框包含以下列,则需要添加其他两个缺少的列
df.columns = ['apples']
预期产量
df.columns = ['apples','banana','orange']
您可以像这样遍历各列并创建一个新列。
df = pd.DataFrame({'apples' : [1,2,3]})
possible_values = ['apples','banana','orange']
for val in possible_values:
if val not in df.columns:
df[val] = 0
df
输出:
apples banana orange
0 1 0 0
1 2 0 0
2 3 0 0
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句