所以我需要分配一个没有受保护属性的新特征数据框;我提供了 2 个 .csv,其中一个包含每个实例的所有信息,另一个将每个列标记为 1,如果属性是受保护的特征,如果属性是要预测的值,则标记为 2,否则标记为 0。
我不完全确定如何解决这个问题,因为我不是很精通,但根据我的理解,这将类似于
df = pd.read_csv("x.csv")
pdf = pd.read_csv("y.csv")
newDf = df.iloc[? && pdf[cols?]]
因此,给定 2 个具有相同标签的不同数据帧:
A B C
0 7 3 1
1 8 3 1
2 9 2 1
A B C
0 0 1 1
预期输出将是:
A
0 7
1 8
2 9
您需要使用any和否定来查找0
第二个数据帧 ( df2
) 中具有值的所有列,并将其用作要从中获取的列列表df1
:
df[list(df.columns.to_series().loc[~df2.any()])]
输出:
A
0 7
1 8
2 9
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句