我有一个数据框,要为其创建一个列来表示数据框中的缺失值模式。例如:
例如对于 CSV 文件,
A,B,C,D
1,NaN,NaN,NaN
Nan,2,3,NaN
3,2,2,3
3,2,NaN,3
3,2,1,NaN
我想创建一个列 E,它具有以下值:如果 A、B、C、D 都缺少 E = 4,如果 A、B、C、D 都存在 E = 0,如果 A 和 B 是只缺少那种 E = 1,E 的编码不必像我提到的那样只是模式的指示。我怎么能在熊猫中遇到这个问题?
用isnull
结合sum(axis=1)
例子:
import pandas as pd
df = pd.DataFrame({'A': [1, None, 3, 3, 3],
'B':[ None, None, 1, 1, 1]})
df['C'] = df.isnull().sum(axis=1)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句