我有一个csv文件,并具有v3列,但该列具有一些“ nan”行。除了行,我怎么能。
dataset = pd.read_csv('mypath')
enc = LabelEncoder()
enc.fit(dataset['v3'])
print('fitting')
dataset['v3'] = enc.transform(dataset['v3'])
print('transforming')
print(dataset['v3'])
print('end')
编辑:V3列具有A,C,B,A,C,D 、、、 A,S,就像这样,我想将其转换为(1,2,3,1,2,4 ,,, 1, 7)
使用〜isnull()屏蔽nan值:
mask = ~dataset['v3'].isnull()
dataset['v3'][mask] = enc.fit_transform(dataset['v3'][mask])
另一种方法是使用pandas.factorize函数,该函数自动处理nan(将它们分配为-1):
dataset['v3'] = dataset['v3'].factorize()[0]
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句