我有以下数据框:
df
Date Application Weekday
02.01 A 3
02.01 B 3
03.01 A 4
03.01 B 4
04.01 A 5
04.01 B 5
05.01 A 6
05.01 B 6
我想过滤掉工作日:5,6,并希望基于日期创建一个新索引,这意味着我希望获得:
df
Date Application Weekday Index
02.01 A 3 1
02.01 B 3 1
03.01 A 4 2
03.01 B 4 2
我该怎么办?
必须使用boolean indexing
和创建新列,DataFrame.assign
并且factorize
lambda函数对于处理过滤后的数据是必需的:
df = df[df['Weekday'].lt(5)].assign(Index = lambda x: pd.factorize(x['Date'])[0] + 1)
print (df)
Date Application Weekday Index
0 2.01 A 3 1
1 2.01 B 3 1
2 3.01 A 4 2
3 3.01 B 4 2
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句