我目前正在尝试根据大写字母在我的数据框中拆分一列。拆分有效,但大写字母在输出列中消失。我该如何解决?
原始 df 列中的行如下所示: 有家庭成员 有非家庭成员 单独
我想将这些分为三列:与家人一起|与非家庭成员一起|单独
我目前使用的公式,它去掉了大写字母:
df['travel_pal'].str.split('[A-Z]', expand=True).add_prefix('travel_pal_')
知道我该如何解决吗?
如果要将分隔符保留为 chunk 的一部分,请使用先行:
df['travel_pal'].str.split('(?=[A-Z])')
例子:
df = pd.DataFrame({'travel_pal': ['AbcDefGhi', 'aAbcDE']})
df['travel_pal'].str.split('(?=[A-Z])')
输出:
0 [, Abc, Def, Ghi]
1 [a, Abc, D, E]
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句