分隔符字符串拆分

迈克尔·克罗奇卡

我有一个数据集,其中一些值由 '\n' 分隔,一些值由 '\n\n' 分隔。我已经编写了一些分别适用于每种情况的代码,但我想知道是否有一种方法可以包含这两个分隔符,以便将它们拆分为 '\n' 或 '\n\n'。在当前设置中,它抛出错误“列的长度必须与键的长度相同”。

代码:

temp = result['personal_info'].str.replace(' -- ', '|').str.split('|', expand = True)
temp[[1,4]] = temp[1].str.split('\n', expand = True)
temp = temp.rename(columns={0: "occupation", 1: "country", 2: "employer_type", 3: "race", 4: "relationship_status"})
final_df = result
final_df = pd.concat([final_df, temp], axis=1, sort=False)
final_df = final_df.drop('personal_info', axis=1)

此代码适用于“\n”,如果我将其更改为“\n\n”,则它适用于“\n\n”。

样本输入:

'专业教授|美国\n\n未婚 -- 地方政府|白人'

'专业教授|美国\n未婚 -- 地方政府|白人'

匿名的

您可以将正则表达式与 Pandas 拆分一起使用:

temp[[1,4]] = temp[1].str.split('\n+', expand = True)

如果至少有一个\n.

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Java Regex在分隔符和保留分隔符之间拆分字符串

如何拆分字符串并保留特定的分隔符?

在SQL Server中将字符串拆分为给定的行分隔符和列分隔符的表

如何在Python中使用多个分隔符拆分字符串而不删除分隔符?

在多个分隔符上拆分字符串,同时保留一个或多个分隔符

在动态分隔符上拆分字符串

将字符串拆分为数组,在Swift中保留定界符/分隔符

在带有多个分隔符的python中拆分字符串的最佳方法-同时保留分隔符

字符串拆分字符串具有多列的分隔符

使用多个分隔符拆分数组(特殊字符和字符串)

Kotlin:拆分字符串空格分隔符

使用组分隔符 (GS) 拆分字符串

使用分隔符拆分和发布字符串

按分隔符拆分字符串

将一串字符串拆分为 2 个分隔符

拆分字符串多个分隔符

字符串开头的分隔符

使用分隔符拆分字符串

Python - 如何拆分包含转义字符作为分隔符的字符串?

使用多个分隔符拆分字符串

拆分字符串但分隔符,仅在 [...] 对之外

拆分字符串但保留 C 中的分隔符

如何使用多个分隔符拆分字符串?

使用多个分隔符拆分字符串并保留分隔符

如何拆分字符串但保留分隔符?

拆分字符串並保留分隔符

使用分隔符 Java 分隔位置值的拆分字符串

通过多个分隔符拆分字符串并保留分隔符

如何使用多字符分隔符和包含分隔符的字段拆分字符串