为熊猫数据框中的每一行从左侧提取子字符串到特定字符?

比利赖斯

我有一个包含字符串集合的数据框。这些字符串看起来像这样:

"oop9-hg78-op67_457y"

我需要删除从下划线到结尾的所有内容,以便将此数据与另一组数据匹配。我的尝试看起来像这样:

df['column'] = df['column'].str[0:'_']

我曾尝试在此声明中玩弄 .find() ,但似乎没有任何效果。有人有什么想法吗?任何和所有的帮助将不胜感激!

呸呸呸呸

您可以尝试.str.split然后使用.str或访问列表.str.extract

df['column'] = df['column'].str.split('_').str[0]

# or

df['column'] = df['column'].str.extract('^([^_]*)_')
print(df)

           column
0  oop9-hg78-op67

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

为熊猫数据框的每一行替换一列中的字符串

如何从字符串中提取特定字符串,对于数据框中的每一行;并为每个项目计数

为数据框中的每一行创建json字符串

如何使用 awk 从文件的每一行中仅提取特定字符串?

如何在pyspark的数据框中的每一行中查找字符串

从数据框的每一行中删除日期时间字符串

从熊猫数据框中的所有行中提取子字符串

在Python数据框中的每一行的两个子字符串之间选择字符串

如何从文件的每一行中提取具有特殊字符的特定字符串

从文件的每一行提取字符串

从每一行的文本文件中提取子字符串?

删除数据框中每一行列中字符串中的重复单词

为 Pyspark 中的每一行计算列中不同的子字符串出现次数?

如何使用正则表达式选择一行以及在熊猫数据框中包含特定子字符串的行之后的固定行数

将数据框的每一行转换为字符串

熊猫如何在每一行中对连接的字符串进行排序?

如何删除熊猫数据框中具有特定字符的子字符串?

从列中的字符串沿每一行提取最大值

如何从熊猫数据框行中提取特定的字符串?

如何从熊猫数据框中的可变长度列中提取子字符串?

如何在每一行数据帧上替换字符串的特定部分?

使用Python从列的每一行中的字符串中切出子字符串

从一行中提取特定的字符串

在熊猫数据框中的特定子字符串之后提取浮点数

删除每一行中的字符串

如何使用Unix从文件的每一行中获取特定字符串的搜索计数?

在日志文件中每一行的开头打印特定的字符串

给带有特定字符串的sed文件中的每一行添加#

用bash中的特定字符串删除每一行