Pandas DataFrame-提取两个字符串之间的字符串,并包含第一个定界符

佩德罗·阿尔维斯(Pedro Alves)

我在数据框的列中有以下字符串:

"LOCATION: FILE-ABC.txt"
"DRAFT-1-FILENAME-ADBCD.txt"

我想提取单词FILE和“。”之间的所有内容。但是我想包括第一个定界符。基本上,我试图返回以下结果:

"FILE-ABC"
"FILENAME-ABCD"

为此,我使用以下脚本:

df['field'] = df.string_value.str.extract('FILE/(.w+)')

但是我无法返回所需的信息(总是不可用)。

我怎样才能做到这一点?

伊桑·金

您可以在正则表达式中完成所有这些操作,而不必使用字符串切片。

df['field'] = df.string_value.str.extract('(FILE.*(?=.txt))')
  • FILE是我们开始比赛的依据
  • 。*可以获取任意数量的字符
  • (?=)是一个无需消耗即可匹配的前瞻性断言。

方便的正则表达式工具https://pythex.org/

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Pandas DataFrame:如何从并非总是以两个数字结尾的列中提取最后两个字符串类型的数字

Pandas Dataframe列删除第一个特定字符之前的字符串

python pandas get列的第一个元素包含一个字符串

Python / Pandas:在一个步骤中是否不包含两个字符串中的任何一个的列?

在 Pandas Dataframe 的每一行中搜索一个字符串并返回找到的列名

返回Pandas Dataframe中字符串中第一个数字/字母的索引/位置

R Dataframe-在两个字符串之间添加换行符或空格

在 Pandas 数据帧中提取字符串中两个字符之间的子字符串

两个字符串值之间的子集 df - pandas

通过包含多个字符串的标头过滤Pandas Dataframe列

获取两个字符串之间的字符串-第一个字符串以换行符结尾

从pandas DataFrame中的多个字符串列中删除子字符串

在单个Pandas Dataframe列中将字符串与数字分开,并创建两个新列

如何使用字符串中的位置更改Pandas Dataframe列中的每个字符串

使用两个字符串切片Pandas数据框

Pandas Dataframe在使用.loc的列中未返回1个字符串值的结果

比较pandas DataFrame列中的多个字符串

从pandas dataframe列的字符串中提取数字

Pandas Dataframe:从字符串中提取数值(包括小数)

如何从字符串的选定部分创建一个 pandas DataFrame

如何从字符串中删除第一个字符并将其存储到 Pandas 的新列中?

删除部分字符串pandas DataFrame

从字符串创建Pandas DataFrame

来自原始字符串的Pandas DataFrame

用pandas DataFrame制作字符串

从字符串到 Pandas DataFrame (Python)

在Perl中使用regex检索两个字符串定界符之间的字符串

Java:搜索两个字符串之间的第一个公共字符

在Ruby中找到两个字符串之间的第一个不同字符