我在数据框的列中有以下字符串:
"LOCATION: FILE-ABC.txt"
"DRAFT-1-FILENAME-ADBCD.txt"
我想提取单词FILE和“。”之间的所有内容。但是我想包括第一个定界符。基本上,我试图返回以下结果:
"FILE-ABC"
"FILENAME-ABCD"
为此,我使用以下脚本:
df['field'] = df.string_value.str.extract('FILE/(.w+)')
但是我无法返回所需的信息(总是不可用)。
我怎样才能做到这一点?
您可以在正则表达式中完成所有这些操作,而不必使用字符串切片。
df['field'] = df.string_value.str.extract('(FILE.*(?=.txt))')
方便的正则表达式工具https://pythex.org/
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句