在数据框中查找和替换字符串

韦斯卡

嗨,我想在数据帧值中查找特定术语,然后通过与字典键匹配来替换它们。

数据框:

    Search         term               Application
safe high school   trip                1
spring break       trips               2
gap year           trips               1

我有一个要在字典中替换的单词列表,键是要查找的术语,然后用值替换。

{'high school': ['high-school'],
'spring break': ['spring-break'],
'gap year': ['gap-year']}

创意输出:

    Search         term               Application
safe high-school   trip                1
spring-break       trips               2
gap-year           trips               1

我找不到替换数据帧值中部分字符串的方法,因此目前我将数据帧读取为字符串

with open('df.csv','r',encoding='UTF-8') as f:
    s = f.read() + '\n'

然后使用 str.replace 像这样一一替换它们,它可以完成工作但效率低下。

s = str.replace(s, 'gap year', 'gap-year')

如果有办法用“-”替换特定术语中的空格,则无需使用字典

谢谢

耶斯列

首先通过删除列表更改字典,然后Series.replace使用regex=True替换子字符串:

d = {'high school': 'high-school',
     'spring break': 'spring-break',
     'gap year': 'gap-year'}

df['Search term'] = df['Search term'].replace(d, regex=True)

print (df)
             Search term  Application
0  safe high-school trip            1
1     spring-break trips            2
2         gap-year trips            1

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

在数据框中查找并替换部分字符串?

在数据框python中替换字符串

Pandas:在数据框中的所有列中搜索和替换字符串

在数据框中查找字符串的索引和列数

在数据框列 Python 中查找和删除子字符串

使用字符串向量在数据框中查找字符串

熊猫数据框通过查找子字符串替换多列中的字符串

我想根据姓名和姓氏在数据框中查找重复项。使用部分字符串匹配

在数据框中查找字符串并将新值存储在新列中

在字符串中查找和替换字符串

在数据框中全局替换部分字符串

使用可为空的布尔值在数据框中查找空字符串

如何在数据框中查找包含以下划线的文本的字符串

使用 PANDAS 在数据框列中查找多个精确的字符串匹配

在数据框列中的字符串“ Quote”之后查找数字

R-在数据框中查找字符串的每个位置

如何在数据框中按列查找最大字符串长度

Python Pandas-在数据框中查找子字符串,然后求和而无循环

在数据框字符串列中查找单词列表

仅在熊猫数据框中查找并用数字替换字符串

根据文本框和字符串在数据库中查询搜索

在数据框中拆分字符串

在数据框中乘以字符串?

根据字典在数据框中搜索字符串

在数据框中删除字符串以创建组

在数据框中搜索匹配的子字符串

R:在数据框列中拆分字符串

如何仅在特定字符串中查找和替换MYSQL数据库中的字符串

对数据进行分组后在数据框中查找空字符串时出错