替换字符串列表中的子字符串

134

继承的怪胎

我正在尝试清理句子以及要删除句子中的这些标签的方式（它们以下划线形式，后跟一个单词，例如“ _UH”）。基本上我想删除下划线之后的字符串（也删除下划线本身）

文本：

['hanks_NNS sir_VBP',
'Oh_UH thanks_NNS to_TO remember_VB']

需要的输出：

['hanks sir',
'Oh thanks to remember']

以下是我尝试的代码：

for i in text:
    k= i.split(" ")
    print (k)
    for z in k:
        if "_" in z:
            j=z.replace("_",'')
            print (j)

电流输出：

ThanksNNS
sirVBP
OhUH
thanksNNS
toTO
rememberVB
RemindVB

使用正则表达式：

您可以使用re.sub()。匹配字符串中所需的子字符串，然后用空字符串替换子字符串：

import re

text = ['hanks_NNS sir_VBP', 'Oh_UH thanks_NNS to_TO remember_VB']
curated_text = [re.sub(r'_\S*', r'', a) for a in text]
print curated_text

输出：

['hanks sir', 'Oh thanks to remember']

正则表达式：

_\S* - Underscore followed by 0 or more non space characters

没有正则表达式：

text = ['hanks_NNS sir_VBP', 'Oh_UH thanks_NNS to_TO remember_VB']
curated_text = [] # Outer container for holding strings in text.

for i in text:
    d = [] # Inner container for holding different parts of same string.
    for b in i.split():
        c = b.split('_')[0] # Discard second element after split
        d.append(c)         # Append first element to inner container.
    curated_text.append(' '.join(d)) # Join the elements of inner container.
    #Append the curated string to the outer container.
            
print curated_text

输出：

['hanks sir', 'Oh thanks to remember']

您的代码有问题：

实际上，您只想用'_'空字符串替换'_'，之后用空字符串替换字符。

for i in text:
    k= i.split(" ")
    print (k)
    for z in k:
        if "_" in z:
            j=z.replace("_",'') # <--- 'hanks_NNS' becomes 'hanksNNS'
            print (j)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-5

我来说两句

0 条评论

登录后参与评论

上一篇：从Azure函数中的配置文件加载连接字符串

替换字符串列表中的子字符串

替换字符串列表中的子字符串

使用正则表达式：

没有正则表达式：

您的代码有问题：

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）