R：正则表达式可以匹配多个管道

Parseltongue

我有一个数据集，其中将值粘贴到dplyr链中，并使用竖线字符（例如“ |”）折叠。如果数据集中的任何值都为空，那么我只会在粘贴列表中得到重复的管道字符。

其中一些值如下所示：

badstring = "| | | | | | GHOULSBY,SCROGGINS | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | CAT,JOHNSON | | | | | | | | | | | | BURGLAR,PALA | | | | | | | | |"

我想匹配所有不止一次出现的管道，并删除它们，以使名称看起来像这样：

correctstring = "| GHOULSBY,SCROGGINS | CAT,JOHNSON | |BURGLAR,PALA |"

我尝试了以下操作，但无济于事：

mutate(names = gsub('[\\|]{2,}', '', name_list))

蒂姆·比格莱森

这个问题的难点在于制定一个正则表达式，该正则表达式可以有选择地删除每条管道，但我们希望保留为术语之间的实际分隔符的管道除外。我们可以按照以下模式进行匹配：

\|\s+(?=\|)

然后替换为空字符串。只要遵循的是另一个管道，此模式将删除任何管道（以及随后的空白）。当在管道后面加上一个实际术语时，或者在该字符串后面加上字符串时，都不会发生删除。

badstring = "| | | | | | GHOULSBY,SCROGGINS | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | CAT,JOHNSON | | | | | | | | | | | | BURGLAR,PALA | | | | | | | | |"

result <- gsub("\\|\\s+(?=\\|)", "", badstring, perl=TRUE)
result

[1] "| GHOULSBY,SCROGGINS | CAT,JOHNSON | BURGLAR,PALA |"

演示版

编辑：

如果您希望像| | |这样的输入不包含任何术语，并且希望将空字符串作为输出，那么我的解决方案将失败。我看不到一种修改上述regex的明显方法，但是您可以通过再调用以下方法来处理这种情况sub：

result <- sub("^\\|$", "", result)

我们还可以修改原始模式以使用覆盖所有情况的替代方式：

result <- gsub("\\|\\s+(?=\\|)|(?:^\\|$)", "", badstring, perl=TRUE)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-8

我来说两句

0 条评论

登录后参与评论

上一篇：errno == ENOENT是否足以检查C中是否存在文件？

R正则表达式匹配/省略多个重复

正则表达式的多个匹配

多个正则表达式匹配

正则表达式匹配多个表达式？

正则表达式最佳实践：可以使用正则表达式匹配多个短语吗？

Jenkins管道正则表达式模式不匹配

正则表达式可以在连字符之前匹配所有内容-多个匹配

python正则表达式：匹配多个正则表达式之一

正则表达式：是否可以在正则表达式中进行子匹配？

javascript多个正则表达式匹配

正则表达式匹配多个 if then else 条件

正则表达式匹配多个实例

正则表达式-匹配多个组

正则表达式以匹配网址中的多个单词

perl，匹配多个正则表达式之一

Python正则表达式拆分多个匹配项

正则表达式匹配多个<images>标签

正则表达式不返回多个匹配项

正则表达式：匹配多个允许的长度？

正则表达式拆分为多个匹配项

Python正则表达式不匹配多个组

正则表达式以匹配多个以空格分隔的子网

匹配Javascript中的多个正则表达式组

正则表达式：多次匹配多个单词

正则表达式匹配多个模式

Powershell-正则表达式多个匹配项

bash正则表达式的多个匹配行为异常？

正则表达式单行多个匹配

正则表达式：模式匹配多个模式

TOP 榜单

文章

R：正则表达式可以匹配多个管道

R：正则表达式可以匹配多个管道

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值