当正则表达式的一部分要保留在后续的拆分字符串中时，如何用正则表达式拆分R中的字符串？

AllenH 发表于 Dev

艾伦

我有一个这样的字符串向量x = c("ABC", "ABC, EF", "ABC, DEF, 2 stems", "DE, other comments, and stuff")。

我想将它们分成两个部分：1）大写字母集（2或3个字母，用逗号隔开），以及2）最后一个“ [AZ] [AZ]”之后的所有内容。

结果应该是

 [[1]]
[1] "ABC"

[[2]]
[1] "ABC, EF"

[[3]]
[1] "ABC, DEF"      "2 stems"

[[4]]
[1] "DE"  "other comments, and stuff"

我尝试了strsplit(x, "[A-Z][A-Z], [a-z0-9]")和strsplit(x, "(?:[A-Z][A-Z], )[a-z0-9]")，两者都返回了

[[1]]
[1] "ABC"

[[2]]
[1] "ABC, EF"

[[3]]
[1] "ABC, D"      " stems"

[[4]]
[1] ""                        "ther comments, and stuff"

分割位置的标识取决于第一个子字符串的结尾和第二个子字符串的开头，因此这些部分将从最终结果中排除。

如上所示，在将拆分正则表达式的相关部分包含在每个子字符串中的过程中，如上所示，对您的任何帮助都表示赞赏！

阿克伦

一种选择是 str_split

library(stringr)
str_split(x, ", (?=[a-z0-9])", n = 2)
#[[1]]
#[1] "ABC"

#[[2]]
#[1] "ABC, EF"

#[[3]]
#[1] "ABC, DEF" "2 stems" 

#[[4]]
#[1] "DE"                        "other comments, and stuff"

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-4

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

当正则表达式的一部分要保留在后续的拆分字符串中时，如何用正则表达式拆分R中的字符串？

当正则表达式的一部分要保留在后续的拆分字符串中时，如何用正则表达式拆分R中的字符串？

我来说两句

相关文章

TOP 榜单

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）

热门标签

归档