如何从第一个方括号和最后一个圆括号中拆分 R 中的字符串？

Eva 发表于 Dev

伊娃

我正在处理法律引用。我想将引文分成四个部分。引文的一般格式如下：ABC v. DEF [Year] 引文数据（权威）所以，我想把它分成四个部分 - ABC v. DEF、年份、引文数据和权威。问题是第一部分（即 ABC v. DEF）可能有额外的圆括号，而第三部分（即引文数据）可能有额外的方括号和/或圆括号。例如，在以下这种情况下

"Lubrizol Corporation, USA v. Asstt. DIT (International Taxation) [2013] 33 taxmann.com 424/60 SOT 118 (URO) (Mum. Trib.)"

第一部分是"Lubrizol Corporation, USA v. Asstt. DIT (International Taxation)"，第二部分是"2013"，第三部分是"33 taxmann.com 424/60 SOT 118 (URO)"，最后一部分是"Mum. Trib."我无法想出正确的正则表达式来做到这一点。谁能帮我解决这个问题？

克里斯·鲁勒曼

使用extract：

library(tidyr)
data.frame(txt) %>%
  extract(txt,
          into = c("First", "Sec", "Thrd", "Frth"),
          regex = "(.+)\\[(\\d+)\\](.*)\\((.*)\\)")
                                                              First  Sec                                  Thrd       Frth
1 Lubrizol Corporation, USA v. Asstt. DIT (International Taxation)  2013  33 taxmann.com 424/60 SOT 118 (URO)  Mum. Trib.

该regex部分看起来比实际更可怕：您只需完整地描述字符串，将您希望提取的部分包装到括号中（用于捕获组的语法）

数据：

txt <- "Lubrizol Corporation, USA v. Asstt. DIT (International Taxation) [2013] 33 taxmann.com 424/60 SOT 118 (URO) (Mum. Trib.)"

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-08-14

我来说两句

0 条评论

登录后参与评论

上一篇：如何计算字符串编写较少代码中的大写和小写字母？

TOP 榜单

文章

如何从第一个方括号和最后一个圆括号中拆分 R 中的字符串？

如何从第一个方括号和最后一个圆括号中拆分 R 中的字符串？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用