我有以下一行,
typeName="ABC:xxxxx;";
我需要拿这个词ABC
,
我写了以下代码片段,
Pattern pattern4=Pattern.compile("(.*):");
matcher=pattern4.matcher(typeName);
String nameStr="";
if(matcher.find())
{
nameStr=matcher.group(1);
}
所以,如果我说group(0)
得到,ABC:
但是如果我说group(1)
是ABC
,那么我想知道
这是什么0
和1
意味着什么呢?如果有人可以用很好的例子向我解释,那会更好。
正则表达式模式中包含一个:
,那么为什么group(1)
结果忽略了它呢?组1是否检测到括号内的所有单词?
因此,如果我\\s*(\d*)(.*)
再加上两个括号,例如:,那么会有两个小组吗?group(1)
将退还(\d*)
零件并group(2)
退还(.*)
零件?
给出代码段的目的是消除我的困惑。这不是我要处理的代码。上面给出的代码可以用String.split()
一种更简单的方式来完成。
捕获组将 (pattern)
创建一个具有捕获属性的组。
您可能经常看到(和使用)的一个相关的对象是(?:pattern)
,它创建了一个不捕获属性的组,因此命名为non-captureing group。
通常,当您需要重复一系列模式(例如(\.\w+)+
)或指定交替应在何处生效(例如^(0*1|1*0)$
(^
,然后0*1
或1*0
,然后$
)与^0*1|1*0$
(^0*1
或1*0$
))时,通常使用组。
除分组外,捕获组还将记录与捕获组内的模式匹配的文本(pattern)
。使用你的榜样,(.*):
,.*
比赛ABC
和:
比赛:
,由于.*
是内捕获组(.*)
,该文本ABC
被记录,捕获组1。
整个模式定义为组号0。
模式中的任何捕获组均从1开始索引。索引由捕获组的左括号的顺序定义。举例来说,以下模式是所有 5个捕获组:
(group)(?:non-capturing-group)(g(?:ro|u)p( (nested)inside)(another)group)(?=assertion)
| | | | | | || | |
1-----1 | | 4------4 |5-------5 |
| 3---------------3 |
2-----------------------------------------2
组号用于\n
模式和$n
替换字符串中的向后引用。
在其他正则表达式类型(PCRE,Perl)中,它们也可以用于子例程调用中。
您可以使用访问特定组匹配的文本Matcher.group(int group)
。可以使用上述规则标识组号。
在某些regex样式(PCRE,Perl)中,有一个分支重置功能,该功能使您可以使用相同的数字来捕获交替不同分支中的组。
在Java 7中,您可以定义一个命名的捕获组 (?<name>pattern)
,并且可以访问与匹配的内容Matcher.group(String name)
。正则表达式更长,但是代码更有意义,因为它表明您正在尝试与正则表达式匹配或提取的内容。
组名\k<name>
在模式和${name}
替换字符串的反向引用中使用。
命名的捕获组仍使用相同的编号方案进行编号,因此也可以通过进行访问Matcher.group(int group)
。
在内部,Java的实现只是从名称映射到组号。因此,不能将相同的名称用于2个不同的捕获组。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句