我有这个正则表达式:
(\s+)|([.,!?:;'\"\'-])
这与数组中的任何空格或标点匹配,但并非与所有标点匹配,因此我正在努力寻找匹配任何标点的示例。
我考虑过匹配字符不是字母数字的地方,但这会导致带重音字母和不同词典的问题。
标点符号是否包含所有内容,例如(当我说标点符号时希望包含符号):
`,。#@
等等
您可以使用[\p{P}\p{S}]
:
(\s+)|([\p{P}\p{S}])
[\p{P}\p{S}]
将匹配标点符号或字符char的任何字符。
请参阅这些类所引用的子属性列表:
标点符号 Pc标点符号,连接器包括“ _”下划线 Pd标点符号,破折号包括多个连字符 Ps标点符号,打开开括号字符 Pe标点符号,关闭闭包括号字符 Pi标点符号,初始引号引号。不包含ASCII“中性”引号。可能会像Ps或Pe一样,具体取决于用法 Pf标点,最后一个引号引起来。根据用法 Po标点,其他Symbol Sm符号,数学数学符号,其 行为可能类似于Ps或Pe (例如+,-,=,×,÷,√,∊)。不包括括号和括号,它们在类别Ps和Pe中。还不包括!,*,-或/,尽管它们经常用作数学运算符,但它们主要被认为是“标点符号”。 Sc符号,货币 货币符号 Sk符号,修饰符 So符号,其他
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句