在r中使用正则表达式在句点之后添加空间(如果不存在)

Bahi8482

我将文本文件导入到r中,并且正在使用一个函数,该函数确定句点的句号以句点结尾,然后以空格隔开。. 某些句点在句点后没有空格,因此我尝试编写可解决此问题的正则表达式。正则表达式必须特定于后跟单词(不是数字)的句点,因此它不会在小数点后插入空格。

我在下面的示例中尝试使用此正则表达式,但是可以用空格替换句点之后的第一个字母。我正在尝试在句号和下一个单词之间添加空格而不删除。

谢谢

x = " In water, the hydrogen atoms are close to two corners of a tetrahedron centered on the oxygen.At the other two corners are lone pairs of valence electrons that do not participate in the bonding.In a perfect tetrahedron, the atoms would form a 109.5° angle."

gsub("\\.([A-Za-z])", ". ", x)
罗纳克·沙

您可以使用正向前瞻,这样您就不会错过句点之后的第一个字母。

gsub("\\.(?=[A-Za-z])", ". ", x, perl = TRUE)

#" In water, the hydrogen atoms are close to two corners of a tetrahedron 
#centered on the oxygen. At the other two corners are lone pairs of valence 
#electrons that do not participate in the bonding. In a perfect 
#tetrahedron, the atoms would form a 109.5° angle."

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

正则表达式匹配其他组(如果不存在正确的组)

正则表达式为camelCase添加空间-但如果存在尾随的upperCase字母则不添加

使用替换删除正则表达式匹配中不存在的字符

正则表达式表达式捕获现有和不存在的数据

使用正则表达式删除重复的特殊字符(如果单独存在,但在被单词或数字包围时不存在)

如果不存在匹配项,如何匹配正则表达式中可能存在或不存在但具有占位符的字符串

正则表达式,如果不存在某些东西,如何将其匹配为true?

如果不存在纯正则表达式替换,则在URL查询字符串中插入参数

使用.replace检查正则表达式的空间,逗号和句点?

在数字之间添加句点的正则表达式

正则表达式捕获可能存在或可能不存在的组组

正则表达式:排除捕获可能存在或可能不存在的模式

正则表达式匹配可能存在或可能不存在

可能存在或可能不存在的正则表达式替代方案

当某些字符串部分不存在时,使用正则表达式提取多个部分

正则表达式:治疗组为可选的,如果它不存在,但如果只存在之前捕捉到前一组

正则表达式匹配字符似乎不存在

正则表达式:捕获组可能不存在。我该怎么写?

如何匹配某些东西,正则表达式中可能不存在?

当捕获组不存在时,正则表达式将捕获所有内容

正则表达式以匹配可能不存在的组

不存在先行数据时的正则表达式正先行(PCRE)

仅当字符串不存在时正则表达式匹配

正则表达式组可能不存在

正则表达式使用逗号和句点Python

在R中使用正则表达式序列的正则表达式数据清除

如果存在小数则使用正则表达式的第一部分进行匹配,如果不存在则使用第二部分进行匹配

如果其中存在/不存在特定数字,则正则表达式匹配整个字符串

在正则表达式中,如果 a 或 b 之后存在任何字符,则必须是 / 字符