我有很多在新行之间带有破折号的单词文本,如下所示:
vec <- "Today is a good day because the sun is shin- ing."
我想要的是:
"Today is a good day because the sun is shining."
但我不希望它只针对特定的单词,而是针对所有像这样“分解”的单词。这似乎是您应该能够以 Word 格式执行的操作,但我一直无法弄清楚如何做,所以可能更复杂。
作为记录,我正在使用readtext
/quanteda
包,但我在那里找不到任何至少可以在默认情况下执行此操作的内容。
有没有一些简单的方法可以做到这一点?
这是一种方法。我们可以str_replace_all
从stringr
包中使用。
vec <- "Today is a good day because the sun is shin- ing."
library(stringr)
vec2 <- str_replace_all(vec, "-\\s+", "")
vec2
# [1] "Today is a good day because the sun is shining."
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句