与R中的语言环境设置混淆

阿维纳什·拉吉(Avinash Raj)

刚才我回答了R问题中的欧元符号后的“删除字符”但是r代码对在Ubuntu上的其他人有用的地方对我来说不起作用。

这是我的代码。

x <- "services as defined in this SOW at a price of € 15,896.80 (if executed fro"
euro <- "\u20AC"
gsub(paste(euro , "(\\S+)|."), "\\1", x)
# "" 

我认为这全都与更改语言环境设置有关,我不知道该怎么做。

我在Windows 8上运行rstudio。

> sessionInfo()
R version 3.2.0 (2015-04-16)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 8 x64 (build 9200)

locale:
[1] LC_COLLATE=English_United States.1252 
[2] LC_CTYPE=English_United States.1252   
[3] LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C                          
[5] LC_TIME=English_United States.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods  
[7] base     

loaded via a namespace (and not attached):
[1] tools_3.2.0

@Anada的答案很好,但是encoding每次在正则表达式中使用unicode时,都需要添加该参数。有什么方法可以将默认编码修改为utf-8Windows?

A5C1D2H2I1M1N2O1R2T1

似乎是编码问题。

考虑:

x <- "services as defined in this SOW at a price of € 15,896.80 (if executed fro"
gsub(paste(euro , "(\\S+)|."), "\\1", x)
# [1] ""
gsub(paste(euro , "(\\S+)|."), "\\1", `Encoding<-`(x, "UTF8"))
# [1] "15,896.80"

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章