小编Roh*_*hit的帖子

带有 utf-8 文本的脚本与 Windows 中的 RStudio 和命令行的运行方式不同

我正在处理包含印地语文本的文件并解析它们。我在 Rstudio 中编写了我的代码并执行它没有很多问题。但是现在,我需要使用 R.exe/Rscript.exe 从命令行执行相同的脚本,但它的工作方式不同。我从 RStudio 和终端运行了一个简单的脚本:

n_p<-'???'

Encoding(n_p)

gregexpr(n_p,c('adfdafc','??? adsfdfa'))
sessionInfo()
Run Code Online (Sandbox Code Playgroud)

RStudio 中的输出:

> n_p<-'???'
> 
> Encoding(n_p)
[1] "UTF-8"
> 
> gregexpr(n_p,c('adfdafc','??? adsfdfa'))
[[1]]
[1] -1
attr(,"match.length")
[1] -1

[[2]]
[1] 1
attr(,"match.length")
[1] 3

> sessionInfo()
R version 3.5.0 (2018-04-23)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7600)

Matrix products: default

locale:
[1] LC_COLLATE=English_India.1252  LC_CTYPE=English_India.1252   
[3] LC_MONETARY=English_India.1252 LC_NUMERIC=C                  
[5] LC_TIME=English_India.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] …
Run Code Online (Sandbox Code Playgroud)

regex windows r utf-8

5
推荐指数
2
解决办法
1845
查看次数

标签 统计

r ×1

regex ×1

utf-8 ×1

windows ×1