小编ap5*_*p53的帖子

如何用R设置','作为小数分隔符

即使我的Windows 7区域设置指定使用","作为小数分隔符,R和RStudio给我一个"." 分隔器.有没有办法改变这个?请注意下面语言环境中的"LC_NUMERIC = C"设置:这似乎是由R或RStudio强制执行的.

由于我正处于长期项目的中间,我不愿意立即改为R 3.0和最后一个RStudio版本.有谁知道这些版本中的小数分隔符问题是否有任何变化?

我使用prettyNum解决单个数字的问题,但我不知道如何在表上使用它.

sessionInfo()R版本2.15.3(2013-03-01)平台:x86_64-w64-mingw32/x64(64位)

locale:
[1] LC_COLLATE=Spanish_Argentina.1252  LC_CTYPE=Spanish_Argentina.1252   
[3] LC_MONETARY=Spanish_Argentina.1252 LC_NUMERIC=C                      
[5] LC_TIME=Spanish_Argentina.1252    

attached base packages:
[1] grid      splines   stats     graphics  grDevices utils     datasets  methods  
[9] base     

other attached packages:
 [1] ascii_2.1          randomForest_4.6-7 pander_0.3.3       fpc_2.1-5         
 [5] flexmix_2.3-10     mclust_4.0         cluster_1.14.3     MASS_7.3-23       
 [9] Gmisc_0.5.0.0      testthat_0.7       boot_1.3-7         rms_3.6-3         
[13] miscTools_0.6-16   stringr_0.6.2      Hmisc_3.10-1       survival_2.37-2   
[17] lattice_0.20-13    xtable_1.7-1       pixmap_0.4-11      RColorBrewer_1.0-5
[21] ade4_1.5-1        

loaded via a namespace (and not attached):
[1] digest_0.6.3      evaluate_0.4.3    modeltools_0.2-19 stats4_2.15.3    
[5] tools_2.15.3  
Run Code Online (Sandbox Code Playgroud)

r separator

11
推荐指数
1
解决办法
2万
查看次数

RStudio,knitr,pandoc,Word:如何在docx中获得"新页面"?

我正在使用RStudio,knitr,pandoc,MS Word组合在docx文档中获得我的最终结果.

有时,我希望报告在新页面上继续.我找不到实现这个目标的方法.

从我用谷歌搜索,似乎有可能CSS.我不知道HTML或者CSS,但如果这是我将学习的解决方案.只是不想走错路......

r docx pandoc rstudio knitr

10
推荐指数
1
解决办法
3795
查看次数

是否有knitr选项强制包含R文件中的UTF-8编码?

我正在使用Windows 7,R2.15.3和RStudio 0.97.320与knitr knitr_1.1.6(在Yihui于3月12日修复'编码:编织和子文件'问题后下载)

> sessionInfo()
R version 2.15.3 (2013-03-01)
Platform: x86_64-w64-mingw32/x64 (64-bit)

locale:
[1] LC_COLLATE=Spanish_Argentina.1252  LC_CTYPE=Spanish_Argentina.1252    LC_MONETARY=Spanish_Argentina.1252
[4] LC_NUMERIC=C                       LC_TIME=Spanish_Argentina.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] lattice_0.20-13    pixmap_0.4-11      RColorBrewer_1.0-5 ade4_1.5-1         pander_0.3.1      
[6] xtable_1.7-1      

loaded via a namespace (and not attached):
[1] digest_0.6.3   evaluate_0.4.3 formatR_0.7    grid_2.15.3    knitr_1.1.6    stringr_0.6.2  tools_2.15.3 
Run Code Online (Sandbox Code Playgroud)

我把R代码放在像这样的文件中:

## @knitr RunMyCode 
print('Called from .R file: á é í ó ú ñ')  

# Workaround
my.text <- 'á é í ó …
Run Code Online (Sandbox Code Playgroud)

r utf-8 character-encoding knitr

7
推荐指数
1
解决办法
3286
查看次数

which.max()不返回NA

我有一堆有序的向量,包含0到1之间的数字.我需要找到第一个元素的索引超过某个值r:

x <- c(0.1, 0.3, 0.4, 0.8)
which.max(x >= 0.4)
[1] 3  # This is exactly what I need
Run Code Online (Sandbox Code Playgroud)

现在,如果我的目标值超过向量中的最大值,则.max()返回1,这可能与"真实"第一个值混淆:

which.max(x >= 0)
[1] 1
which.max(x >= 0.9) # Why?
[1] 1
Run Code Online (Sandbox Code Playgroud)

我如何修改此表达式以获得NA作为结果?

r

6
推荐指数
1
解决办法
1542
查看次数

编码:knitr和子文件

我使用Windows 7,R2.15.3和RStudio 0.97.320与knitr 1.1.不知道我的pandoc版本是什么,但我几天前下载了它.

sessionInfo()
R版本2.15.3(2013-03-01)平台:x86_64-w64-mingw32/x64(64位)

locale:
[1] LC_COLLATE=Spanish_Argentina.1252  LC_CTYPE=Spanish_Argentina.1252    LC_MONETARY=Spanish_Argentina.1252
[4] LC_NUMERIC=C                       LC_TIME=Spanish_Argentina.1252    

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

loaded via a namespace (and not attached):
[1] tools_2.15.3  
Run Code Online (Sandbox Code Playgroud)

我想在html和Word中获取我的报告,所以我使用markdown和pandoc.我用西班牙语写下了元音和元音的重音:n:á-úñ.

我看了很多帖子,我看到的问题类似于我用新版本解决的问题knitr.但有一个问题我没有找到解决方案.

当我开始,我用的是'system default'出现的在编码RStudio对话框,即ISO 8859-1,与RStudio预告伟大的工作.然而,当我试图获取Word文档时,pandoc在强调的元音上窒息.我发现了一篇帖子,展示了如何解决这个问题iconv:

iconv -t utf-8"myfile.md"| pandoc -o"myfile.docx"| iconv -f utf-8

虽然这确实解决了pandoc's无法识别的utf-8角色投诉,但出于某种原因pandoc停止查找我的情节,并出现如下错误:

pandoc:找不到图像`figure/Parent.png',跳过...

如果我只使用非重音字符,pandoc会查找没有问题的图像.我.md用 …

r utf-8 pandoc knitr

5
推荐指数
1
解决办法
1754
查看次数

在dplyr中进行%&gt;%突变

pcd <- data.frame(tripNo = c(618, 618, 610, 610, 610, 619), 
              procDate = as.Date(c('2016-03-02', '2016-03-03', '2016-03-02', '2016-03-03', '2016-03-02', '2016-03-03')),
              delay = c(7.45, 12.90, 11.88, 6.66, 12.50, 9.41) )
Run Code Online (Sandbox Code Playgroud)

我想标记在两天不同的行程中出现的不一致之处,其中第二天的延迟比前一天的最后一天的延迟短。我现在是这样做的:

pcd %>%
  arrange(tripNo, procDate, delay) %>% 
  group_by(tripNo) %>% 
  mutate(delayErr = (row_number() != 1) & (delay < lag(delay)),
         Alert = ifelse(delayErr, '!', '')) %>%
  select(tripNo, procDate, delay, delayErr, Alert)

  tripNo   procDate delay delayErr Alert
   (dbl)     (date) (dbl)    (lgl) (chr)
1    610 2016-03-02 11.88    FALSE      
2    610 2016-03-02 12.50    FALSE      
3    610 2016-03-03  6.66 …
Run Code Online (Sandbox Code Playgroud)

r dplyr

4
推荐指数
1
解决办法
5003
查看次数

为什么 tidymodels/recipes 中的“id 变量”会起到预测作用?

与使用 step_naomit 进行预测并使用 tidymodels 保留 ID是相同的问题,但即使有一个可接受的答案,OP 的最后一条评论指出了“id 变量”被用作预测器的问题,正如在查看时所看到的model$fit$variable.importance.

我有一个我想保留的带有“id 变量”的数据集。我以为我可以通过 recipe() 规范来实现这一点。

library(tidymodels)

# label is an identifier variable I want to keep even though it's not
# a predictor
df <- tibble(label = 1:50, 
             x = rnorm(50, 0, 5), 
             f = factor(sample(c('a', 'b', 'c'), 50, replace = TRUE)),
             y = factor(sample(c('Y', 'N'), 50, replace = TRUE)) )

df_split <- initial_split(df, prop = 0.70)

# Make up any recipe: just note I specify 'label' as "id …
Run Code Online (Sandbox Code Playgroud)

r r-recipes tidymodels

2
推荐指数
1
解决办法
784
查看次数