即使我的Windows 7区域设置指定使用","作为小数分隔符,R和RStudio给我一个"." 分隔器.有没有办法改变这个?请注意下面语言环境中的"LC_NUMERIC = C"设置:这似乎是由R或RStudio强制执行的.
由于我正处于长期项目的中间,我不愿意立即改为R 3.0和最后一个RStudio版本.有谁知道这些版本中的小数分隔符问题是否有任何变化?
我使用prettyNum解决单个数字的问题,但我不知道如何在表上使用它.
sessionInfo()R版本2.15.3(2013-03-01)平台:x86_64-w64-mingw32/x64(64位)
locale:
[1] LC_COLLATE=Spanish_Argentina.1252 LC_CTYPE=Spanish_Argentina.1252
[3] LC_MONETARY=Spanish_Argentina.1252 LC_NUMERIC=C
[5] LC_TIME=Spanish_Argentina.1252
attached base packages:
[1] grid splines stats graphics grDevices utils datasets methods
[9] base
other attached packages:
[1] ascii_2.1 randomForest_4.6-7 pander_0.3.3 fpc_2.1-5
[5] flexmix_2.3-10 mclust_4.0 cluster_1.14.3 MASS_7.3-23
[9] Gmisc_0.5.0.0 testthat_0.7 boot_1.3-7 rms_3.6-3
[13] miscTools_0.6-16 stringr_0.6.2 Hmisc_3.10-1 survival_2.37-2
[17] lattice_0.20-13 xtable_1.7-1 pixmap_0.4-11 RColorBrewer_1.0-5
[21] ade4_1.5-1
loaded via a namespace (and not attached):
[1] digest_0.6.3 evaluate_0.4.3 modeltools_0.2-19 stats4_2.15.3
[5] tools_2.15.3
Run Code Online (Sandbox Code Playgroud) 我正在使用RStudio,knitr,pandoc,MS Word组合在docx文档中获得我的最终结果.
有时,我希望报告在新页面上继续.我找不到实现这个目标的方法.
从我用谷歌搜索,似乎有可能CSS.我不知道HTML或者CSS,但如果这是我将学习的解决方案.只是不想走错路......
我正在使用Windows 7,R2.15.3和RStudio 0.97.320与knitr knitr_1.1.6(在Yihui于3月12日修复'编码:编织和子文件'问题后下载)
> sessionInfo()
R version 2.15.3 (2013-03-01)
Platform: x86_64-w64-mingw32/x64 (64-bit)
locale:
[1] LC_COLLATE=Spanish_Argentina.1252 LC_CTYPE=Spanish_Argentina.1252 LC_MONETARY=Spanish_Argentina.1252
[4] LC_NUMERIC=C LC_TIME=Spanish_Argentina.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] lattice_0.20-13 pixmap_0.4-11 RColorBrewer_1.0-5 ade4_1.5-1 pander_0.3.1
[6] xtable_1.7-1
loaded via a namespace (and not attached):
[1] digest_0.6.3 evaluate_0.4.3 formatR_0.7 grid_2.15.3 knitr_1.1.6 stringr_0.6.2 tools_2.15.3
Run Code Online (Sandbox Code Playgroud)
我把R代码放在像这样的文件中:
## @knitr RunMyCode
print('Called from .R file: á é í ó ú ñ')
# Workaround
my.text <- 'á é í ó …Run Code Online (Sandbox Code Playgroud) 我有一堆有序的向量,包含0到1之间的数字.我需要找到第一个元素的索引超过某个值r:
x <- c(0.1, 0.3, 0.4, 0.8)
which.max(x >= 0.4)
[1] 3 # This is exactly what I need
Run Code Online (Sandbox Code Playgroud)
现在,如果我的目标值超过向量中的最大值,则.max()返回1,这可能与"真实"第一个值混淆:
which.max(x >= 0)
[1] 1
which.max(x >= 0.9) # Why?
[1] 1
Run Code Online (Sandbox Code Playgroud)
我如何修改此表达式以获得NA作为结果?
我使用Windows 7,R2.15.3和RStudio 0.97.320与knitr 1.1.不知道我的pandoc版本是什么,但我几天前下载了它.
sessionInfo()
R版本2.15.3(2013-03-01)平台:x86_64-w64-mingw32/x64(64位)
locale:
[1] LC_COLLATE=Spanish_Argentina.1252 LC_CTYPE=Spanish_Argentina.1252 LC_MONETARY=Spanish_Argentina.1252
[4] LC_NUMERIC=C LC_TIME=Spanish_Argentina.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
loaded via a namespace (and not attached):
[1] tools_2.15.3
Run Code Online (Sandbox Code Playgroud)
我想在html和Word中获取我的报告,所以我使用markdown和pandoc.我用西班牙语写下了元音和元音的重音:n:á-ú和ñ.
我看了很多帖子,我看到的问题类似于我用新版本解决的问题knitr.但有一个问题我没有找到解决方案.
当我开始,我用的是'system default'出现的在编码RStudio对话框,即ISO 8859-1,与RStudio预告伟大的工作.然而,当我试图获取Word文档时,pandoc在强调的元音上窒息.我发现了一篇帖子,展示了如何解决这个问题iconv:
iconv -t utf-8"myfile.md"| pandoc -o"myfile.docx"| iconv -f utf-8
虽然这确实解决了pandoc's无法识别的utf-8角色投诉,但出于某种原因pandoc停止查找我的情节,并出现如下错误:
pandoc:找不到图像`figure/Parent.png',跳过...
如果我只使用非重音字符,pandoc会查找没有问题的图像.我.md用 …
pcd <- data.frame(tripNo = c(618, 618, 610, 610, 610, 619),
procDate = as.Date(c('2016-03-02', '2016-03-03', '2016-03-02', '2016-03-03', '2016-03-02', '2016-03-03')),
delay = c(7.45, 12.90, 11.88, 6.66, 12.50, 9.41) )
Run Code Online (Sandbox Code Playgroud)
我想标记在两天不同的行程中出现的不一致之处,其中第二天的延迟比前一天的最后一天的延迟短。我现在是这样做的:
pcd %>%
arrange(tripNo, procDate, delay) %>%
group_by(tripNo) %>%
mutate(delayErr = (row_number() != 1) & (delay < lag(delay)),
Alert = ifelse(delayErr, '!', '')) %>%
select(tripNo, procDate, delay, delayErr, Alert)
tripNo procDate delay delayErr Alert
(dbl) (date) (dbl) (lgl) (chr)
1 610 2016-03-02 11.88 FALSE
2 610 2016-03-02 12.50 FALSE
3 610 2016-03-03 6.66 …Run Code Online (Sandbox Code Playgroud) 这与使用 step_naomit 进行预测并使用 tidymodels 保留 ID是相同的问题,但即使有一个可接受的答案,OP 的最后一条评论指出了“id 变量”被用作预测器的问题,正如在查看时所看到的model$fit$variable.importance.
我有一个我想保留的带有“id 变量”的数据集。我以为我可以通过 recipe() 规范来实现这一点。
library(tidymodels)
# label is an identifier variable I want to keep even though it's not
# a predictor
df <- tibble(label = 1:50,
x = rnorm(50, 0, 5),
f = factor(sample(c('a', 'b', 'c'), 50, replace = TRUE)),
y = factor(sample(c('Y', 'N'), 50, replace = TRUE)) )
df_split <- initial_split(df, prop = 0.70)
# Make up any recipe: just note I specify 'label' as "id …Run Code Online (Sandbox Code Playgroud)