小编Mar*_*ski的帖子

如何以智能方式在Rmarkdown中添加\newpage?

我想知道是否可以用\newpage不同的方式在R markdown v2中使用LaTeX 命令:

```{r, results='asis', echo=FALSE}
cat("\\newpage")
```
Run Code Online (Sandbox Code Playgroud)

我生产pdf_output.如果any1有任何想法请不要犹豫评论:)!谢谢

我创建这样的pdf:

---
title: " "
author: " "
date: "2014"
output: 
   pdf_document:
      includes:
         in_header: naglowek.tex
      highlight: pygments
      toc: true
      toc_depth: 3
      number_sections: true
      keep_tex: true
---
Run Code Online (Sandbox Code Playgroud)

r r-markdown

107
推荐指数
3
解决办法
9万
查看次数

链接到R中roxygen2文档中的其他包

我想知道link当我尝试使用新包编写文档时,存在一种从其他包中运行的方法roxygen2.有点像\link{pck=PACKAGE_NAME, fun=FUNCTION_NAME}

documentation r roxygen2

58
推荐指数
4
解决办法
6854
查看次数

sparse.model.matrix在R中丢失行

我正在研究data.frame看起来很有用的glm功能,所以我决定我会对模型矩阵的稀疏重复进行处理,这样我就可以把这个稀疏矩阵放到glmnet函数中了.但sparse.model.matrix看起来要从原始矩阵中删除一些行.知道为什么会这样,以及任何解决方案如何避免这种情况?代码如下:

> mm <- sparse.model.matrix(~clicks01+kl_tomek*bc1+hours+plec+1, 
data = daneOst)
> dim(mm)
[1] 1253223     292
> dim(daneOst)
[1] 1258836       6
Run Code Online (Sandbox Code Playgroud)

r matrix sparse-matrix

14
推荐指数
2
解决办法
5021
查看次数

R中对dist函数有稀疏支持吗?

有没有人听说任何dist{stats}与R创建的功能相同的包或功能

距离矩阵,通过使用指定的距离度量来计算数据矩阵的行之间的距离,

但是将一个sprase矩阵作为输入?

我的data.frame(已命名dataCluster)有dims:7000 X 10000,几乎99%稀疏.在不稀疏的常规形式中,此功能似乎不会停止工作......

h1 <- hclust( dist( dataCluster ) , method = "complete" )
Run Code Online (Sandbox Code Playgroud)

类似的问题没有答案: 稀疏矩阵作为R中的分层聚类的输入

r hierarchical-clustering sparse-matrix

11
推荐指数
1
解决办法
1024
查看次数

如何在RStudio中的ioslides中为每张幻灯片添加徽标

我正在尝试使用RStudio在ioslides演示文稿中的rmarkdown中为每张幻灯片添加徽标.

我的代码如下:

---
title: " "
author: " "
date: " "
output:
  ioslides_presentation:
    widescreen: false
    logo: logo_wp.png
runtime: shiny
---

# Caption1

## Caption 2
Run Code Online (Sandbox Code Playgroud)

并且可以从这里下载徽标!

这里

幻灯片nr 3上没有徽标,runtime: shiny因为该演示文稿中有一个闪亮的应用程序.

根据rstudio网页上的这句话,这应该有效,但它没有..

徽标图形的128x128版本将添加到标题幻灯片中,徽标的图标版本将包含在每张幻灯片的左下角

我正在使用Windows 7,我已将编码设置为UTF-8.

r rstudio knitr r-markdown

9
推荐指数
1
解决办法
3182
查看次数

如何删除R中data.tables中的重复(按名称)列?

在使用时读取数据集时fread,我注意到有时候我会得到重复的列名,例如(fread没有check.names参数)

> data.table( x = 1, x = 2)
   x x
1: 1 2
Run Code Online (Sandbox Code Playgroud)

问题是:如果它们具有相同的名称,有没有办法删除2列中的1列?

r data.table

9
推荐指数
2
解决办法
5233
查看次数

browseVignettes找不到实际存在的晕影

在github存储库上有一个包,vignettes/目录中有2个晕影.

我试着用这样的devtools包下载

> if (!require(devtools)) {
+     install.packages("devtools")
+     require(devtools)
+ }
> install_github("MarcinKosinski/RTCGA", build_vignettes=TRUE)
Downloading github repo MarcinKosinski/RTCGA@master
Installing RTCGA
"D:/R-32~1.2/bin/x64/R" --no-site-file --no-environ --no-save --no-restore CMD INSTALL  \
  "C:/Users/Marcin/AppData/Local/Temp/Rtmpg1Kbfy/devtools3cf47f1f6731/MarcinKosinski-RTCGA-0d91d7c"  \
  --library="C:/Users/Marcin/Documents/R/win-library/3.2" --install-tests 

* installing *source* package 'RTCGA' ...
** R
** tests
** preparing package for lazy loading
** help
*** installing help indices
** building package indices
** installing vignettes
** testing if installed package can be loaded
* DONE (RTCGA) …
Run Code Online (Sandbox Code Playgroud)

r devtools

9
推荐指数
1
解决办法
1337
查看次数

"sparkContext被关闭",同时在大型数据集上运行spark

当在群集上运行sparkJob超过某个数据大小(~2,5GB)时,我得到"因为SparkContext被关闭而取消了作业"或"执行者丢失".看着纱桂,我看到被杀的工作是成功的.运行500mb的数据时没有问题.我正在寻找一个解决方案,并发现:"似乎纱线杀死了一些执行者,因为他们要求的内存超出预期."

有什么建议怎么调试呢?

命令我提交我的火花作业:

/opt/spark-1.5.0-bin-hadoop2.4/bin/spark-submit  --driver-memory 22g --driver-cores 4 --num-executors 15 --executor-memory 6g --executor-cores 6  --class sparkTesting.Runner   --master yarn-client myJar.jar jarArguments
Run Code Online (Sandbox Code Playgroud)

和sparkContext设置

val sparkConf = (new SparkConf()
    .set("spark.driver.maxResultSize", "21g")
    .set("spark.akka.frameSize", "2011")
    .set("spark.eventLog.enabled", "true")
    .set("spark.eventLog.enabled", "true")
    .set("spark.eventLog.dir", configVar.sparkLogDir)
    )
Run Code Online (Sandbox Code Playgroud)

失败的简化代码看起来像那样

 val hc = new org.apache.spark.sql.hive.HiveContext(sc)
val broadcastParser = sc.broadcast(new Parser())

val featuresRdd = hc.sql("select "+ configVar.columnName + " from " + configVar.Table +" ORDER BY RAND() LIMIT " + configVar.Articles)
val myRdd : org.apache.spark.rdd.RDD[String] = featuresRdd.map(doSomething(_,broadcastParser))

val allWords= featuresRdd
  .flatMap(line => line.split(" …
Run Code Online (Sandbox Code Playgroud)

scala hadoop-yarn apache-spark apache-spark-sql

9
推荐指数
2
解决办法
2万
查看次数

有没有办法在glm函数中获得优化算法的每个步骤的系数?

当在R中执行logit回归时,可以在优化算法与coefficients()函数收敛(或不收敛)之后获得系数:

library(MASS)
data(menarche)
glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age,
               family=binomial(logit), data=menarche)
coefficients(glm.out)
## (Intercept)         Age 
## -21.226395    1.631968
Run Code Online (Sandbox Code Playgroud)

有没有办法获得优化算法的每个步骤的系数来跟踪其步骤?

r glm

9
推荐指数
1
解决办法
365
查看次数

闪亮的仪表板:通过单击infoBox跳转到应用程序中的特定元素

在我的闪亮应用程序中,我想添加一个选项,让用户tab通过点击infoBox(或我想要的任何其他对象)跳转到应用程序中的特定元素(表格,情节,任何具有id的内容),当前或不同).

我的解决方案是围绕infoBoxdiv并添加href=#id_of_element属性.不幸的是,这个解决方案只适用tabs于额外的"data-toggle" = "tab"属性(它也不会改变打开tabactive),但这不是我想要的.

我的问题是:如何添加上述选项以及为什么此解决方案不起作用?这是我想要做的一个小例子:

UI

library(shiny)
library(shinydashboard)

shinyUI(
  dashboardPage(
    skin = "blue",
     dashboardHeader(title = "Example"),
    dashboardSidebar(
      sidebarMenu(id = "sidebarmenu",
              menuItem("Tab1", icon = icon("line-chart"),
                       menuSubItem("SubTab1", tabName = "sub1", icon = icon("bar-chart")),
                          menuSubItem("SubTab2", tabName = "sub2", icon = icon("database"))),
              menuItem("Tab2", tabName = "tab2", icon = icon("users"))
      )
    ),
    dashboardBody(
      tabItems(
       tabItem(tabName = "sub1",
          tags$div(href="#s2t2",
                   infoBox(value = "Go to table 2 in SubTab2 (not …
Run Code Online (Sandbox Code Playgroud)

html r href shiny shinydashboard

9
推荐指数
1
解决办法
699
查看次数