小编nic*_*ola的帖子

R 3.5中的data.table包未安装

我目前正在使用R 3.5(测试版),我的项目中需要data.table包,但我的软件包没有安装.任何人都可以帮助我.它显示我安装时出现以下错误.

install.packages("data.table")将软件包安装到'C:/Users/hp/Documents/R/win-library/3.5'(未指定'lib')---请选择一个CRAN镜像用于这个会话---只能以源代码形式提供的包,可能需要编译C/C++/Fortran:'data.table'这些不会被安装

我还尝试使用CRAN存储库安装数据包data.table_1.10.4-3.zip.但它显示以下错误.

install.packages("C:/Users/hp/Downloads/data.table_1.10.4-3.zip",repos = NULL,type ="win.binary")将包安装到'C:/ Users/hp/Documents/R/win-library/3.5'(作为'lib'未指定)包'data.table'成功解压缩并且MD5求和已检查库(data.table)错误:'data.table'的包或命名空间加载失败:package' data.table'由具有不同内部结构的R版本安装; 需要重新安装才能使用此R版本

谁能帮我？我该怎么办？

r data.table

Ris*_*Raj

2018 04-15

22
推荐指数

3
解决办法

1万
查看次数

在R中创建一个增加同心数字环的矩阵

我需要在R中编写一个函数来创建一个增加同心数字环的矩阵.该函数的参数是多个层.例如,如果x = 3,矩阵将如下所示:

Run Code Online (Sandbox Code Playgroud)

我不知道该怎么做.我真的很感激任何建议.

r matrix

Sir*_*ric

2015 11-13

8
推荐指数

2
解决办法

430
查看次数

在R中隐藏函数的结果

我创建了一个具有四个输出参数的函数,例如:

myfuction<-function(...){     
    #Inside the function I created four results A, B, C, and D.    
    A = ...    
    B = ...    
    C = ...    
    D = ...     
    z<-list(MacKinnon=A,regression=B,proof=C, res=D)    
    return(z)
}

Run Code Online (Sandbox Code Playgroud)

结果D对应于表示回归残差的数字向量.

我的问题是如何在不删除它的情况下隐藏此结果？也就是说,我希望当我运行该函数时,结果A,B和C出现,但不是结果D.

如果我想访问结果D,我必须做这样的事情:

X <-myfuction (...)
X$res

Run Code Online (Sandbox Code Playgroud)

能够观察残留物.

Car*_*vid

2016 05-24

7
推荐指数

1
解决办法

153
查看次数

最近的文件历史记录 R

如何找到在 RStudio 中打开的 R 文件的详细列表？File有点像->下的列表，Recent Files但更长？

recent-file-list rstudio

Vyk*_*ara

2018 07-23

7
推荐指数

1
解决办法

3436
查看次数

在 R shell 中按顺序显示函数参数

当我R从终端打开时，我可以使用 Tab 键自动完成功能和对象。通过在函数和之后按Tab 键(，函数参数将被列出。但是，在 Ubuntu 中，这些参数似乎是根据它们的声明方式排序的；在中macos，它们按字母顺序排列。

在 MacO 下：

> findInterval(
all.inside=        left.open=         rightmost.closed=  vec=               x=

Run Code Online (Sandbox Code Playgroud)

在 Ubuntu 下：

> findInterval(
x=                 vec=               rightmost.closed=  all.inside=        left.open=

Run Code Online (Sandbox Code Playgroud)

我想在我的 Mac 上拥有 Ubuntu 行为。我从终端查看了readline选项（不确定是否相关）man readline，但找不到任何有用的东西。

macos r readline

nic*_*ola

2021 03-31

7
推荐指数

1
解决办法

249
查看次数

如何知道第一个R版本具有给定的功能

就在今天,我尝试通过Rscript旧服务器上的代码启动.我的脚本收到意外错误:

Error: could not find function `paste0`

Run Code Online (Sandbox Code Playgroud)

事实证明,服务器上安装的R版本是旧版本(2.14).将paste0与以后的R版本来了.在paste0我所知道的(或在任何其他R函数中)的帮助页面中,没有提到支持它的第一个版本.

我的问题:有没有办法知道引入给定函数的版本？像Since:java文档中的部分.谢谢.

编辑:

我可以更好地提出我的问题.有没有理由直接在帮助页面中提供此信息？如果是这样,这是什么？如果没有,下一个R版本是否应该提供它？

nic*_*ola

2015 01-16

6
推荐指数

0
解决办法

101
查看次数

计算 R 中每天、每月和每年的观察次数

我有以下形式的数据框（它太大了，无法完全张贴在这里）：

      listing_id    date    city    type    host_id availability
1   703451  25/03/2013  amsterdam   Entire home/apt 3542621 245
2   703451  20/04/2013  amsterdam   Entire home/apt 3542621 245
3   703451  28/05/2013  amsterdam   Entire home/apt 3542621 245
4   703451  15/07/2013  amsterdam   Entire home/apt 3542621 245
5   703451  30/07/2013  amsterdam   Entire home/apt 3542621 245
6   703451  19/08/2013  amsterdam   Entire home/apt 3542621 245

Run Code Online (Sandbox Code Playgroud)

等等...

我想要三个新的数据框。一个计算特定年份（2013、2012、2011 等）的观测次数，另一个是每月（07/2013、06/2013 等），另一个是每天（28/05/2013、29/05/ 2013 年等）。我只想计算单位时间内出现的次数。

我该怎么做？

Dan*_*ood

2015 11-16

6
推荐指数

1
解决办法

2万
查看次数

结合R中的因子水平

我想把级别"A","B"组合成"A + B".我通过以下方式成功完成了此操作:

x <- factor(c("A","B","A","C","D","E","A","E","C"))
x
#[1] A B A C D E A E C
#Levels: A B C D E
l <- c("A+B","A+B","C","D+E","D+E")
factor(l[as.numeric(x)])
#[1] A+B A+B A+B C   D+E D+E A+B D+E C  
#Levels: A+B C D+E

Run Code Online (Sandbox Code Playgroud)

有没有更简单的方法来做到这一点？(即更多可解释的函数名称,例如combine.factor(f,old.levels,new.levels)将有助于更容易理解代码.)

此外,我试图找到一个很好的命名函数,可能在dplyr包中使用数据框但没有运气.最接近的实施是

df %>% mutate(x = factor(l[as.numeric(x)]))

Run Code Online (Sandbox Code Playgroud)

r dplyr

alb*_*eng

2016 04-12

6
推荐指数

2
解决办法

1万
查看次数

在Spark中获取树模型的叶子概率

我正在尝试重构经过训练的基于火花树的模型（RandomForest或GBT分类器），使其可以在没有火花的环境中导出。该toDebugString方法是一个很好的起点。但是，对于RandomForestClassifier，字符串仅显示每棵树的预测类，而没有相对概率。因此，如果对所有树木的预测取平均值，则会得到错误的结果。

一个例子。我们DecisionTree以这种方式代表：

DecisionTreeClassificationModel (uid=dtc_884dc2111789) of depth 2 with 5 nodes
  If (feature 21 in {1.0})
   Predict: 0.0
  Else (feature 21 not in {1.0})
   If (feature 10 in {0.0})
    Predict: 0.0
   Else (feature 10 not in {0.0})
    Predict: 1.0

Run Code Online (Sandbox Code Playgroud)

如我们所见，跟随这些节点，看起来预测总是为0或1。但是，如果将这棵单树应用于特征向量，则得到的概率像[0.1007, 0.8993]，并且它们在训练中非常有意义，因为在训练中设置负数/正数的比例，该比例最终与示例矢量与输出概率匹配的位置相同。

我的问题：这些概率存储在哪里？有没有办法提取它们？如果是这样，怎么办？一个pyspark解决方案是更好的。

apache-spark pyspark apache-spark-ml

nic*_*ola

2019 11-22

6
推荐指数

1
解决办法

199
查看次数

Why data.table CJ doesn't respect column major order

This is a curiosity more than a question, but I was wondering why data.table CJ function returns an object with the rightmost index running faster (as opposite as base expand.grid function).

An example:

CJ(a=letters[1:2],b=LETTERS[1:2])
#   a b
#1: a A
#2: a B
#3: b A
#4: b B
expand.grid(a=letters[1:2],b=LETTERS[1:2])
#  a b
#1 a A
#2 b A
#3 a B
#4 b B

Run Code Online (Sandbox Code Playgroud)

I think that the leftmost index running faster is more R-ish. Is there a reason …

r data.table

nic*_*ola

lucky-day

5
推荐指数

1
解决办法

151
查看次数