小编Sve*_*ein的帖子

多个数字与rhtml和knitr

我有一个Rhtml文件,我从中获取一个R文件.在这个R文件中,我正在做一些情节.

p=ggplot(data)
p+geom_line()
Run Code Online (Sandbox Code Playgroud)

现在,我可以在另一个之后产生一个情节,knit(".Rhtml")然后在做的 时候我接着另一个.

但我想把这些数字并排.(数据的数量因报告而异).

有没有办法在Rhtml文件中设置一个选项,以便数字并排排列(例如两列,三列或四列).

所以,实际上它会像是一样par(mfrow).

html r knitr

4
推荐指数
2
解决办法
1849
查看次数

R中的model.matrix的data.table的Rownames

我有一个data.table DT,我想继续model.matrix它.每行都有一个字符串ID,存储在ID列中DT.当我跑步model.matrixDT,我的公式排除了ID列.问题是,model.matrix由于NA而丢弃了一些行.如果我设置的rownames DTID列,调用之前model.matrix,那么最终的模型矩阵具有rownames,和我都准备好.否则,我无法弄清楚我最终会遇到什么行.我正在设置rownames rownames(DT) = DT$ID.但是,当我尝试添加新列时DT,我会收到投诉

"检测到无效的.internal.selfref ......在早些时候,这个data.table已经被R复制了."

所以我很想知道

  1. 有没有更好的方法来设置一个rownames data.table
  2. 有没有更好的方法来解决这个问题.

r model.matrix data.table

4
推荐指数
1
解决办法
8860
查看次数

用循环填充矩阵

我想创建一个矩阵n通过kk使用循环MVN协变量.相当简单,但到目前为止还没有...这是我的代码:

n=1000
k=5
p=100
mu=0
sigma=1
x=matrix(data=NA, nrow=n, ncol=k)


for (i in 1:k){
        x [[i]]= mvrnorm(n,mu,sigma)
       }
Run Code Online (Sandbox Code Playgroud)

少了什么东西?

simulation r matrix

4
推荐指数
1
解决办法
6万
查看次数

R中的上标

如何标记此轴标题的单位.该""代表我需要上标部分:Photosynthetically available radiation (µE m"-2"d"-1").

到目前为止,我使用了公式并且没有运气:

plot(PAR~SST,data=brazilw, pch=15,col="red", main ="Fig. 1. Relationship between photosynthically available radiation\n and sea surface temperature",
ylab=expression("Photosynthetically available radiation (µE m"^-2~d^-1))
Run Code Online (Sandbox Code Playgroud)

r superscript

4
推荐指数
1
解决办法
9260
查看次数

计算两个重叠日期之间的观察次数r

假设我们的数据框定义如下:

mydata <- data.frame(id = c('A', 'B', 'C', 'D'),
                     start_date = as.Date(c('2012-08-05',
                                            '2013-05-04',
                                            '2012-02-01',
                                            '2015-03-02')),
                     end_date = as.Date(c('2014-01-12',
                                          '2015-06-05',
                                          '2016-05-06',
                                          '2017-09-12')))
Run Code Online (Sandbox Code Playgroud)

start_date有关两天的会谈雇员加入和end_date有关两天的会谈,他离开,并id是唯一的雇员ID.

对于从2012年8月5日(最早start_date)到2017年9月12日(最新end_date)的每个月,我希望员工数月亮.最终输出的格式应与下面的格式类似:(如果是宽格式或长格式则无关紧要) 最终输出表

在上表中,列表示月份(1到12),年份行和表格中的单元格表示该月份的员工数量.

任何帮助将受到高度赞赏.

r date dataframe

4
推荐指数
1
解决办法
157
查看次数

列配对统计检验

我有两个data.frames,看起来像:

DF1      
  Col1     Col2     Col3    Col4    
 0.1854   0.1660   0.1997   0.4632
 0.1760   0.1336   0.1985   0.4496
 0.1737   0.1316   0.1943   0.4446    
 0.1660   0.1300   0.1896   0.4439


DF2       
  Col1     Col2     Col3    Col4    
 0.2456    0.2107   0.2688  0.5079
 0.2399    0.1952   0.2356  0.1143
 0.2375    0.1947   0.2187  0.0846    
 0.2368    0.1922   0.2087  0.1247
Run Code Online (Sandbox Code Playgroud)

我想在两个data.frames之间执行wilcox.test,特别是在配对列之间执行wilcox.test,以便:

test1: between Col1 of DF1 and Col1 of DF2     
test2: between Col2 of DF1 and Col2 of DF2      
Run Code Online (Sandbox Code Playgroud)

等等.

我使用了以下脚本:

for (i in 1:length(DF2)){ 
    test <- apply(DF1, 2, function(x) wilcox.test(x, as.numeric(DF2[[i]]), correct=TRUE))
}
Run Code Online (Sandbox Code Playgroud)

不幸的是,此脚本的输出与使用以下脚本执行的相同测试的输出不同:

test1 = …
Run Code Online (Sandbox Code Playgroud)

r dataframe

3
推荐指数
1
解决办法
94
查看次数

两个 beta 分布的乘积

假设我有两个随机变量:

X ~ Beta(?1,?1)

Y ~ Beta(?2,?2)

我想计算 Z = XY 的分布(随机变量的乘积)

使用scipy,我可以获得单个 Beta 版的 pdf 文件:

from scipy.stats import beta
rv = beta(a, b)
x = np.linspace(start=0, stop=1, num=200)
my_pdf = rv.pdf(x)
Run Code Online (Sandbox Code Playgroud)

但是两个 Beta 的乘积呢?我可以分析地做到这一点吗?(Python/Julia/R 解决方案很好)。

python statistics r julia statsmodels

3
推荐指数
1
解决办法
5504
查看次数

R中动物园对象的分位数和聚合

我有一个zoo对象看起来像

library(zoo)
library(lubridate)
TimeStamp=seq(dmy("01/01/2002"), dmy("17/12/2014"), by="day")
Dummy= rnorm(length(TimeStamp))
Temp=zoo(Dummy,TimeStamp)
Run Code Online (Sandbox Code Playgroud)

我正在尝试计算一年中每一天的 5%、33%、67% 和 95% 百分位数/分位数以创建“规范”。因此,对于 01/01,我希望根据我在数据集中对 1 月 1 日的所有观察结果获得 4 个分位数值。每天都做同样的事情。

现在我正在使用它:

aggregate(Temp ~ day(index(Temp)) + month(index(Temp)), FUN = 'quantile')
Run Code Online (Sandbox Code Playgroud)

问题是使用这个函数我不确定返回quantile函数的值是什么。

有什么建议吗?

aggregate r quantile

3
推荐指数
1
解决办法
5711
查看次数

如何访问原子向量属性?

我使用attr函数设置了变量的属性,如下所示:

x <- 1 :20
attr(x,'name') <- c("RED","BLUE")
attributes(x)

$name
[1] "RED"  "BLUE"
Run Code Online (Sandbox Code Playgroud)

现在我已经设置了属性; 如果我使用'$'它说,访问它"Error : $ operator is invalid for atomic vectors".我也试过x['name']哪个节目NA

如何访问此原子向量属性?

attributes r vector atomic

3
推荐指数
1
解决办法
3600
查看次数

与 sklearn.neighbors.NearestNeighbors 的输出混淆

这是代码。

from sklearn.neighbors import NearestNeighbors
import numpy as np
X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])
nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(X)
distances, indices = nbrs.kneighbors(X)


>indices

>array([[0, 1],[1, 0],[2, 1],[3, 4],[4, 3],[5, 4]])

>distances

>array([[0.        , 1.        ],[0.        , 1.        ],[0.        , 1.41421356], [0.        , 1.        ],[0.        , 1.        ],[0.        , 1.41421356]])
Run Code Online (Sandbox Code Playgroud)

我不太了解“指数”和“距离”的形状。我如何理解这些数字的含义?

python scikit-learn

3
推荐指数
1
解决办法
2351
查看次数