小编Mar*_*rek的帖子

如何为子字符串的开头指定动态位置?

如示例中所示,我正在尝试substring使用data.frame(video_data_2)中的Video_full列.我希望在这段时间之后保留所有角色.期间始终存在,只有一个期间,并且该列的每个值处于不同的位置.

     Date                     Video_full      Instances   
1 Apr 1, 2010  installs/AA.intro_video_1      546         
2 Apr 1, 2010  installs/ABAC.intro_video_2    548      
Run Code Online (Sandbox Code Playgroud)

我有子串工作:

video_data_2$Video_full <- substring(video_data_2$Video_full,11)
Run Code Online (Sandbox Code Playgroud)

而且strsplit:

strsplit("installs/AA.intro_video_1 ",'[.]')
Run Code Online (Sandbox Code Playgroud)

我只是无法弄清楚如何substring在动态位置启动或仅保留返回的第二个值strsplit.

感谢您为简单问题提供的任何帮助.

r

5
推荐指数
3
解决办法
2778
查看次数

如何在R中执行加权的2d核密度估计?

我想在R中产生一个核密度估计,并且在所有不同的软件包中都有一些问题.我需要能够:

  1. 指定权重
  2. 指定带宽大小
  3. 指定箱尺寸

你会怎么做?代码段的奖励积分.

r kernel-density

5
推荐指数
1
解决办法
4648
查看次数

拆分矩阵并重新加入

这是我的第一篇文章.如果我的问题愚蠢,请提前道歉.我是编程新手.

好的,所以我matrix(eBpvalues)在R中有一个152720行和2列.我想分成10个单独的矩阵,每个矩阵包含15272行.

我试过这个:

> newmx <-split(as.data.frame(eBpvalues), rep(1:10, each = 15272)))

> summary(newmx)  

   Length Class      Mode  
1  2      data.frame list    
2  2      data.frame list  
3  2      data.frame list  
4  2      data.frame list  
5  2      data.frame list  
6  2      data.frame list  
7  2      data.frame list  
8  2      data.frame list  
9  2      data.frame list  
10 2      data.frame list  
Run Code Online (Sandbox Code Playgroud)

我如何并排连接这些矩阵,所以我有一个20列和15272行的新矩阵?

干杯,

尼尔

split r matrix

5
推荐指数
1
解决办法
6610
查看次数

编写每个架构不同的R包

我正在编写一个R包,您可以在其中创建网络并以不同的文件类型输出它们.我找到了包SVGRTipsDevice,它可用于创建包含工具提示和超链接的SVG图片,我非常喜欢.我把它作为输出选项之一包含在我的包中,使其不是我的包的一个重要部分,但它仍然是它的一部分(我想保留一部分).

现在的问题是,该软件包仅适用于32位用户.因为我的软件包依赖于它,64位用户无法安装它.似乎我要么必须使我的软件包仅限32位,要么删除SVG功能(目前我选择后者上传到CRAN,链接到我网站上的完整软件包).

有没有办法以不同的方式做到这一点?就像让任何人都可以安装软件包一样,但只为32位用户提供SVG功能?

r 32bit-64bit

5
推荐指数
2
解决办法
577
查看次数

使用ddply进行汇总统计

我喜欢用函数编写一个函数ddply,根据两列的名称输出汇总统计信息data.frame mat.

  • mat是一个很大data.frame的列名称"metric", "length", "species", "tree", ...,"index"

  • index 是两个级别的因素 "Short", "Long"

  • "metric", "length", "species", "tree" 和其他都是连续变量

功能:

summary1 <- function(arg1,arg2) {
    ...

    ss <- ddply(mat, .(index), function(X) data.frame(
        arg1 = as.list(summary(X$arg1)),
        arg2 = as.list(summary(X$arg2)),
        .parallel = FALSE)

    ss
}
Run Code Online (Sandbox Code Playgroud)

我希望在调用后输出看起来像这样 summary1("metric","length")

Short metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max. 

....

Long metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.

....
Run Code Online (Sandbox Code Playgroud)

目前该功能无法产生所需的输出?应该在这做什么修改? …

r plyr dataframe

5
推荐指数
1
解决办法
2906
查看次数

ggplot2 - 轴美学

可以ggplot2绘制第二个"轴"标签,将X和Y值的百分比相关联.

在此输入图像描述

编辑:

我有一个data.frame有两个vars,相关和百分比.我想展示与V2相关的V1的演变; 例如,我需要多少百分比的V2才能获得20%的V1(反之亦然).

V1   V2
0    0
0.03 0.0005
0.10 0.0015
0.13 0.0020
....
1    1
Run Code Online (Sandbox Code Playgroud)

现在我的问题是如何在X和Y上做那个内轴,显示X和Y百分比之间的关系.另外我如何设置ggplot使用(0,0)作为x轴和y轴的截距?

r ggplot2

5
推荐指数
1
解决办法
2202
查看次数

在xyplot中的特定值上绘制网格线

我有一个xyplot,我想在0值上绘制网格线.

怎么做到这一点?

plot r lattice

5
推荐指数
2
解决办法
5181
查看次数

如何使这个R包的输出静音?

我正在玩LowRankQP()R中的软件包,甚至设置verbose=FALSE仍会产生大量输出(参见下面的示例).

输出来自代码的编译部分.R中是否有一种方法(包装函数?)在不修改底层编译代码的情况下调用LowRankQP()绝对静音(即不在屏幕上打印任何内容)(与此软件包关联的电子邮件地址仍未激活)?

library(LowRankQP)

Vmat <- matrix(0,6,6)
diag(Vmat) <- c(1, 1,1,0,0,0)
dvec <- c(0,-5,0,0,0,0)
Amat <- matrix(c(-4,-3,0,-1,0,0,2,1,0,0,-1,0,0,-2,1,0,0,-1),6,3)
bvec <- c(-8,2,0)
uvec <- c(100,100,100,100,100,100)

aa<-LowRankQP(Vmat,dvec,t(Amat),bvec,uvec,method="CHOL")

# LowRankQP CONVERGED IN 15 ITERATIONS
# 
#     Primal Feasibility    =   2.5719308e-16
#     Dual Feasibility      =   7.1949984e-16
#     Complementarity Value =   3.3066705e-11
#     Duality Gap           =   3.3065273e-11
#     Termination Condition =   9.7802929e-12
Run Code Online (Sandbox Code Playgroud)

这是我想要的"LowRankQP收敛于15次迭代"的部分.

Ubuntu 11.04,R版本2.12.1和LowRankQP()1.0.1.

r

5
推荐指数
1
解决办法
3969
查看次数

对于R中的空间对象,使用fortify {ggplot2}将地图数据转换为数据框

我用来能够毫无问题地运行这个脚本,但是现在fortify {ggplot2}命令给了我一个错误信息.任何可能是问题的暗示都会很棒!我使用fortify命令能够使用ggplot2对shapefile进行geom_map.

下面是我下载数​​据的脚本和链接.

#######################################################
#######################################################
rm(list = ls(all = TRUE))#clear workspace
getwd()
#upload packages
library(maps)
library(mapdata)
library(gridExtra)
library(rgdal)
library(rgeos)
library(ggplot2)
library(sp)
library(maptools)
gpclibPermit()

#setwd(".../FAO") FAO data are major fishing area divisions
> FAO<- readOGR(dsn="fao", layer="World_Fao_Zones")
OGR data source with driver: ESRI Shapefile 
Source: "fao", layer: "World_Fao_Zones"
with 19 features and 1 fields
Feature type: wkbPolygon with 2 dimensions
> names(FAO);dim(FAO)
[1] "zone"
[1] 19  1
> str(FAO,max.level=2)
Formal class 'SpatialPolygonsDataFrame' [package "sp"] with 5 slots
  ..@ data       :'data.frame': 19 obs. …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

5
推荐指数
1
解决办法
1万
查看次数

相同的回归,不同的统计数据(R诉SAS)?

我在SAS和R中运行了相同的概率回归,而我的系数估计值(基本上)是等效的,报告的测试统计数据是不同的.具体而言,SAS将测试统计报告为t统计,而R将测试统计报告为z统计.

我检查了我的计量经济学文本,发现(很少详细说明)它以t统计数据报告了probit结果.

哪个统计数据合适?为什么R与SAS不同?

这是我的SAS代码:

proc qlim data=DavesData;
 model y = x1 x2 x3/ discrete(d=probit);
run;
quit;
Run Code Online (Sandbox Code Playgroud)

这是我的R代码:

> model.1 <- glm(y ~ x1 + x2 + x3, family=binomial(link="probit"))
> summary(model.1)
Run Code Online (Sandbox Code Playgroud)

r sas

4
推荐指数
1
解决办法
1398
查看次数

标签 统计

r ×10

ggplot2 ×2

32bit-64bit ×1

dataframe ×1

kernel-density ×1

lattice ×1

matrix ×1

plot ×1

plyr ×1

sas ×1

split ×1