如示例中所示,我正在尝试substring使用data.frame(video_data_2)中的Video_full列.我希望在这段时间之后保留所有角色.期间始终存在,只有一个期间,并且该列的每个值处于不同的位置.
Date Video_full Instances
1 Apr 1, 2010 installs/AA.intro_video_1 546
2 Apr 1, 2010 installs/ABAC.intro_video_2 548
Run Code Online (Sandbox Code Playgroud)
我有子串工作:
video_data_2$Video_full <- substring(video_data_2$Video_full,11)
Run Code Online (Sandbox Code Playgroud)
而且strsplit:
strsplit("installs/AA.intro_video_1 ",'[.]')
Run Code Online (Sandbox Code Playgroud)
我只是无法弄清楚如何substring在动态位置启动或仅保留返回的第二个值strsplit.
感谢您为简单问题提供的任何帮助.
我想在R中产生一个核密度估计,并且在所有不同的软件包中都有一些问题.我需要能够:
你会怎么做?代码段的奖励积分.
这是我的第一篇文章.如果我的问题愚蠢,请提前道歉.我是编程新手.
好的,所以我matrix(eBpvalues)在R中有一个152720行和2列.我想分成10个单独的矩阵,每个矩阵包含15272行.
我试过这个:
> newmx <-split(as.data.frame(eBpvalues), rep(1:10, each = 15272)))
> summary(newmx)
Length Class Mode
1 2 data.frame list
2 2 data.frame list
3 2 data.frame list
4 2 data.frame list
5 2 data.frame list
6 2 data.frame list
7 2 data.frame list
8 2 data.frame list
9 2 data.frame list
10 2 data.frame list
Run Code Online (Sandbox Code Playgroud)
我如何并排连接这些矩阵,所以我有一个20列和15272行的新矩阵?
干杯,
尼尔
我正在编写一个R包,您可以在其中创建网络并以不同的文件类型输出它们.我找到了包SVGRTipsDevice,它可用于创建包含工具提示和超链接的SVG图片,我非常喜欢.我把它作为输出选项之一包含在我的包中,使其不是我的包的一个重要部分,但它仍然是它的一部分(我想保留一部分).
现在的问题是,该软件包仅适用于32位用户.因为我的软件包依赖于它,64位用户无法安装它.似乎我要么必须使我的软件包仅限32位,要么删除SVG功能(目前我选择后者上传到CRAN,链接到我网站上的完整软件包).
有没有办法以不同的方式做到这一点?就像让任何人都可以安装软件包一样,但只为32位用户提供SVG功能?
我喜欢用函数编写一个函数ddply,根据两列的名称输出汇总统计信息data.frame mat.
mat是一个很大data.frame的列名称"metric", "length", "species", "tree", ...,"index"
index 是两个级别的因素 "Short", "Long"
"metric", "length", "species", "tree" 和其他都是连续变量
功能:
summary1 <- function(arg1,arg2) {
...
ss <- ddply(mat, .(index), function(X) data.frame(
arg1 = as.list(summary(X$arg1)),
arg2 = as.list(summary(X$arg2)),
.parallel = FALSE)
ss
}
Run Code Online (Sandbox Code Playgroud)
我希望在调用后输出看起来像这样 summary1("metric","length")
Short metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Long metric.Min. metric.1st.Qu. metric.Median metric.Mean metric.3rd.Qu. metric.Max. length.Min. length.1st.Qu. length
.Median length.Mean length.3rd.Qu. length.Max.
....
Run Code Online (Sandbox Code Playgroud)
目前该功能无法产生所需的输出?应该在这做什么修改? …
可以ggplot2绘制第二个"轴"标签,将X和Y值的百分比相关联.

编辑:
我有一个data.frame有两个vars,相关和百分比.我想展示与V2相关的V1的演变; 例如,我需要多少百分比的V2才能获得20%的V1(反之亦然).
V1 V2
0 0
0.03 0.0005
0.10 0.0015
0.13 0.0020
....
1 1
Run Code Online (Sandbox Code Playgroud)
现在我的问题是如何在X和Y上做那个内轴,显示X和Y百分比之间的关系.另外我如何设置ggplot使用(0,0)作为x轴和y轴的截距?
我正在玩LowRankQP()R中的软件包,甚至设置verbose=FALSE仍会产生大量输出(参见下面的示例).
输出来自代码的编译部分.R中是否有一种方法(包装函数?)在不修改底层编译代码的情况下调用LowRankQP()绝对静音(即不在屏幕上打印任何内容)(与此软件包关联的电子邮件地址仍未激活)?
library(LowRankQP)
Vmat <- matrix(0,6,6)
diag(Vmat) <- c(1, 1,1,0,0,0)
dvec <- c(0,-5,0,0,0,0)
Amat <- matrix(c(-4,-3,0,-1,0,0,2,1,0,0,-1,0,0,-2,1,0,0,-1),6,3)
bvec <- c(-8,2,0)
uvec <- c(100,100,100,100,100,100)
aa<-LowRankQP(Vmat,dvec,t(Amat),bvec,uvec,method="CHOL")
# LowRankQP CONVERGED IN 15 ITERATIONS
#
# Primal Feasibility = 2.5719308e-16
# Dual Feasibility = 7.1949984e-16
# Complementarity Value = 3.3066705e-11
# Duality Gap = 3.3065273e-11
# Termination Condition = 9.7802929e-12
Run Code Online (Sandbox Code Playgroud)
这是我想要的"LowRankQP收敛于15次迭代"的部分.
Ubuntu 11.04,R版本2.12.1和LowRankQP()1.0.1.
我用来能够毫无问题地运行这个脚本,但是现在fortify {ggplot2}命令给了我一个错误信息.任何可能是问题的暗示都会很棒!我使用fortify命令能够使用ggplot2对shapefile进行geom_map.
下面是我下载数据的脚本和链接.
#######################################################
#######################################################
rm(list = ls(all = TRUE))#clear workspace
getwd()
#upload packages
library(maps)
library(mapdata)
library(gridExtra)
library(rgdal)
library(rgeos)
library(ggplot2)
library(sp)
library(maptools)
gpclibPermit()
#setwd(".../FAO") FAO data are major fishing area divisions
> FAO<- readOGR(dsn="fao", layer="World_Fao_Zones")
OGR data source with driver: ESRI Shapefile
Source: "fao", layer: "World_Fao_Zones"
with 19 features and 1 fields
Feature type: wkbPolygon with 2 dimensions
> names(FAO);dim(FAO)
[1] "zone"
[1] 19 1
> str(FAO,max.level=2)
Formal class 'SpatialPolygonsDataFrame' [package "sp"] with 5 slots
..@ data :'data.frame': 19 obs. …Run Code Online (Sandbox Code Playgroud) 我在SAS和R中运行了相同的概率回归,而我的系数估计值(基本上)是等效的,报告的测试统计数据是不同的.具体而言,SAS将测试统计报告为t统计,而R将测试统计报告为z统计.
我检查了我的计量经济学文本,发现(很少详细说明)它以t统计数据报告了probit结果.
哪个统计数据合适?为什么R与SAS不同?
这是我的SAS代码:
proc qlim data=DavesData;
model y = x1 x2 x3/ discrete(d=probit);
run;
quit;
Run Code Online (Sandbox Code Playgroud)
这是我的R代码:
> model.1 <- glm(y ~ x1 + x2 + x3, family=binomial(link="probit"))
> summary(model.1)
Run Code Online (Sandbox Code Playgroud)