在matlab中,有一种方法可以在一个向量中找到值,但在另一个向量中却找不到.
例如:
x <- c(1,2,3,4)
y <- c(2,3,4)
Run Code Online (Sandbox Code Playgroud)
是那里会告诉我,在价值的任何功能x
,在不y
为1?
我正在尝试在R中生成直方图,y为对数标度.目前我这样做:
hist(mydata$V3, breaks=c(0,1,2,3,4,5,25))
Run Code Online (Sandbox Code Playgroud)
这给了我一个直方图,但是0到1之间的密度是如此之大(大约一百万个值的差异),你几乎无法看出任何其他的条形.
然后我尝试过:
mydata_hist <- hist(mydata$V3, breaks=c(0,1,2,3,4,5,25), plot=FALSE)
plot(rpd_hist$counts, log="xy", pch=20, col="blue")
Run Code Online (Sandbox Code Playgroud)
它给了我一个我想要的东西,但是底部显示了值1-6而不是0,1,2,3,4,5,25.它还将数据显示为点而不是条形.barplot
工作,但后来我没有任何底轴.
我只是寻找B1(newx)线性模型系数的值,而不是名称.我只想要0.5值.我不想要名字"newx".
newx <- c(0.5,1.5.2.5)
newy <- c(2,3,4)
out <- lm(newy ~ newx)
Run Code Online (Sandbox Code Playgroud)
out
好像:
Call:
lm(formula = newy ~ newx)
Coefficients:
(Intercept) newx
1.5 1.0
Run Code Online (Sandbox Code Playgroud)
我到了这里 但现在我被卡住了.
out$coefficients["newx"]
newx
1.0
Run Code Online (Sandbox Code Playgroud) 我刚开始使用R,并遇到了data.table.我发现它很棒.
一个非常天真的问题:我可以忽略data.frame来使用data.table来避免两个包之间的语法混淆吗?
我在R中生成以下虚拟变量时遇到问题:
我正在分析年度时间序列数据(时间段1948-2009).我有两个问题:
如何为观察#10生成虚拟变量,即1957年(1957年值= 1,否则为零)?
如何生成一个在1957年之前为零的虚拟变量,从1957年开始到2009年的值为1?
我有一个读取大型csv文件到数据框.csv文件中的数据来自表示用户信息的多个网站.例如,这里是数据框的结构.
user_id, number_of_logins, number_of_images, web
001, 34, 3, aa.com
002, 4, 4, aa.com
034, 3, 3, aa.com
001, 12, 4, bb.com
002, 1, 3, bb.com
034, 2, 2, cc.com
Run Code Online (Sandbox Code Playgroud)
正如您所看到的,一旦我将数据带入数据框,user_id就不再是唯一的ID,这会导致所有分析.我试图添加另一个列之前的user_id
类似的东西,"generated_uid"
并且几乎使用该data.frame
列填充的索引.什么是实现这一目标的最佳方式.
我有以下数据框架
data.frame(a = c(1,2,3),b = c(1,2,3))
a b
1 1 1
2 2 2
3 3 3
Run Code Online (Sandbox Code Playgroud)
我想把它变成
a b
1 1 1
2 2 2
3 3 3
4 1 1
5 2 2
6 3 3
7 1 1
8 2 2
9 3 3
Run Code Online (Sandbox Code Playgroud)
或重复N次.在R中有一个简单的功能吗?谢谢!
我有两个向量:
vars <- c("SR", "PL")
vis <- c(1,2,3)
Run Code Online (Sandbox Code Playgroud)
基于这些向量,我想创建以下向量:
"SR.1" "SR.2" "SR.3" "PL.1" "PL.2" "PL.3"
Run Code Online (Sandbox Code Playgroud)
随着paste
我有以下结果:
paste(vars, vis, sep=".")
[1] "SR.1" "PL.2" "SR.3"
Run Code Online (Sandbox Code Playgroud)
如何创建我需要的矢量?
目前我有一个问题如下.在存在每个主题的多个观察的数据集中,我想制作该数据集的子集,其中仅选择记录的最大数据.例如,对于如下数据集:
ID <- c(1,1,1,2,2,2,2,3,3)
Value <- c(2,3,5,2,5,8,17,3,5)
Event <- c(1,1,2,1,2,1,2,2,2)
group <- data.frame(Subject=ID, pt=Value, Event=Event)
Run Code Online (Sandbox Code Playgroud)
对象1,2和3的最大pt值分别为5,17和5.我怎么能首先找到每个主题的最大pt值,然后将这个观察结果放在另一个数据框中?这意味着该子集仅具有每个主题的最大pt值.