我有一个数据框,str(data)以显示有关我的数据框的更多信息,结果如下:
> str(data)
'data.frame': 153 obs. of 6 variables:
$ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ...
$ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ...
$ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...
$ Temp : int 67 72 74 62 56 66 65 59 61 69 ...
$ Month : int 5 5 5 5 5 5 …Run Code Online (Sandbox Code Playgroud) 我有1000个随机数的模拟:
a <-sample(0:1, 1000, rep = TRUE)
Run Code Online (Sandbox Code Playgroud)
我想要的是一个十列的数据框,其中每列的值生成像一个.
例如:
id Column 1 Column2 .........Column 10
1 1 1
2 0 1
3 1
0
0
.
.
1000 1 1
Run Code Online (Sandbox Code Playgroud) 我是从python开始的.我有四个功能,工作正常.我想要做的就是保存它们.我想在python中随时调用它们.
这是我的四个函数的代码:
import numpy as ui
def simulate_prizedoor(nsim):
sim=ui.random.choice(3,nsim)
return sims
def simulate_guess(nsim):
guesses=ui.random.choice(3,nsim)
return guesses
def goat_door(prizedoors, guesses):
result = ui.random.randint(0, 3, prizedoors.size)
while True:
bad = (result == prizedoors) | (result == guesses)
if not bad.any():
return result
result[bad] = ui.random.randint(0, 3, bad.sum())
def switch_guesses(guesses, goatdoors):
result = ui.random.randint(0, 3, guesses.size)
while True:
bad = (result == guesses) | (result == goatdoors)
if not bad.any():
return result
result[bad] = ui.random.randint(0, 3, bad.sum())
Run Code Online (Sandbox Code Playgroud) 我是画面新手,我有以下可视化,这是链接:
我的问题是我不知道如何在一个仪表板中添加多个仪表板作为选项卡.在我的可视化中,有三个仪表板"Nota total","Todos los cursos"和"Cursos por ciclo",其他标签只是表格.因此,如何仅使用我提到的三个仪表板来呈现我的可视化.
我已经绘制了这个图形来识别我的线性模型中的图形高杠杆点.

鉴于我的模型使用的数据集的变量"NOMBRES",我试图绘制我的图形的所有点,但它变得难以辨认.这是我运行的代码:
> plot(hatvalues(tmodel),residuals(tmodel))
> text(hatvalues(tmodel),residuals(tmodel),labels=DSET$NOMBRES)
Run Code Online (Sandbox Code Playgroud)
因此,我想使用标签"DSET $ NOMBRES"绘制杠杆(帽值)高于0.05的点.
我在r中有这个线性模型:
a<-lm(NA. ~ PC +SPCI,data=DSET)
Run Code Online (Sandbox Code Playgroud)
现在,我想要运行的是一个带有SPCI倒数的线性模型,即(1/SCPCI).
我猜测sintaxis是:a<-lm(NA. ~ PC +(1/SPCI),data=DSET).但是对于那些代码没有意义,因为(1/SPCI)被完全忽略,它只是添加0.
那么,我该怎么做才能在R中的线性模型中运行预测变量的逆.
我有以下表格:
A B C D
1 Bob 1 6 Football
2 Nate 3 7 Baseball
3 Silver 3 2 Baseball
4 Box 7 1 Cycling
A D
Bob ?
Nate ?
Run Code Online (Sandbox Code Playgroud)
我可以成功使用Vlookup来填充?单元格.例如,Vlookup(A8,A $ 1D $ 4,4,0).我不知道的是让Vlookup复制颜色.在VBA中应该有一个解决方案.我希望你的帮助.
我在r中生成了以下值作为实验:
> q<- matrix(rbinom(10*1000,1,0.5),ncol=10)
> for( i in 1:10){
+ a=a+q[1,i]
+ }
> a<-a/10
>
> k<-sample(1:1000,1)
> b<-0
> for(i in 1:10){
+ b=b+q[k,i]
+ }
> b<-b/10
>
> c<-rowMeans(q)
> c<-min(q)
Run Code Online (Sandbox Code Playgroud)
所以,我想要的是重复实验100000次.例如,生成矩阵q 100000次,与a,b和c相同.最后,我想要一个向量,它返回a的平均值,b的平均值和c的平均值作为100000次迭代的结果.
添加信息:我完成了你的建议:但它给了我以下信息:
> means<-rowMeans(replicate(100000,wrapper))
Error in rowMeans(replicate(1e+05, wrapper)) :
'x' must be an array of at least two dimensions
Run Code Online (Sandbox Code Playgroud)
上一版:这只是()的一个问题,我的意思是,它的工作方式如下:
> means<-rowMeans(replicate(100000,wrapper()))
Run Code Online (Sandbox Code Playgroud) 我有数据框"a",它有一个名为"VAL"的变量.我想计算VAL值为23或24的元素.
我使用了两个有效的代码:
nrow(subset(a,VAL==23|VAL==24)
nrow(subset(a,VAL %in% c(23,24)))
Run Code Online (Sandbox Code Playgroud)
但是,我尝试了其他代码,它提供了意想不到的输出,我不知道为什么.
nrow(subset(a,VAL ==c(23,24)))
Run Code Online (Sandbox Code Playgroud)
即使我改变了23和24的顺序,它也会产生不同的意外输出.
nrow(subset(a,VAL ==c(24,23)))
Run Code Online (Sandbox Code Playgroud)
为什么这些代码不正确?他们到底在做什么?
我在Excel VBA中有这个简单的功能.
Public Function ubi() As Integer
Dim i As Integer
For i = 7 To 10
If IsNumeric(Cells(35, i).Value) Then
ubi = i
End If
Next
ubi = i
End Function
Run Code Online (Sandbox Code Playgroud)
如你所见,i应该是7或8或9或的值10.但是,当我在Excel工作表中测试函数时,我发现ubi()=11.
那么,我的代码中可能出现的错误来源是什么?
我读过 R 中的 CSV,其中仅包含列名称。某些列名称中存在空格,但是导入时空格会被点替换。
代码如下:
opr <- read.csv("~/opr.csv")
Run Code Online (Sandbox Code Playgroud)
现在,如果我们看到数据框的名称,单词之间没有空格。
names(opr)
[1] "ALUMNO" "CICLO"
[3] "TIPO.EX" "NIVEL"
[5] "Aritmetica.pregunta.1" "Aritmetica.pregunta.2"
[7] "Aritmetica.pregunta.3" "Aritmetica.pregunta.4"
Run Code Online (Sandbox Code Playgroud)
我想知道如何像 csv 中那样用空格替换点。
我有一个看起来像这样的CSV:
1991 1992 1993 1991 1992 1993
VariableA VariableB VariableC VariableC VariableC VariableD VariableD VariableD
lm mt 1 3 4 2 3 5
Run Code Online (Sandbox Code Playgroud)
所以我想创建一个名为year的变量并执行以下操作:
VariableA VariableB Year VariableC VariableD
lm mt 1991 1 2
lm mt 1992 3 3
lm mt 1993 4 5
Run Code Online (Sandbox Code Playgroud)
我主要和Pandas一起工作,我正在学习,但我不知道要正确读取数据,然后进行操作.如果有人在R中提出解决方案,那也会很好.
版本:
我的真实数据框架是从1991年到2013年的多年,并且有更多的变量具有重复.我尝试使用Ananda Mahtosplitstackshape建议的包中的代码,但是我收到了一条错误消息.那么,我的错误是什么?
mydf <- read.csv("DatosCOMPUSTATfinal.csv", skip = 3, check.names = FALSE)
nombres <- names(mydf)[-c(1,2,3)]
nombres <- unique(nombres)
> nombres
[1] "Employees" "Market Value-daily"
[3] "Market to book - daily" "Total return" …Run Code Online (Sandbox Code Playgroud)