小编Cre*_*tat的帖子

在对数据帧进行子集化时选择未定义的列

我有一个数据框,str(data)以显示有关我的数据框的更多信息,结果如下:

> str(data)
'data.frame':   153 obs. of  6 variables:
$ Ozone  : int  41 36 12 18 NA 28 23 19 8 NA ...
$ Solar.R: int  190 118 149 313 NA NA 299 99 19 194 ...
$ Wind   : num  7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ...
$ Temp   : int  67 72 74 62 56 66 65 59 61 69 ...
$ Month  : int  5 5 5 5 5 5 …
Run Code Online (Sandbox Code Playgroud)

r subset dataframe

65
推荐指数
1
解决办法
19万
查看次数

在每列中创建一个包含随机数的数据框

我有1000个随机数的模拟:

a <-sample(0:1, 1000, rep = TRUE)
Run Code Online (Sandbox Code Playgroud)

我想要的是一个十列的数据框,其中每列的值生成像一个.

例如:

id  Column 1    Column2 .........Column 10
 1   1                              1
 2   0                              1
 3   1            
     0
     0
     .
     .  
1000 1                              1 
Run Code Online (Sandbox Code Playgroud)

random r dataframe

17
推荐指数
2
解决办法
4万
查看次数

Python - 如何保存函数

我是从python开始的.我有四个功能,工作正常.我想要做的就是保存它们.我想在python中随时调用它们.

这是我的四个函数的代码:

import numpy as ui


def simulate_prizedoor(nsim):
    sim=ui.random.choice(3,nsim)
    return sims

def simulate_guess(nsim):
        guesses=ui.random.choice(3,nsim)
        return guesses

def goat_door(prizedoors, guesses):


        result = ui.random.randint(0, 3, prizedoors.size)
        while True:
            bad = (result == prizedoors) | (result == guesses)
            if not bad.any():
                return result
            result[bad] = ui.random.randint(0, 3, bad.sum())

def switch_guesses(guesses, goatdoors):


            result = ui.random.randint(0, 3, guesses.size)
            while True:
                bad = (result == guesses) | (result == goatdoors)
                if not bad.any():
                    return result
                result[bad] = ui.random.randint(0, 3, bad.sum())
Run Code Online (Sandbox Code Playgroud)

python function save

11
推荐指数
2
解决办法
2万
查看次数

可视化 - Tableau

我是画面新手,我有以下可视化,这是链接:

我的可视化

我的问题是我不知道如何在一个仪表板中添加多个仪表板作为选项卡.在我的可视化中,有三个仪表板"Nota total","Todos los cursos"和"Cursos por ciclo",其他标签只是表格.因此,如何仅使用我提到的三个仪表板来呈现我的可视化.

statistics visualization data-visualization tableau-api

6
推荐指数
1
解决办法
852
查看次数

在散点图中标记异常值

我已经绘制了这个图形来识别我的线性模型中的图形高杠杆点. 在此输入图像描述

鉴于我的模型使用的数据集的变量"NOMBRES",我试图绘制我的图形的所有点,但它变得难以辨认.这是我运行的代码:

> plot(hatvalues(tmodel),residuals(tmodel))
> text(hatvalues(tmodel),residuals(tmodel),labels=DSET$NOMBRES)
Run Code Online (Sandbox Code Playgroud)

因此,我想使用标签"DSET $ NOMBRES"绘制杠杆(帽值)高于0.05的点.

statistics plot analytics r linear-regression

6
推荐指数
1
解决办法
7763
查看次数

线性模型中预测变量的逆 - R

我在r中有这个线性模型:

a<-lm(NA. ~ PC +SPCI,data=DSET)
Run Code Online (Sandbox Code Playgroud)

现在,我想要运行的是一个带有SPCI倒数的线性模型,即(1/SCPCI).

我猜测sintaxis是:a<-lm(NA. ~ PC +(1/SPCI),data=DSET).但是对于那些代码没有意义,因为(1/SPCI)被完全忽略,它只是添加0.

那么,我该怎么做才能在R中的线性模型中运行预测变量的逆.

analytics r linear-regression

4
推荐指数
1
解决办法
1971
查看次数

Vlookup复制单元格的颜色 - Excel VBA

我有以下表格:

    A       B     C     D
  1 Bob     1     6     Football
  2 Nate    3     7     Baseball
  3 Silver  3     2     Baseball
  4 Box     7     1     Cycling

A           D
Bob         ?

Nate        ?
Run Code Online (Sandbox Code Playgroud)

我可以成功使用Vlookup来填充?单元格.例如,Vlookup(A8,A $ 1D $ 4,4,0).我不知道的是让Vlookup复制颜色.在VBA中应该有一个解决方案.我希望你的帮助.

excel vba excel-vba

4
推荐指数
1
解决办法
3万
查看次数

R,在R中运行实验100000次

我在r中生成了以下值作为实验:

>  q<- matrix(rbinom(10*1000,1,0.5),ncol=10)
>  for( i in 1:10){
+  a=a+q[1,i]
+ }
> a<-a/10
> 
> k<-sample(1:1000,1)
> b<-0
> for(i in 1:10){
+ b=b+q[k,i]
+ }
> b<-b/10
> 
> c<-rowMeans(q)
> c<-min(q)
Run Code Online (Sandbox Code Playgroud)

所以,我想要的是重复实验100000次.例如,生成矩阵q 100000次,与a,b和c相同.最后,我想要一个向量,它返回a的平均值,b的平均值和c的平均值作为100000次迭代的结果.

添加信息:我完成了你的建议:但它给了我以下信息:

> means<-rowMeans(replicate(100000,wrapper))
Error in rowMeans(replicate(1e+05, wrapper)) : 
  'x' must be an array of at least two dimensions
Run Code Online (Sandbox Code Playgroud)

上一版:这只是()的一个问题,我的意思是,它的工作方式如下:

> means<-rowMeans(replicate(100000,wrapper()))
Run Code Online (Sandbox Code Playgroud)

statistics analytics r

2
推荐指数
1
解决办法
826
查看次数

子集化数据帧中意外输出的原因 - R.

我有数据框"a",它有一个名为"VAL"的变量.我想计算VAL值为23或24的元素.

我使用了两个有效的代码:

nrow(subset(a,VAL==23|VAL==24) 
nrow(subset(a,VAL %in% c(23,24)))
Run Code Online (Sandbox Code Playgroud)

但是,我尝试了其他代码,它提供了意想不到的输出,我不知道为什么.

nrow(subset(a,VAL ==c(23,24)))
Run Code Online (Sandbox Code Playgroud)

即使我改变了23和24的顺序,它也会产生不同的意外输出.

nrow(subset(a,VAL ==c(24,23)))
Run Code Online (Sandbox Code Playgroud)

为什么这些代码不正确?他们到底在做什么?

r subset

2
推荐指数
1
解决办法
335
查看次数

简单功能中的奇怪输出 - Excel VBA

我在Excel VBA中有这个简单的功能.

Public Function ubi() As Integer
   Dim i As Integer
   For i = 7 To 10
       If IsNumeric(Cells(35, i).Value) Then
           ubi = i
       End If
   Next

   ubi = i

End Function
Run Code Online (Sandbox Code Playgroud)

如你所见,i应该是789或的值10.但是,当我在Excel工作表中测试函数时,我发现ubi()=11.

那么,我的代码中可能出现的错误来源是什么?

excel vba excel-vba

2
推荐指数
1
解决办法
83
查看次数

删除从 CSV 导入的数据框的列名称中的标点符号 - R

我读过 R 中的 CSV,其中仅包含列名称。某些列名称中存在空格,但是导入时空格会被点替换。

代码如下:

opr <- read.csv("~/opr.csv")
Run Code Online (Sandbox Code Playgroud)

现在,如果我们看到数据框的名称,单词之间没有空格。

names(opr)
 [1] "ALUMNO"                 "CICLO"                 
 [3] "TIPO.EX"                "NIVEL"                 
 [5] "Aritmetica.pregunta.1"  "Aritmetica.pregunta.2" 
 [7] "Aritmetica.pregunta.3"  "Aritmetica.pregunta.4" 
Run Code Online (Sandbox Code Playgroud)

我想知道如何像 csv 中那样用空格替换点。

csv r

1
推荐指数
1
解决办法
2589
查看次数

将列名(年)转换为变量值 - Python,R

我有一个看起来像这样的CSV:

                       1991       1992      1993       1991       1992      1993
VariableA  VariableB   VariableC  VariableC VariableC  VariableD  VariableD VariableD
     lm          mt         1          3          4            2        3         5
Run Code Online (Sandbox Code Playgroud)

所以我想创建一个名为year的变量并执行以下操作:

VariableA VariableB     Year   VariableC   VariableD 
 lm          mt         1991      1            2
 lm          mt         1992      3            3
 lm          mt         1993      4            5
Run Code Online (Sandbox Code Playgroud)

我主要和Pandas一起工作,我正在学习,但我不知道要正确读取数据,然后进行操作.如果有人在R中提出解决方案,那也会很好.

版本:

我的真实数据框架是从1991年到2013年的多年,并且有更多的变量具有重复.我尝试使用Ananda Mahtosplitstackshape建议的包中的代码,但是我收到了一条错误消息.那么,我的错误是什么?

mydf <- read.csv("DatosCOMPUSTATfinal.csv", skip = 3, check.names = FALSE)

nombres <- names(mydf)[-c(1,2,3)]

nombres <- unique(nombres)

> nombres
 [1] "Employees"                  "Market Value-daily"        
 [3] "Market to book - daily"     "Total return" …
Run Code Online (Sandbox Code Playgroud)

python r pandas

0
推荐指数
1
解决办法
104
查看次数