小编evt*_*evt的帖子

如何在不键入每个变量名的情况下对一系列变量进行回归

我想用我的数据集中的一堆独立变量运行回归.有很多预测因子,所以我不想全部写出来.是否有跨多个列的符号,所以我不必键入每个列?

我的尝试是这样做的(我的预测者是第20至43栏):

modelAllHexSubscales = lm(HHdata$garisktot~HHdata[,20:43])
Run Code Online (Sandbox Code Playgroud)

显然,这不起作用,因为HHdata[,20:43]是一个数据矩阵,而我真的需要它来看数据HHdata[,20]+HHdata[,21]等.

r

13
推荐指数
2
解决办法
1万
查看次数

当我运行标准偏差时获得"NA"

快问.我将csv文件读入变量data.它有一个列标签var,它有数值.

当我运行命令

sd(data$var)
Run Code Online (Sandbox Code Playgroud)

我明白了

[1] NA 
Run Code Online (Sandbox Code Playgroud)

而不是我的标准差.

你能帮我弄清楚我做错了什么吗?

statistics r na stdev

9
推荐指数
3
解决办法
3万
查看次数

R函数用于对两个向量进行所有成对比较

我猜这已存在于R的某个地方,所以也许你可以指点我.

我有两个数字向量,A和B.

A <- c(1,2,3)
B <- c(2,3,4)
Run Code Online (Sandbox Code Playgroud)

我正在寻找一个函数,它可以完成A和B之间的每个可能的比较,并返回这些比较的T/F向量.

所以在这种情况下,它会比较:1> 2然后1> 3然后1> 4然后2,2然后2> 3然后2> 4然后3> 2然后3> 4并返回:

FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE
Run Code Online (Sandbox Code Playgroud)

如果它返回差异就好了,因为它可以很容易地转换.

这样的功能是否已经存在?

r

7
推荐指数
1
解决办法
6073
查看次数

如何获得一个数据帧的子集,该子集只包含在R中出现在集合中的元素多次

我有一组数据,我想要一个子集.我希望子集定义为具有变量X值的那些行,它们出现不止一次.变量X是一个字符串.

所以,例如,如果x由('help','me','me','with','this','this')组成,它将返回带有x值的行('me','me' ", '这个,' 这个).

非常感谢你的帮助!

r

6
推荐指数
1
解决办法
1179
查看次数

读取csv文件,在一列中包含数字和字符串

我正在导入3列CSV文件.最后一列是一系列条目,可以是整数,也可以是引号中的字符串.

以下是一系列示例条目:

1,4,"m"
1,5,20
1,6,"Canada"
1,7,4
1,8,5
Run Code Online (Sandbox Code Playgroud)

当我使用read.csv导入它时,这些都只是转入因子.

如何设置它们以便将它们作为整数和字符串读取?

谢谢!

csv r

6
推荐指数
2
解决办法
2911
查看次数

read.table创建的行太少,但readLines的编号正确

我正在尝试将制表符分隔列表导入R.

它长81704行.但是,read.table只创建31376.这是我的代码:

population <- read.table('population.txt', header=TRUE,sep='\t',na.strings = 'NA',blank.lines.skip = FALSE)
Run Code Online (Sandbox Code Playgroud)

没有#评论任何东西.

以下是前几行:

[1] "NAME\tSTATENAME\tPOP_2009"      "Alabama\tAlabama\t4708708"      "Abbeville city\tAlabama\t2934"  "Adamsville city\tAlabama\t4782"
[5] "Addison town\tAlabama\t711"
Run Code Online (Sandbox Code Playgroud)

当我读它时,readLines给出了正确的数字.

任何想法都非常感谢!

r

5
推荐指数
2
解决办法
4526
查看次数

在 R 中运行 glmnet 包,出现错误“缺少 TRUE/FALSE 需要的值”,可能是由于缺少值?

我正在尝试glmnetglmnet包中使用来运行 LASSO 回归。

我正在使用以下命令:

library(glmnet)
glmnet(a,b,family="binomial",alpha=1)
Run Code Online (Sandbox Code Playgroud)

并且我收到错误:

> Error in if (!all(o)) { : missing value where TRUE/FALSE needed
Run Code Online (Sandbox Code Playgroud)

a是一个矩阵,具有数值。 b是一个以因子为值的向量。

但是,b有一些缺失值。我怀疑这可能是导致错误的原因。但是,我NA在 glmnet 文档中没有看到排除s的选项。

r glmnet

3
推荐指数
1
解决办法
6382
查看次数

无法根据函数参数创建列表

我正在尝试创建一个函数,其中创建了一个命名列表(我需要使用这个特定的结构,因为它需要调用下游函数).但是,尽管名称被定义为函数的参数,但它没有被执行.这是一个最小的例子:

make_list = function(first, second){
  return(list(first=second))
}
make_list("name", "value")
#$`first`
#[1] "value"
Run Code Online (Sandbox Code Playgroud)

注意名称"first",而不是"name".第一个意图只是函数中的一个参数,但它没有被这样使用.任何建议都非常感谢.

r function list

2
推荐指数
1
解决办法
67
查看次数

意想不到的')',这是我无法弄清楚的

我收到以下错误.我无法弄清楚缺少什么,因为我似乎已经将所有括号都匹配了.

错误:意外')':"{if(grepl(propertiesData [x,'city'],population [z,'NAME'],ignore.case = TRUE)&(propertiesData [x,'stateLong'] ==人口[Z, 'Statename的')"

这是循环的代码:

for (z in c(1:nrow(population)))
{
    if (grepl(propertiesData[x,'city'],population[z,'NAME'],ignore.case=TRUE) & (propertiesData[x,'stateLong']==population[z,'STATENAME'))
    {
        propertiesData[x,'population']=population[z,'POP_2009']
        break
    }
}
Run Code Online (Sandbox Code Playgroud)

nested r

1
推荐指数
1
解决办法
6653
查看次数

如何将多列数据折叠为两列,包含一个指标列和一个数据列

我运行了3个条件的实验.数据目前的组织方式如下:

| X | Y | Z |
|   | 1 |   |
|   | 0 |   |
| 0 |   |   |
| 0 |   |   |
|   |   | 1 |
|   |   | 1 |
Run Code Online (Sandbox Code Playgroud)

我希望它看起来像这样:

| Y | 1 |
| Y | 0 |
| X | 0 |
| X | 0 |
| Z | 1 |
| Z | 1 |
Run Code Online (Sandbox Code Playgroud)

这是因为很多分析似乎都需要这种格式.

我希望可能有一个函数可以进行这种转换,因为它似乎很常见.

编辑:

我尝试使用下面的重塑建议,但我遇到了问题.它似乎没有影响结构.我的数据必须与构建的测试数据有所不同,但我不确定如何.

我遇到了一些麻烦,想想也许你可以帮忙.

> simpleGame
   Q6.4 Q7.4 Q8.4
3 …
Run Code Online (Sandbox Code Playgroud)

r

1
推荐指数
1
解决办法
695
查看次数

标签 统计

r ×10

csv ×1

function ×1

glmnet ×1

list ×1

na ×1

nested ×1

statistics ×1

stdev ×1