我想用我的数据集中的一堆独立变量运行回归.有很多预测因子,所以我不想全部写出来.是否有跨多个列的符号,所以我不必键入每个列?
我的尝试是这样做的(我的预测者是第20至43栏):
modelAllHexSubscales = lm(HHdata$garisktot~HHdata[,20:43])
Run Code Online (Sandbox Code Playgroud)
显然,这不起作用,因为HHdata[,20:43]是一个数据矩阵,而我真的需要它来看数据HHdata[,20]+HHdata[,21]等.
快问.我将csv文件读入变量data.它有一个列标签var,它有数值.
当我运行命令
sd(data$var)
Run Code Online (Sandbox Code Playgroud)
我明白了
[1] NA
Run Code Online (Sandbox Code Playgroud)
而不是我的标准差.
你能帮我弄清楚我做错了什么吗?
我猜这已存在于R的某个地方,所以也许你可以指点我.
我有两个数字向量,A和B.
A <- c(1,2,3)
B <- c(2,3,4)
Run Code Online (Sandbox Code Playgroud)
我正在寻找一个函数,它可以完成A和B之间的每个可能的比较,并返回这些比较的T/F向量.
所以在这种情况下,它会比较:1> 2然后1> 3然后1> 4然后2,2然后2> 3然后2> 4然后3> 2然后3> 4并返回:
FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE
Run Code Online (Sandbox Code Playgroud)
如果它返回差异就好了,因为它可以很容易地转换.
这样的功能是否已经存在?
我有一组数据,我想要一个子集.我希望子集定义为具有变量X值的那些行,它们出现不止一次.变量X是一个字符串.
所以,例如,如果x由('help','me','me','with','this','this')组成,它将返回带有x值的行('me','me' ", '这个,' 这个).
非常感谢你的帮助!
我正在导入3列CSV文件.最后一列是一系列条目,可以是整数,也可以是引号中的字符串.
以下是一系列示例条目:
1,4,"m"
1,5,20
1,6,"Canada"
1,7,4
1,8,5
Run Code Online (Sandbox Code Playgroud)
当我使用read.csv导入它时,这些都只是转入因子.
如何设置它们以便将它们作为整数和字符串读取?
谢谢!
我正在尝试将制表符分隔列表导入R.
它长81704行.但是,read.table只创建31376.这是我的代码:
population <- read.table('population.txt', header=TRUE,sep='\t',na.strings = 'NA',blank.lines.skip = FALSE)
Run Code Online (Sandbox Code Playgroud)
没有#评论任何东西.
以下是前几行:
[1] "NAME\tSTATENAME\tPOP_2009" "Alabama\tAlabama\t4708708" "Abbeville city\tAlabama\t2934" "Adamsville city\tAlabama\t4782"
[5] "Addison town\tAlabama\t711"
Run Code Online (Sandbox Code Playgroud)
当我读它时,readLines给出了正确的数字.
任何想法都非常感谢!
我正在尝试glmnet从glmnet包中使用来运行 LASSO 回归。
我正在使用以下命令:
library(glmnet)
glmnet(a,b,family="binomial",alpha=1)
Run Code Online (Sandbox Code Playgroud)
并且我收到错误:
> Error in if (!all(o)) { : missing value where TRUE/FALSE needed
Run Code Online (Sandbox Code Playgroud)
a是一个矩阵,具有数值。
b是一个以因子为值的向量。
但是,b有一些缺失值。我怀疑这可能是导致错误的原因。但是,我NA在 glmnet 文档中没有看到排除s的选项。
我正在尝试创建一个函数,其中创建了一个命名列表(我需要使用这个特定的结构,因为它需要调用下游函数).但是,尽管名称被定义为函数的参数,但它没有被执行.这是一个最小的例子:
make_list = function(first, second){
return(list(first=second))
}
make_list("name", "value")
#$`first`
#[1] "value"
Run Code Online (Sandbox Code Playgroud)
注意名称"first",而不是"name".第一个意图只是函数中的一个参数,但它没有被这样使用.任何建议都非常感谢.
我收到以下错误.我无法弄清楚缺少什么,因为我似乎已经将所有括号都匹配了.
错误:意外')':"{if(grepl(propertiesData [x,'city'],population [z,'NAME'],ignore.case = TRUE)&(propertiesData [x,'stateLong'] ==人口[Z, 'Statename的')"
这是循环的代码:
for (z in c(1:nrow(population)))
{
if (grepl(propertiesData[x,'city'],population[z,'NAME'],ignore.case=TRUE) & (propertiesData[x,'stateLong']==population[z,'STATENAME'))
{
propertiesData[x,'population']=population[z,'POP_2009']
break
}
}
Run Code Online (Sandbox Code Playgroud) 我运行了3个条件的实验.数据目前的组织方式如下:
| X | Y | Z |
| | 1 | |
| | 0 | |
| 0 | | |
| 0 | | |
| | | 1 |
| | | 1 |
Run Code Online (Sandbox Code Playgroud)
我希望它看起来像这样:
| Y | 1 |
| Y | 0 |
| X | 0 |
| X | 0 |
| Z | 1 |
| Z | 1 |
Run Code Online (Sandbox Code Playgroud)
这是因为很多分析似乎都需要这种格式.
我希望可能有一个函数可以进行这种转换,因为它似乎很常见.
编辑:
我尝试使用下面的重塑建议,但我遇到了问题.它似乎没有影响结构.我的数据必须与构建的测试数据有所不同,但我不确定如何.
我遇到了一些麻烦,想想也许你可以帮忙.
> simpleGame
Q6.4 Q7.4 Q8.4
3 …Run Code Online (Sandbox Code Playgroud)