小编Ric*_*son的帖子

glmer过度离散的模型检验和测试

我正在测试不同生境和耻辱类型植物柱头上花粉粒数量的差异.
我的样本设计包括两个栖息地,每个栖息地有10个站点.
在每个地点,我有多达3种耻辱类型(湿,干和半干),并且对于每种耻辱类型,我有不同数量的植物物种,每种植物物种的个体数量不同(代码).
所以,我最终得到了嵌套设计如下:habitat/site/stigmatype/stigmaspecies/code由于它是一个描述性研究,因此各个站点之间的耻辱类型,耻辱种类和代码都有所不同.

我的响应变量(n)是每株植物每个柱头的pollengrains(log10 + 1)的数量,平均因为我每株植物收集3个柱头.
数据不适合泊松分布,因为(i)不是整数,(ii)方差远高于平均值(比率= 911.0756).所以,我适合作为negative.binomial.

模型选择后,我有:

m4a<-glmer(n ~ habitat*stigmatype + 
Run Code Online (Sandbox Code Playgroud)

(1 | stigmaspecies /代码),家庭= negative.binomial(2))

> summary(m4a)
Generalized linear mixed model fit by maximum likelihood ['glmerMod']
Family: Negative Binomial(2) ( log )
Formula: n ~ habitat * stigmatype + (1 | stigmaspecies/code) 

      AIC       BIC    logLik  deviance
 993.9713 1030.6079 -487.9856  975.9713 

Random effects:
Groups             Name        Variance  Std.Dev. 
code:stigmaspecies (Intercept) 1.034e-12 1.017e-06
stigmaspecies      (Intercept) 4.144e-02 2.036e-01
Residual                       2.515e-01 5.015e-01
Number of obs: 433, groups: code:stigmaspecies, 433; stigmaspecies, 41 …
Run Code Online (Sandbox Code Playgroud)

r

2
推荐指数
2
解决办法
1万
查看次数

在 R 中搜索数据帧

我如何data.frame根据多个条件进行搜索?例如,我有一个data.frame诸如Date, Time, Item, 之类的列Value,然后我想搜索data.frame我有Date = 1/2/2010, Time = 5pm, Item = Car, 的位置Value = 5,是否有允许我这样做的函数?更重要的是,如何获取具有这些值的数据框的行索引?

例如,假设所有这些值都在数据帧的第三行,是否有一个函数可以逐行搜索数据帧,然后输出索引为 3?

indexing search r dataframe

2
推荐指数
1
解决办法
2万
查看次数

如何使用 Select 语句在 Hive 中执行除法

我在 Hive 中写这个。我有一张只有一个数字的桌子。我将调用包含数字 table_number 和实际数字的表my_number

在另一个尚不存在的表中,我需要输入一个十进制数,即1/my_number.

我试过SELECT CAST((1/(SELECT my_number FROM table_number)) as double); 我得到一个解析异常"cannot recognize input near 'cast' '(' '('

我也试过double(1/(SELECT my_number FROM table_number)); 我得到另一个解析异常"cannot recognize input near 'double' '(' 'Select'

我完全不知道如何做到这一点。谁能给我一些除法示例,这些示例也对其中一个数字使用 select 语句?

sql hadoop hive division

1
推荐指数
1
解决办法
1万
查看次数

ifelse in 'r' 返回 NA 值

我有两个数据框,我想将一个数据框的内容与另一个数据框进行匹配,为此我使用以下函数:

t <- read.csv("F:/M.Tech/Semester4/Thesis/Code/Book1.csv")
s <- read.csv("F:/M.Tech/Semester4/Thesis/Code/a4.csv")
x <- nrow(s)
y <- nrow(t)
for(i in 1:x)
    for(j in 1:y)
        ifelse (match(s[i,2], t[j,1]), s[i,9] <- t[j,2] , s[i,9] <- 0)
Run Code Online (Sandbox Code Playgroud)

对于此代码,当内容匹配时,它就可以正常工作。但 else 部分返回 NA。我怎样才能将0分配给所有不匹配的地方。我得到的结果是:

# word  count   word    tf score    word robability log values  TFxIDF score Keyword Probability
# yemen 380 yemen   1   0.053938964 2.919902172 2.919902172 NA
# strikes   116 strikes 0.305263158 0.016465578 4.106483233 1.25355804  0.5
# deadly    105 deadly  0.276315789 0.014904187 4.206113074 1.162215455 0.7
# new   88  new 0.231578947 0.012491128 …
Run Code Online (Sandbox Code Playgroud)

r

0
推荐指数
1
解决办法
4671
查看次数

从非分隔数据中提取小时分钟

我的仪器数据包含非分隔格式的小时和分钟(例如0, 30, 100, 130, ... 2300, 2300).我想将列转换为POSIXR中的对象(例如,看起来像这样的东西"2016-01-07 11:07:59 EST"),我的第一步是从该列中提取出小时和分钟数据.(我也有相应的朱利安日期和年份列.)

我被绊倒了,因为小时和分钟没有分隔,我无法使用该strptime功能.我使用谷歌和SO搜索(使用SO上的Rdatatime标签),但一直无法找到解决方案.我可以在SO上找到的所有例子(例如,这里这里)的时间和分钟都被诸如之类的东西分开0:30.

这是我的MCVE:

hour <- c(0, 30, 100, 130, 1000, 1030, 2300, 2330)
year <- c(2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007)
day  <- c(2, 2, 2, 2, 2, 2, 2, 2)
strptime(hour, "%h%m")
Run Code Online (Sandbox Code Playgroud)

那么,当我有非分隔数据时,如何提取小时和分钟?

datetime r

0
推荐指数
1
解决办法
88
查看次数

标签 统计

r ×4

dataframe ×1

datetime ×1

division ×1

hadoop ×1

hive ×1

indexing ×1

search ×1

sql ×1