我正在测试不同生境和耻辱类型植物柱头上花粉粒数量的差异.
我的样本设计包括两个栖息地,每个栖息地有10个站点.
在每个地点,我有多达3种耻辱类型(湿,干和半干),并且对于每种耻辱类型,我有不同数量的植物物种,每种植物物种的个体数量不同(代码).
所以,我最终得到了嵌套设计如下:habitat/site/stigmatype/stigmaspecies/code由于它是一个描述性研究,因此各个站点之间的耻辱类型,耻辱种类和代码都有所不同.
我的响应变量(n)是每株植物每个柱头的pollengrains(log10 + 1)的数量,平均因为我每株植物收集3个柱头.
数据不适合泊松分布,因为(i)不是整数,(ii)方差远高于平均值(比率= 911.0756).所以,我适合作为negative.binomial.
模型选择后,我有:
m4a<-glmer(n ~ habitat*stigmatype +
Run Code Online (Sandbox Code Playgroud)
(1 | stigmaspecies /代码),家庭= negative.binomial(2))
> summary(m4a)
Generalized linear mixed model fit by maximum likelihood ['glmerMod']
Family: Negative Binomial(2) ( log )
Formula: n ~ habitat * stigmatype + (1 | stigmaspecies/code)
AIC BIC logLik deviance
993.9713 1030.6079 -487.9856 975.9713
Random effects:
Groups Name Variance Std.Dev.
code:stigmaspecies (Intercept) 1.034e-12 1.017e-06
stigmaspecies (Intercept) 4.144e-02 2.036e-01
Residual 2.515e-01 5.015e-01
Number of obs: 433, groups: code:stigmaspecies, 433; stigmaspecies, 41 …Run Code Online (Sandbox Code Playgroud) 我如何data.frame根据多个条件进行搜索?例如,我有一个data.frame诸如Date, Time, Item, 之类的列Value,然后我想搜索data.frame我有Date = 1/2/2010, Time = 5pm, Item = Car, 的位置Value = 5,是否有允许我这样做的函数?更重要的是,如何获取具有这些值的数据框的行索引?
例如,假设所有这些值都在数据帧的第三行,是否有一个函数可以逐行搜索数据帧,然后输出索引为 3?
我在 Hive 中写这个。我有一张只有一个数字的桌子。我将调用包含数字 table_number 和实际数字的表my_number。
在另一个尚不存在的表中,我需要输入一个十进制数,即1/my_number.
我试过SELECT CAST((1/(SELECT my_number FROM table_number)) as double); 我得到一个解析异常"cannot recognize input near 'cast' '(' '('
我也试过double(1/(SELECT my_number FROM table_number)); 我得到另一个解析异常"cannot recognize input near 'double' '(' 'Select'
我完全不知道如何做到这一点。谁能给我一些除法示例,这些示例也对其中一个数字使用 select 语句?
我有两个数据框,我想将一个数据框的内容与另一个数据框进行匹配,为此我使用以下函数:
t <- read.csv("F:/M.Tech/Semester4/Thesis/Code/Book1.csv")
s <- read.csv("F:/M.Tech/Semester4/Thesis/Code/a4.csv")
x <- nrow(s)
y <- nrow(t)
for(i in 1:x)
for(j in 1:y)
ifelse (match(s[i,2], t[j,1]), s[i,9] <- t[j,2] , s[i,9] <- 0)
Run Code Online (Sandbox Code Playgroud)
对于此代码,当内容匹配时,它就可以正常工作。但 else 部分返回 NA。我怎样才能将0分配给所有不匹配的地方。我得到的结果是:
# word count word tf score word robability log values TFxIDF score Keyword Probability
# yemen 380 yemen 1 0.053938964 2.919902172 2.919902172 NA
# strikes 116 strikes 0.305263158 0.016465578 4.106483233 1.25355804 0.5
# deadly 105 deadly 0.276315789 0.014904187 4.206113074 1.162215455 0.7
# new 88 new 0.231578947 0.012491128 …Run Code Online (Sandbox Code Playgroud) 我的仪器数据包含非分隔格式的小时和分钟(例如0, 30, 100, 130, ... 2300, 2300).我想将列转换为POSIXR中的对象(例如,看起来像这样的东西"2016-01-07 11:07:59 EST"),我的第一步是从该列中提取出小时和分钟数据.(我也有相应的朱利安日期和年份列.)
我被绊倒了,因为小时和分钟没有分隔,我无法使用该strptime功能.我使用谷歌和SO搜索(使用SO上的R和datatime标签),但一直无法找到解决方案.我可以在SO上找到的所有例子(例如,这里或这里)的时间和分钟都被诸如之类的东西分开0:30.
这是我的MCVE:
hour <- c(0, 30, 100, 130, 1000, 1030, 2300, 2330)
year <- c(2007, 2007, 2007, 2007, 2007, 2007, 2007, 2007)
day <- c(2, 2, 2, 2, 2, 2, 2, 2)
strptime(hour, "%h%m")
Run Code Online (Sandbox Code Playgroud)
那么,当我有非分隔数据时,如何提取小时和分钟?