我正在将一个短语读入R脚本作为参数。如果该短语包含星号(*),则我不希望脚本运行。
但是,使用grepl时,我在识别星号时遇到了问题。例如:
> asterisk="*"
> phrase1="hello"
> phrase2="h*llo"
> grepl(asterisk,phrase1)
[1] TRUE
> grepl(asterisk,phrase2)
[1] TRUE
Run Code Online (Sandbox Code Playgroud)
的结果grepl(asterisk,phrase1)应为FALSE。有谁知道我如何grepl识别短语中是否有星号?
考虑一下代码:
a=runif(1000)
microbenchmark::microbenchmark(order(a,method="radix"))
microbenchmark::microbenchmark(sort.list(a,method="radix"))
Run Code Online (Sandbox Code Playgroud)
运行此代码,我看到的更好的性能order()相比sort.list().另一方面,如果我使用100000的样本大小,两个函数的性能几乎相同.
为什么会这样?
我有一个像这样的数据集,mushrooms <- read.csv("mushrooms.csv")现在我已经有了一个mushrooms.training_set占整个数据集 1/3 的数据集。对于这两个变量,typeof()返回list。
现在,我想选择原始数据集中mushrooms不在mushrooms.training_set. 我该怎么做?我已经尝试过以下方法:
mushrooms[c(!mushrooms.training_set),]但这会返回大约 64K 行的内容。mushrooms[!mushrooms.training_set,]mushrooms[!duplicated(mushrooms.training_set)]谁帮帮我?
下面的代码生成一个堆积区域图,其中包含一个与我想要的线图,但是它产生的图例与折线图的颜色不匹配.我该如何解决?谢谢!

ggplot(data=revenue, aes(x=Date, alpha=0.1)) +
geom_area(aes(y=SENSE.revenues + ORB.revenues + SENSE.refills + ORB.refills,
fill=" ORB Refills"),colour="Black")+
geom_area(aes(y=SENSE.revenues + ORB.revenues + SENSE.refills, fill=" ORB
Revenue"),colour="Black")+
geom_area(aes(y=SENSE.revenues + SENSE.refills, fill=" SENSE
Refills"),colour="Black")+
geom_area(aes(y=SENSE.revenues, fill=" SENSE Revenues"),colour="Black") +
labs(title="Projected Revenues", subtitle="SENSE and ORB",
y="Revenue ($Thousand)") +
scale_fill_discrete(name="Revenue Type") +
theme(axis.text.x = element_text(angle = 75, hjust = 1))+
scale_x_discrete(name ="Date", limits=dates) +
scale_fill_brewer(palette="Purples")+
scale_alpha(guide = 'none')+
theme(legend.title=element_blank())+
geom_line(aes(y=Returns, fill=" Revenues Net of Returns"), colour="Red",
size=0.7)
Run Code Online (Sandbox Code Playgroud) 我已经进行了大量的谷歌搜索,这些解释要么没有任何意义,要么说只是使用因素而不是有序数据。我知道``.L is linear,.Q`是二次方的,...等等。但是我不知道该如何实际表达它的意思。举例来说,
Primary.L 7.73502 0.984
Primary.Q 6.81674 0.400
Primary.C -4.07055 0.450
Primary^4 1.48845 0.600
Run Code Online (Sandbox Code Playgroud)
其中第一列是变量,第二列是估计值,第三列是p值。当变量按顺序增加时,我要说些什么?这基本上是在说我将使用什么模型,所以这将7.73502x + 6.81674x^2 - 4.07055x^3是模型的方式?还是只包括二次方?所有这些都令人困惑。如果任何人都可以照亮一盏灯到如何解释这些.L,.Q,.C等等,那将是非常美妙。
> summary(glm(DEPENDENT ~ Year, data = HAVE, family = "binomial"))
Call:
glm(formula = DEPENDENT ~ Year, family = "binomial", data = HAVE)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.3376 -0.2490 -0.2155 -0.1635 3.1802
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -3.572966 0.028179 -126.798 < 2e-16 ***
Year.L -2.212443 …Run Code Online (Sandbox Code Playgroud) 我正在尝试计算我的转换矩阵P^100在哪里P。我想通过对角化来做到这P一点,这样我们就有P = Q*D*Q^-1.
当然,如果我可以P成为这种形式,那么我可以轻松计算P^100 = Q*D^100*Q^-1(其中*表示矩阵乘法)。
我发现,如果你这样做P^5,你将得到的回报是一个矩阵,其中 P 的每个条目都被提升到 5 次方,而不是矩阵 ( P*P*P*P*P)的 5 次方。
我在这里发现了一个问题,该问题询问如何检查矩阵是否可对角化,而不是如何明确构造矩阵的对角化。在 MATLAB 中,这非常简单,但好吧,我使用的是 R 而不是 MATLAB。
这是我的代码
# create a model from the training data comparing the TargetField to the others
lm.fit <- lm(TargetField ~ .,train)
# output a summary of the model
summary(lm.fit)
Run Code Online (Sandbox Code Playgroud)
输出是这样的
我的问题是,Estimate输出中的列告诉我们什么?
我试着打字
? summary.lm
Run Code Online (Sandbox Code Playgroud)
在 RStudio 的控制台面板中,但我没有看到提到“估计”。
我想生成一个日志正态分布,以便在我的python代码中使用它,这将改变我点击服务器的速率.任何人都可以指导我生成相同的.
我有一个数据框,想计算 R 中名义 GDP 的增长率。我知道如何在 Excel 中使用公式 来计算((gdp of this year)-gdp of last year)/( gdp of last year))*100。在R中可以使用什么样的命令来计算它?
year nominal gdp
2003 7696034.9
2004 8690254.3
2005 9424601.9
2006 10520792.8
2007 11399472.2
2008 12256863.6
2009 12072541.6
2010 13266857.9
2011 14527336.9
2012 15599270.7
2013 16078959.8
Run Code Online (Sandbox Code Playgroud)