小编Ben*_*ker的帖子

在R中使用grepl搜索星号

我正在将一个短语读入R脚本作为参数。如果该短语包含星号(*),则我不希望脚本运行。

但是,使用grepl时,我在识别星号时遇到了问题。例如:

> asterisk="*"
> phrase1="hello"
> phrase2="h*llo"
> grepl(asterisk,phrase1)
[1] TRUE
> grepl(asterisk,phrase2)
[1] TRUE
Run Code Online (Sandbox Code Playgroud)

的结果grepl(asterisk,phrase1)应为FALSE。有谁知道我如何grepl识别短语中是否有星号?

r

0
推荐指数
1
解决办法
1193
查看次数

为什么order()比sort.list()更快?

考虑一下代码:

a=runif(1000)
microbenchmark::microbenchmark(order(a,method="radix"))
microbenchmark::microbenchmark(sort.list(a,method="radix"))
Run Code Online (Sandbox Code Playgroud)

运行此代码,我看到的更好的性能order()相比sort.list().另一方面,如果我使用100000的样本大小,两个函数的性能几乎相同.

为什么会这样?

sorting r radix-sort

0
推荐指数
1
解决办法
167
查看次数

创建数据集的两个列表之间的差异

我有一个像这样的数据集,mushrooms <- read.csv("mushrooms.csv")现在我已经有了一个mushrooms.training_set占整个数据集 1/3 的数据集。对于这两个变量,typeof()返回list

现在,我想选择原始数据集中mushrooms不在mushrooms.training_set. 我该怎么做?我已经尝试过以下方法:

  • mushrooms[c(!mushrooms.training_set),]但这会返回大约 64K 行的内容。
  • mushrooms[!mushrooms.training_set,]
  • mushrooms[!duplicated(mushrooms.training_set)]

谁帮帮我?

r

0
推荐指数
1
解决办法
294
查看次数

为什么我的传奇在我的geom_line应该是红色的时候使用紫色?

下面的代码生成一个堆积区域图,其中包含一个与我想要的线图,但是它产生的图例与折线图的颜色不匹配.我该如何解决?谢谢!

图表上的图例

ggplot(data=revenue, aes(x=Date, alpha=0.1)) +
  geom_area(aes(y=SENSE.revenues + ORB.revenues + SENSE.refills + ORB.refills, 
                fill=" ORB Refills"),colour="Black")+
  geom_area(aes(y=SENSE.revenues + ORB.revenues + SENSE.refills, fill=" ORB 
                Revenue"),colour="Black")+
  geom_area(aes(y=SENSE.revenues + SENSE.refills, fill=" SENSE 
                Refills"),colour="Black")+
  geom_area(aes(y=SENSE.revenues, fill=" SENSE Revenues"),colour="Black") +
                labs(title="Projected Revenues", subtitle="SENSE and ORB", 
                     y="Revenue ($Thousand)") +          
  scale_fill_discrete(name="Revenue Type") +
  theme(axis.text.x = element_text(angle = 75, hjust = 1))+
  scale_x_discrete(name ="Date", limits=dates) +                   
  scale_fill_brewer(palette="Purples")+
  scale_alpha(guide = 'none')+
  theme(legend.title=element_blank())+
  geom_line(aes(y=Returns, fill=" Revenues Net of Returns"), colour="Red", 
                size=0.7)
Run Code Online (Sandbox Code Playgroud)

r ggplot2

0
推荐指数
1
解决办法
53
查看次数

.L,.Q。,。C,.4…的逻辑回归解释

我已经进行了大量的谷歌搜索,这些解释要么没有任何意义,要么说只是使用因素而不是有序数据。我知道``.L is linear,.Q`是二次方的,...等等。但是我不知道该如何实际表达它的意思。举例来说,

Primary.L     7.73502       0.984
Primary.Q     6.81674       0.400
Primary.C     -4.07055      0.450
Primary^4     1.48845       0.600
Run Code Online (Sandbox Code Playgroud)

其中第一列是变量,第二列是估计值,第三列是p值。当变量按顺序增加时,我要说些什么?这基本上是在说我将使用什么模型,所以这将7.73502x + 6.81674x^2 - 4.07055x^3是模型的方式?还是只包括二次方?所有这些都令人困惑。如果任何人都可以照亮一盏灯到如何解释这些.L.Q.C等等,那将是非常美妙。

> summary(glm(DEPENDENT ~ Year, data = HAVE, family = "binomial"))

Call:
glm(formula = DEPENDENT ~ Year, family = "binomial", data = HAVE)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-0.3376  -0.2490  -0.2155  -0.1635   3.1802  

Coefficients:
             Estimate Std. Error  z value Pr(>|z|)    
(Intercept) -3.572966   0.028179 -126.798  < 2e-16 ***
Year.L      -2.212443 …
Run Code Online (Sandbox Code Playgroud)

r ordinal

0
推荐指数
1
解决办法
171
查看次数

date() 函数有任何参数吗?

我试图找出它是否有一个,但似乎没有任何帮助。

help(date)
Run Code Online (Sandbox Code Playgroud)

r

0
推荐指数
1
解决办法
49
查看次数

对角化矩阵以计算矩阵幂?

我正在尝试计算我的转换矩阵P^100在哪里P。我想通过对角化来做到这P一点,这样我们就有P = Q*D*Q^-1.

当然,如果我可以P成为这种形式,那么我可以轻松计算P^100 = Q*D^100*Q^-1(其中*表示矩阵乘法)。

我发现,如果你这样做P^5,你将得到的回报是一个矩阵,其中 P 的每个条目都被提升到 5 次方,而不是矩阵 ( P*P*P*P*P)的 5 次方。

我在这里发现了一个问题,该问题询问如何检查矩阵是否可对角化,而不是如何明确构造矩阵的对角化。在 MATLAB 中,这非常简单,但好吧,我使用的是 R 而不是 MATLAB。

r matrix exponent diagonal

0
推荐指数
1
解决办法
370
查看次数

在汇总函数中估计列告诉我们什么?

这是我的代码

# create a model from the training data comparing the TargetField to the others
lm.fit <- lm(TargetField ~ .,train) 

# output a summary of the model
summary(lm.fit)
Run Code Online (Sandbox Code Playgroud)

输出是这样的

总结输出

我的问题是,Estimate输出中的列告诉我们什么?

我试着打字

? summary.lm 
Run Code Online (Sandbox Code Playgroud)

在 RStudio 的控制台面板中,但我没有看到提到“估计”。

r

0
推荐指数
1
解决办法
24
查看次数

使用R生成对数正态分布

我想生成一个日志正态分布,以便在我的python代码中使用它,这将改变我点击服务器的速率.任何人都可以指导我生成相同的.

python r

-1
推荐指数
1
解决办法
1200
查看次数

我怎样才能找到GDP的增长率

我有一个数据框,想计算 R 中名义 GDP 的增长率。我知道如何在 Excel 中使用公式 来计算((gdp of this year)-gdp of last year)/( gdp of last year))*100。在R中可以使用什么样的命令来计算它?

year nominal gdp 
2003 7696034.9    
2004 8690254.3    
2005 9424601.9    
2006 10520792.8   
2007 11399472.2   
2008 12256863.6   
2009 12072541.6   
2010 13266857.9   
2011 14527336.9   
2012 15599270.7   
2013 16078959.8   
Run Code Online (Sandbox Code Playgroud)

r

-1
推荐指数
1
解决办法
6774
查看次数

标签 统计

r ×10

diagonal ×1

exponent ×1

ggplot2 ×1

matrix ×1

ordinal ×1

python ×1

radix-sort ×1

sorting ×1