小编run*_*rds的帖子

如何解决r中的未知变量?

如何在R中设置两个等于彼此的方程式来求解?

例如:

xlog(x)=8273
Run Code Online (Sandbox Code Playgroud)

找到X?

statistics r

2
推荐指数
2
解决办法
1万
查看次数

将数值转换为 r 中的 yyyymm 日期

我正在尝试隐藏以下日期格式。我在 lubridate 包和 strfttime 函数中使用 parse_date_time 时遇到了麻烦,因为它要么将整个列转换为同一日期,要么因为它一直返回日期值。我不想在我的解决方案中看到任何日期。

 mydata=data.frame(dates=c(200102,200102,200111,200202),desired=c('2001-02','2001-02', '2001-11','2002-02'))
Run Code Online (Sandbox Code Playgroud)

我只想在我的专栏中返回 YYYY-mm 格式。我在做这件事时遇到了麻烦。我试过使用

r date

2
推荐指数
1
解决办法
3026
查看次数

选择日期字段

我有一个各种类型的数据框(数字,整数,日期,字符).

我想将其子集化为格式为"Date"的列.我该怎么做呢?

mtcars$dates = '2015-05-05'
mtcars$dates = as.Date(mtcars$dates)

#filter just gives me:     newdf = mtcars$dates
Run Code Online (Sandbox Code Playgroud)

attributes r subset filter

2
推荐指数
3
解决办法
165
查看次数

如何在pandas/python中使用空值进行条件语句

如何在熊猫中进行条件替换?

df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]])
Run Code Online (Sandbox Code Playgroud)

在R中 - 认为这段代码很容易理解:

library(dplyr)
df = df %>% 
mutate(   #   mutate means create new column for non-r people
my_new_column = ifelse( is.na(the_2nd_column)==TRUE & is.na(the_3rd_column)==TRUE, ' abc', 'cuz')
Run Code Online (Sandbox Code Playgroud)

我如何在熊猫中做到这一点 - 可能是语法上的愚蠢问题,但我听说np.where相当于R中的if else ...

df['new_column'] = np.where(np.nan(....help here with a conditional....))
Run Code Online (Sandbox Code Playgroud)

python null if-statement numpy pandas

2
推荐指数
1
解决办法
3025
查看次数

将值向量转换为逗号分隔的向量,并在每个向量周围引用

我想得到结果,以便显示为:

"6", "4", "8"

或者逗号

my_vector = base::unique(mtcars$cyl)
my_vector_quoted =paste(my_vector, sep=" ' ")
Run Code Online (Sandbox Code Playgroud)

现在我如何获得介于两者之间的逗号?我尝试用sep ='重复这个,但这不起作用.

有什么方法吗?

string r paste

1
推荐指数
1
解决办法
3732
查看次数

将可选参数传递给 r 中的函数

如何将可选参数传递给 R 中的函数?

这方面的一个例子是,我可能希望从模型的特定超参数组合中创建一个函数。但是,我不想配置所有超参数,因为在大多数情况下许多超参数都不相关。

有时,我希望能够手动传入一个我想更改的超参数。我经常在函数中看到 ... ,但无法弄清楚这是否与这种情况有关或至少如何使用它们。

library(gbm)
library(ggplot)
data('diamonds', package = 'ggplot2')

 example_function = function(n.trees = 5){
      model=gbm(formula = price~ ., n.trees = 5, data = diamonds)
}  


# example of me passing in an unplanned argument
example_function(n.trees = 5, shrinkage = 0.02)
Run Code Online (Sandbox Code Playgroud)

这有可能以智能方式处理吗?

arguments r function

1
推荐指数
1
解决办法
1046
查看次数

如何扩展ggplot y轴限制以包括最大值

通常在图中,Y轴值标签会在要绘制的最大值以下被切掉。

For example:

library(tidyverse)
mtcars %>% ggplot(aes(x=mpg, y = hp))+geom_point()
Run Code Online (Sandbox Code Playgroud)

我知道scale_y_continous-但我想不出一种聪明的方法来做到这一点。也许我只是在想什么。我不想弄乱自动生成的“智能”中断。

我可能会尝试手动进行此操作...

  mtcars  %>% ggplot(aes(x=mpg, y=hp, color=as.factor(carb)))+geom_point()  + scale_y_continuous(limits = c(0,375))
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

但这由于“智能中断”而无法像我上面提到的那样起作用。无论如何,我是否需要将默认的中断间隔延长到另外1个,因此在这种情况下将是400个?当然,我希望它对于我正在使用的任何数据集都具有灵活性。

r ggplot2

1
推荐指数
1
解决办法
726
查看次数

r 的累积百分比回报

我有一个数据框,其中包含一段时间内的各种股票收益。回报以收益或损失百分比表示(0.02 表示 2% 回报或前期值的 102%)。

我正在寻找一个函数或方法来累积显示每个时期的回报(以百分比表示)。例如,这将显示前 3 个周期的 stock1 的累积/复合收益为 0.02、0.0404、0.09242.... (1.02*1.02*1.05)。

   mydf = data.frame(period = c('a','b','c','d','e','f'), stock1=c(.02, .02, .05,-.05,-.05,0), stock2=c(0, .01,0,.03,.05,.01))
   mydf
   #help mydf$stk1_percentgain =
Run Code Online (Sandbox Code Playgroud)

finance r

0
推荐指数
1
解决办法
2808
查看次数

通过R通过最大日期SQL按组选择观察

我的数据具有类似如下所示的结构。这是用R代码编写的,但是如果您只编写没有R东西的查询,那也很好。

我有多个小组,每个观察都有日期。我想从每个组中选择与该特定组的最大日期(最近日期)相对应的一行。没有重复的日期。

Df = data.frame(dates=c('2012-01-25','2012-08-20','2013-07-31','2013-05-30'), 
                group=c('a','a','b','b'), 
                value=c(1,2,3,4))

Library(sqldf)
(Desiredresults = Df[2:3,])
# 1 2012-08-20     a     2
# 2 2013-07-31     b     3
Run Code Online (Sandbox Code Playgroud)

sql group-by r

-2
推荐指数
1
解决办法
1186
查看次数