我有一个导入 R 的评论列表。以下是一些评论如何导入的示例 -
9. This is some string number 1
9This is some string number 2
9 This is some string number 3
9-This is some string number 4
67-68 This is some string number 5
Run Code Online (Sandbox Code Playgroud)
注意我将评论保存到一个名为 some_str
我的目标是在行首打印出没有数字的每一行。像这样 -
This is some string number 1
This is some string number 2
This is some string number 3
This is some string number 4
This is some string number 5
Run Code Online (Sandbox Code Playgroud)
我使用下面的代码来处理9. This is some string number 1
上面的第一行 …
我在 R 中写了一个这样的函数:
foo <- function(a, b = 1) {
...
}
Run Code Online (Sandbox Code Playgroud)
但现在我想更改默认参数 b,例如:
foo(b = 2)
Run Code Online (Sandbox Code Playgroud)
原则上这是 a 的函数。但 R 不允许这样做,这给我带来了一个错误。
我该如何修复它?
我有一个如下所示的数据框列:
loco
2018-11-30
2018-10-25
2015-12-10
2020-1-10
2013-2-15
1999-8-17
Run Code Online (Sandbox Code Playgroud)
我只想找到最大日期和最小日期。这是我迄今为止尝试过的
print(min(as.character(as.numeric(table3$loco)), na.rm=TRUE))
max(table3$loco, na.rm=true)
max(as.Date('2016-1-1'))
floor(time(table3$loco)[which.min(table3$loco)])
loco %>%
mutate(earliest_date = pmin(table3$loco))
table3$loco[order(format(as.date(table3$loco), '%m%d%y'))
[length(dates)]]
min(as.Date(table3$loco))
lapply(table3$loco, max)
Run Code Online (Sandbox Code Playgroud)
样本数据:
"2018-11-30 07:21:32.605", "2018-11-30 07:21:42.551", "2018-11-30
07:21:42.702",
"2018-11-30 07:21:42.827", "2018-11-30 07:35:02.107", "2018-11-30
07:35:05.309",
"2018-11-30 07:37:14.794", "2018-11-30 07:37:36.597", "2018-11-30
07:38:51.712",
"2018-11-30 07:41:16.125", "2018-11-30 07:41:28.419", "2018-11-30
07:41:57.649",
"2018-11-30 07:41:57.931", "2018-11-30 07:47:36.917", "2018-11-30
07:47:45.759",
"2018-11-30 07:47:55.729", "2018-11-30 07:49:43.611", "2018-11-30
07:49:46.486",
"2018-11-30 07:49:55.789", "2018-11-30 07:52:29.743", "2018-11-30
07:53:06.841",
"2018-11-30 07:53:47.983", "2018-11-30 07:53:57.526", "2018-11-30
07:54:19.956",
"2018-11-30 07:54:28.345", "2018-11-30 07:54:38.075", "2018-11-30 …
Run Code Online (Sandbox Code Playgroud) 我有一个具有开始日期和结束日期的数据集。缺少某些结束日期。正如您在下面看到的,我尝试了三种不同的方法,但都没有奏效。
startDay <- as.Date(c("2015-01-01","2015-03-01","2016-07-15","2016-08-02"), "%Y-%m-%d")
endDay <- as.Date(c("2018-01-01",NA,"2018-03-05",NA), "%Y-%m-%d")
id <- 1:4
dt <- data.frame(id, startDay, endDay)
dt
str(dt)
dt$caseDay <- as.Date("2018-07-20", "%Y-%m-%d")
str(dt)
dt
Run Code Online (Sandbox Code Playgroud)
这将我的变量的类从日期更改为数字:
dt$EndDay1 <-
ifelse(is.na(dt$endDay), dt$caseDay, dt$endDay)
str(dt)
dt
Run Code Online (Sandbox Code Playgroud)
这会生成一条错误消息。
dt$EndDay2 <-as.Date(
ifelse(is.na(dt$endDay), dt$caseDay, dt$endDay), "%Y-%m-%d")
str(dt)
dt
Run Code Online (Sandbox Code Playgroud)
如果我对相关帖子的研究/理解是正确的,下面的第 3 版应该可以解决问题。但是,这将所有内容都转换为缺失值。
dt$EndDay3 <-as.Date(as.character(
ifelse(is.na(dt$endDay), dt$caseDay, dt$endDay)), "%Y-%m-%d")
str(dt)
dt
Run Code Online (Sandbox Code Playgroud)
关于如何解决这个问题的任何建议?谢谢
roll = df.rolling(window=3, center=False).quantile(0.5)
我正在通过[DF,DF,72,73,74,71,75,72,77,75,72,79,73,72]
我得到最小74
最大77
我在Python中做的这段代码
我想在R中做到这一点
R like中有很多库caTools
,还有更多
runquantile(data[,2],3,probs = 0.5)
(我尝试过)
但没人能正常工作
请帮帮我
编辑。
根据OP注释,以下是数据和代码。这对我有用。
DF <- c(72, 73, 74, 71, 75, 72, 77, 75, 72, 79, 73, 72)
runquantile(DF, 3, probs = 0.5)
Run Code Online (Sandbox Code Playgroud) 我是 R 的新用户,希望你能帮助我。
\n\nsetwd("C:/Users/USER/Desktop/Jorge")\nagua <- read_excel("agua.xlsx")\npbi <- read_excel("PBIagro.xlsx")\nstr(agua); \nnames(agua)[2] <- "Variaci\xc3\xb3n";\nagua[,1] <- as.Date(agua$Trimestre)\n\nlagpbi <- lag(pbi$PBIAgropecuario, k=1)\npbi[,3]<- lagpbi; pbi <- pbi[-c(1),]; \nnames(pbi)[3] <- "PBIlag"\n\ngrowth <- ((pbi$PBIAgropecuario-pbi$PBIlag)/pbi$PBIlag)*100\nAnual_growth <- data.frame(growth); Anual_growth[,2] <- pbi$A\xc3\xb1o; names(Anual_growth)[2] <- "A\xc3\xb1o"\n\n\n# Plot\nAgro <- ggplot(Anual_growth, aes(x=A\xc3\xb1o, y=growth)) +\n geom_line(color="steelblue") + \n geom_point() +\n geom_text(aes(label = round(Anual_growth$growth, 1)),\n vjust = "inward", hjust = "inward", size=2.5, show.legend = FALSE) +\n xlab("") +\n theme_ipsum() +\n theme(axis.text.x=element_text(angle=60, hjust=1)) +\n ylim(-9.9,13.4) + \n theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),\n axis.line.x = element_blank(), plot.margin …
Run Code Online (Sandbox Code Playgroud) 我有一个population
看起来像这样的 df (未列出所有列和行):
Region X1975 X1976 X1977 ... X2008
National Total 942420 93717 94974 132802
Bejing 844.4 845.10 860.50 1695
Tianjin 702.86 706.50 712.87 968.87
Hebei 4913 4943 4998 6989
...
sum 91979 93275 94540 132058
difference 440 441 433 743
Run Code Online (Sandbox Code Playgroud)
这些列从 到X1975
,X2008
并且中间有每年。我需要的是population
看起来像这样:
Region Year Population
Bejing 1975 844.4
Bejing 1976 845.10
Bejing 1977 860.50
Bejing 1978 871.50
Run Code Online (Sandbox Code Playgroud)
每个地区的数据(包括全国总计、总和和差异)以及 2000 年及之前的数据不包括在内。想使用pivot_longer 来做到这一点,但我不知道如何做。这是我到目前为止所得到的,但不起作用。
population %>%
tidyr::pivot_longer( cols = starts_with( 'X' ), names_to = …
Run Code Online (Sandbox Code Playgroud) 我对 R 可视化不太有经验。也许有人可以提供一些关于使用 R 创建类似于下图的绘图的提示(使用哪些函数和包)。图像中是一个伪示例,使用实际数据在图中会更像这样的“条”。这里我们有一个名为“Ratio”的列,其值为 ABCD,另一列名为“Variants”,其值为 x、y、z、q 等。