小编Rui*_*das的帖子

如何匹配/删除 R 中注释开头的数字

我有一个导入 R 的评论列表。以下是一些评论如何导入的示例 -

9. This is some string number 1
9This is some string number 2
9 This is some string number 3
9-This is some string number 4
67-68 This is some string number 5

Run Code Online (Sandbox Code Playgroud)

注意我将评论保存到一个名为 some_str

我的目标是在行首打印出没有数字的每一行。像这样 -

This is some string number 1
This is some string number 2
This is some string number 3
This is some string number 4
This is some string number 5

Run Code Online (Sandbox Code Playgroud)

我使用下面的代码来处理9. This is some string number 1上面的第一行 …

regex r stringr

The*_*kie

2020 12-01

1
推荐指数

1
解决办法

104
查看次数

R 为函数的默认参数设置新值

我在 R 中写了一个这样的函数：

foo <- function(a, b = 1) {
    ...
}

Run Code Online (Sandbox Code Playgroud)

但现在我想更改默认参数 b，例如：

foo(b = 2)

Run Code Online (Sandbox Code Playgroud)

原则上这是 a 的函数。但 R 不允许这样做，这给我带来了一个错误。

我该如何修复它？

r function

wyh*_*127

2018 10-15

0
推荐指数

1
解决办法

1984
查看次数

R：数据框中日期列的最小值和最大值

我有一个如下所示的数据框列：

loco 
2018-11-30
2018-10-25
2015-12-10
2020-1-10
2013-2-15
1999-8-17

Run Code Online (Sandbox Code Playgroud)

我只想找到最大日期和最小日期。这是我迄今为止尝试过的

print(min(as.character(as.numeric(table3$loco)), na.rm=TRUE))

max(table3$loco, na.rm=true)

max(as.Date('2016-1-1'))

floor(time(table3$loco)[which.min(table3$loco)])

loco %>%
  mutate(earliest_date = pmin(table3$loco))

table3$loco[order(format(as.date(table3$loco), '%m%d%y')) 
[length(dates)]]

min(as.Date(table3$loco))

lapply(table3$loco, max)

Run Code Online (Sandbox Code Playgroud)

样本数据：

   "2018-11-30 07:21:32.605", "2018-11-30 07:21:42.551", "2018-11-30 
    07:21:42.702", 
    "2018-11-30 07:21:42.827", "2018-11-30 07:35:02.107", "2018-11-30 
    07:35:05.309", 
    "2018-11-30 07:37:14.794", "2018-11-30 07:37:36.597", "2018-11-30 
    07:38:51.712", 
    "2018-11-30 07:41:16.125", "2018-11-30 07:41:28.419", "2018-11-30 
    07:41:57.649", 
    "2018-11-30 07:41:57.931", "2018-11-30 07:47:36.917", "2018-11-30 
    07:47:45.759", 
    "2018-11-30 07:47:55.729", "2018-11-30 07:49:43.611", "2018-11-30 
    07:49:46.486", 
    "2018-11-30 07:49:55.789", "2018-11-30 07:52:29.743", "2018-11-30 
    07:53:06.841", 
    "2018-11-30 07:53:47.983", "2018-11-30 07:53:57.526", "2018-11-30 
    07:54:19.956", 
    "2018-11-30 07:54:28.345", "2018-11-30 07:54:38.075", "2018-11-30 …

Run Code Online (Sandbox Code Playgroud)

sha*_*xia

2018 12-01

0
推荐指数

2
解决办法

2万
查看次数

如何用特定日期替换丢失的日期并将格式保留为 R 中的日期

我有一个具有开始日期和结束日期的数据集。缺少某些结束日期。正如您在下面看到的，我尝试了三种不同的方法，但都没有奏效。

startDay <- as.Date(c("2015-01-01","2015-03-01","2016-07-15","2016-08-02"), "%Y-%m-%d")
endDay <- as.Date(c("2018-01-01",NA,"2018-03-05",NA), "%Y-%m-%d")
id <- 1:4
dt <- data.frame(id, startDay, endDay)
dt
str(dt)

dt$caseDay <- as.Date("2018-07-20", "%Y-%m-%d")  
str(dt)
dt

Run Code Online (Sandbox Code Playgroud)

这将我的变量的类从日期更改为数字：

dt$EndDay1 <-
ifelse(is.na(dt$endDay), dt$caseDay, dt$endDay)
str(dt)
dt

Run Code Online (Sandbox Code Playgroud)

这会生成一条错误消息。

dt$EndDay2 <-as.Date(
ifelse(is.na(dt$endDay), dt$caseDay, dt$endDay), "%Y-%m-%d")
str(dt)
dt

Run Code Online (Sandbox Code Playgroud)

如果我对相关帖子的研究/理解是正确的，下面的第 3 版应该可以解决问题。但是，这将所有内容都转换为缺失值。

dt$EndDay3 <-as.Date(as.character(
ifelse(is.na(dt$endDay), dt$caseDay, dt$endDay)), "%Y-%m-%d")
str(dt)
dt

Run Code Online (Sandbox Code Playgroud)

关于如何解决这个问题的任何建议？谢谢

r date as.date

TCS*_*TCS

2018 12-23

0
推荐指数

1
解决办法

1599
查看次数

R语言中具有分位数的滚动均值

roll = df.rolling(window=3, center=False).quantile(0.5)

我正在通过[DF，DF，72,73,74,71,75,72,77,75,72,79,73,72]

我得到最小74最大77

我在Python中做的这段代码

我想在R中做到这一点

R like中有很多库caTools，还有更多

runquantile(data[,2],3,probs = 0.5)（我尝试过）

但没人能正常工作

请帮帮我

编辑。

根据OP注释，以下是数据和代码。这对我有用。

DF <- c(72, 73, 74, 71, 75, 72, 77, 75, 72, 79, 73, 72)
runquantile(DF, 3, probs = 0.5)

Run Code Online (Sandbox Code Playgroud)

python r

jon*_*ony

2019 09-04

0
推荐指数

1
解决办法

72
查看次数

如何正确使用scale_x_date

我是 R 的新用户，希望你能帮助我。

\n\n

setwd("C:/Users/USER/Desktop/Jorge")\nagua <- read_excel("agua.xlsx")\npbi <- read_excel("PBIagro.xlsx")\nstr(agua); \nnames(agua)[2] <- "Variaci\xc3\xb3n";\nagua[,1] <- as.Date(agua$Trimestre)\n\nlagpbi <- lag(pbi$PBIAgropecuario, k=1)\npbi[,3]<- lagpbi; pbi <- pbi[-c(1),]; \nnames(pbi)[3] <- "PBIlag"\n\ngrowth <- ((pbi$PBIAgropecuario-pbi$PBIlag)/pbi$PBIlag)*100\nAnual_growth <- data.frame(growth); Anual_growth[,2] <- pbi$A\xc3\xb1o; names(Anual_growth)[2] <- "A\xc3\xb1o"\n\n\n# Plot\nAgro <- ggplot(Anual_growth, aes(x=A\xc3\xb1o, y=growth)) +\n  geom_line(color="steelblue") + \n  geom_point() +\n  geom_text(aes(label = round(Anual_growth$growth, 1)),\n            vjust = "inward", hjust = "inward", size=2.5, show.legend = FALSE) +\n  xlab("") +\n  theme_ipsum() +\n  theme(axis.text.x=element_text(angle=60, hjust=1)) +\n  ylim(-9.9,13.4) + \n  theme(panel.grid.major = element_blank(), panel.grid.minor = element_blank(),\n        axis.line.x = element_blank(), plot.margin …

Run Code Online (Sandbox Code Playgroud)

r ggplot2

作者

2019 12-22

0
推荐指数

1
解决办法

5606
查看次数

在R中使用pivot_longer将多列变成一列

我有一个population看起来像这样的 df （未列出所有列和行）：

Region            X1975     X1976     X1977     ...     X2008
National Total    942420    93717     94974             132802           
Bejing            844.4     845.10    860.50            1695         
Tianjin           702.86    706.50    712.87            968.87
Hebei             4913      4943      4998              6989
...
sum               91979     93275     94540             132058
difference        440       441       433               743

Run Code Online (Sandbox Code Playgroud)

这些列从到X1975，X2008并且中间有每年。我需要的是population看起来像这样：

Region       Year        Population
Bejing       1975        844.4
Bejing       1976        845.10
Bejing       1977        860.50
Bejing       1978        871.50

Run Code Online (Sandbox Code Playgroud)

每个地区的数据（包括全国总计、总和和差异）以及 2000 年及之前的数据不包括在内。想使用pivot_longer 来做到这一点，但我不知道如何做。这是我到目前为止所得到的，但不起作用。

population %>%
  tidyr::pivot_longer( cols = starts_with( 'X' ), names_to = …

Run Code Online (Sandbox Code Playgroud)

r dplyr tidyr

Mar*_*ber

2020 07-28

0
推荐指数

1
解决办法

924
查看次数

在 R 中创建非标准图

我对 R 可视化不太有经验。也许有人可以提供一些关于使用 R 创建类似于下图的绘图的提示（使用哪些函数和包）。图像中是一个伪示例，使用实际数据在图中会更像这样的“条”。这里我们有一个名为“Ratio”的列，其值为 ABCD，另一列名为“Variants”，其值为 x、y、z、q 等。

plot visualization r

Bam*_*eil

2023 06-14

0
推荐指数

1
解决办法

62
查看次数

标签统计

r ×8

as.date ×1

date ×1

dplyr ×1

function ×1

ggplot2 ×1

plot ×1

python ×1

regex ×1

stringr ×1

tidyr ×1

visualization ×1

标签 统计

小编Rui_das的帖子

标签统计