小编Sta*_*ent的帖子

熊猫时间戳系列字符串?

我是python的新手(来自R),我试图了解如何将pandas数据帧中的时间戳序列(在我的情况下称为df['timestamp'])转换为R中的字符串向量。 ?怎么做?

我尝试过df['timestamp'].apply('str'),但这似乎只是将整个列df['timestamp']放入一个长字符串中。我想将每个元素转换为字符串并保留结构,以使其仍然是向量(或者也许称为数组?)

python arrays vector pandas

10
推荐指数
3
解决办法
3万
查看次数

使用 R dplyr mutate 创建多个列,而不是使用循环?

我正在尝试使用 R 的dplyr包为数据集中的每年创建多个新列,即与每年季度末数字(三月、六月、九月、十二月)对应的列的总和。我能够弄清楚如何“有效”地做到这一点的唯一方法是使用 for 循环。但有些事情告诉我,有一种替代的、更有效的或更好的方法来解决这个问题(也许我应该在这里使用地图函数,但我只是不确定?)。这是一个可以复制的玩具示例:

\n
library(tidyverse)\nlibrary(glue)\n\n# Create a toy example and print the resulting tibble\nset.seed(100) # make results reproducible by setting seed\nvars <- c("AgeGroup", paste0(month.abb[seq(3, 12, 3)], "_", rep(15:17, each = 4)))\n\n(df <- cbind(LETTERS[1:5], matrix(rpois(n = (length(vars) - 1) * 5, 30), nrow = 5)) %>% \n    data.frame() %>%\n    setNames(vars) %>% \n    tibble() %>% \n    mutate(across(-1, as.integer))\n  )\n
Run Code Online (Sandbox Code Playgroud)\n

它将示例/可重现的数据集设置为:

\n
# A tibble: 5 \xc3\x97 13\n  AgeGroup Mar_15 Jun_15 Sep_15 Dec_15 Mar_16 Jun_16 Sep_16 Dec_16 Mar_17 …
Run Code Online (Sandbox Code Playgroud)

r calculated-columns rowsum dplyr mutate

1
推荐指数
1
解决办法
172
查看次数

标签 统计

arrays ×1

calculated-columns ×1

dplyr ×1

mutate ×1

pandas ×1

python ×1

r ×1

rowsum ×1

vector ×1