带有括号或dplyr group_by的其他标点符号的列名

Question

带有括号或dplyr group_by的其他标点符号的列名

我有一个导入的数据框,其列名具有各种标点,包括括号,例如BILLNG.STATUS.(COMPLETED./.INCOMPLTE).

我试图用group_by从dplyr做一些总结,像

df <- df %>% group_by(ORDER.NO, BILLNG.STATUS.(COMPLETED./.INCOMPLTE))

Run Code Online (Sandbox Code Playgroud)

这带来了错误 Error in mutate_impl(.data, dots) : could not find function "BILLNG.STATUS."

如果没有更改列名,有没有办法直接处理这些列名group_by？

Answer 1

eip*_*i10 13

如果你在反引号中包含"非法"列名,我想你可以做到这一点.例如,假设我从这个数据框开始(称为df):

  BILLING.STATUS.(COMPLETED./.INCOMPLETE) ORDER.VALUE.(USD)
1                                       A        0.01544196
2                                       A        0.95522706
3                                       B        1.13479303
4                                       B        1.22848285

Run Code Online (Sandbox Code Playgroud)

然后我可以这样总结一下:

dat %>% group_by(`BILLING.STATUS.(COMPLETED./.INCOMPLETE)`) %>% 
  summarise(count=n(),
            mean = mean(`ORDER.VALUE.(USD)`))

Run Code Online (Sandbox Code Playgroud)

赠送:

  BILLING.STATUS.(COMPLETED./.INCOMPLETE) count      mean
1                                       A     2 0.4853345
2                                       B     2 1.1816379

Run Code Online (Sandbox Code Playgroud)

反引号也可以用来引用或创建带有空格的变量名称.你可以dplyr在SO上找到一些与反问题相关的问题,并且在帮助中也有一些关于反引号的讨论Quotes.

归档时间：	10 年，9 月前
查看次数：	3951 次
最近记录：	10 年，9 月前