我有一个导入的数据框,其列名具有各种标点,包括括号,例如BILLNG.STATUS.(COMPLETED./.INCOMPLTE).
我试图用group_by从dplyr做一些总结,像
df <- df %>% group_by(ORDER.NO, BILLNG.STATUS.(COMPLETED./.INCOMPLTE))
Run Code Online (Sandbox Code Playgroud)
这带来了错误 Error in mutate_impl(.data, dots) :
could not find function "BILLNG.STATUS."
如果没有更改列名,有没有办法直接处理这些列名group_by?
eip*_*i10 13
如果你在反引号中包含"非法"列名,我想你可以做到这一点.例如,假设我从这个数据框开始(称为df):
BILLING.STATUS.(COMPLETED./.INCOMPLETE) ORDER.VALUE.(USD)
1 A 0.01544196
2 A 0.95522706
3 B 1.13479303
4 B 1.22848285
Run Code Online (Sandbox Code Playgroud)
然后我可以这样总结一下:
dat %>% group_by(`BILLING.STATUS.(COMPLETED./.INCOMPLETE)`) %>%
summarise(count=n(),
mean = mean(`ORDER.VALUE.(USD)`))
Run Code Online (Sandbox Code Playgroud)
赠送:
BILLING.STATUS.(COMPLETED./.INCOMPLETE) count mean
1 A 2 0.4853345
2 B 2 1.1816379
Run Code Online (Sandbox Code Playgroud)
反引号也可以用来引用或创建带有空格的变量名称.你可以dplyr在SO上找到一些与反问题相关的问题,并且在帮助中也有一些关于反引号的讨论Quotes.
| 归档时间: |
|
| 查看次数: |
3951 次 |
| 最近记录: |