有没有办法做一些类似于cut()在dplyr表中装箱数值的函数?我正在研究一个大的postgres表,并且当前可以在一开始就在sql中编写case语句,或者输出非聚合数据并应用cut().两者都有明显的缺点...案例陈述不是特别优雅,并且通过collect()根本没有效率地提取大量记录.
在R中重新编码变量似乎是我最头痛的问题.您使用哪些功能,包,流程来确保最佳结果?
我发现在互联网上很少有一些有用的例子可以为重新编码提供一个通用的解决方案,我很想知道你们和gals正在使用什么.
注意:这可能是社区维基主题.