来自data.table手册:
data.table
事实上,我们非常喜欢它,data.table包含使用R的内部全局字符串缓存的字符向量的计数排序算法.对于包含许多重复项的字符向量(例如,键列中的分组数据),这尤其快.这意味着角色通常更倾向于因素.仍然完全支持因素,特别是有序因子(其中水平不按字母顺序排列).
是不是factor应该更容易做到这整数counting sort比character?
factor
counting sort
character
r data.table
data.table ×1
r ×1