array() 将大写字母放在前面

Question

array() 将大写字母放在前面

我通常使用arrange()from 函数dplyr对数据集进行排序，但它的行为方式我无法理解。我花了一点时间才弄清楚这件事的真相。我已经修复了我的代码并曾经order()做过同样的事情，但现在我很好奇。我已经arrange()不假思索地使用了很多年了，我想知道为什么这似乎是默认行为。当涉及大写字母时，它似乎无法按字母顺序排序 - 例如，它认为大写字母应该排在小写字母之前，即使后者在字母表中位于小写字母之前。我错过了什么吗？

这并不总是一个问题，但当我在tapply()安排 via 后立即使用时，它确实成为了一个问题，假设数据将以与运行时排序arrange()相同的方式排序。这是将“苏联”放在“乌干达”和“乌克兰”之前tapply()的示例，而（我认为正确！）将其放在最后。arrange()order()

library(dplyr)
countries<-c("USSR","Uganda","Ukraine")
tmp<-data.frame(countries,stringsAsFactors=F)
tmp %>% arrange(countries) #orders it one way
tmp[order(tmp$countries),] #orders it another way
sort(tmp$countries) #sort agrees with order

Run Code Online (Sandbox Code Playgroud)

我环顾四周，看看其他人是否也遇到过同样的问题，但什么也没看到。如果之前已经讨论过这个问题，请原谅我。

Answer 1

ati*_*too 3

是的，@MrFlick 的评论是正确的。如果我做

Sys.setlocale("LC_COLLATE","C")

Run Code Online (Sandbox Code Playgroud)

然后

tmp[order(tmp$countries),]

Run Code Online (Sandbox Code Playgroud)

匹配结果arrange()

归档时间：	10 年，5 月前
查看次数：	1355 次
最近记录：	2 年，1 月前