小编Mec*_*MK1的帖子

按 unicode 值对行进行排序

我正在尝试按其 Unicode 值对文本文件进行逐行排序。据我所知,这意味着首先是数字,然后是字母,然后是 CJK 表意文字。然而,sort(with LC_ALL=C) 在这个任务上失败了。这是我的清单的摘录:

[#??????????]
[???????]
[??]
...
[?????????????]
[?????????????]
[10th Avenue Cafe]
[2nd Flush]
...
[Alstroemeria Records & Cradle]
[ALTERNATIVE]
[???????? - Altneuland]
[Amateras Records]
[???????Ammy's]
[anagram]
[Analyze]
...
[Z.S.G TRAXXX]
[? music]
[?iselied]
[?????????]
[???]
Run Code Online (Sandbox Code Playgroud)

似乎sort忽略(至少有时)它无法读取的字符,因为Altneuland确实会在Alternative和之间Amateras Records。使用有人建议msort(有选项,但它也失败了-u c-u d-u n分别)。

首先,为什么它表现得如此出乎意料?其次,我该如何解决这个问题?

添加:// 我在树莓派上使用 Raspbian (B)

sort unicode

8
推荐指数
1
解决办法
7297
查看次数

标签 统计

sort ×1

unicode ×1