相关疑难解决方法(0)

“sort -u”和“sort | uniq”有什么区别?

我在任何地方看到有人需要获得一个排序的、唯一的列表,他们总是通过管道传输到sort | uniq. 我从未见过有人使用的例子sort -u。为什么不?有什么区别,为什么使用 uniq 比使用 unique 标志进行排序更好?

bash sort uniq

149
推荐指数
5
解决办法
22万
查看次数

为什么 uniq 忽略 Unicode 和带有单个字母的行?

我试图将美国和英国词典合并成一个大词典,并且我试图从超集中删除所有重复项,但似乎 uniq 没有输出诸如“épée”或单个字母之类的词。

这是我尝试使用的:

LC_COLLATE=en_US.UTF-8 cat american-english british-english |sort|uniq -u > unique_sorted_combined_dict
Run Code Online (Sandbox Code Playgroud)

如果我只是这样做:

LC_COLLATE=en_US.UTF-8 cat american-english british-english |sort > sorted_combined_dict
Run Code Online (Sandbox Code Playgroud)

“épée”和其他这样的词确实出现了,以及单个字母。

有什么我在这里想念的uniq吗?

我应该注意到我在 Ubuntu 12.10 上使用来自 GNU coreutils 的 uniq,如果这有什么不同的话。

text-processing sort unicode locale uniq

6
推荐指数
1
解决办法
1536
查看次数

标签 统计

sort ×2

uniq ×2

bash ×1

locale ×1

text-processing ×1

unicode ×1