这是我正在排序的问题的屏幕截图:
我想要的目标是将所有相等的字符串放在连续的行上.它适用于我正在排序的列表的99%,但有一些故障,如屏幕截图中的那些.
因此所有的yahoo.coms应该是彼此相邻的,然后是所有Yahoo.com,然后是YAHOO.coms yahoo.cmos yhoo.c等等(错别字甚至得到他们自己的一组行)
不完全确定如何处理这种排序,但我当然正在尝试.
我将未分类的所有域打印到文件中,然后使用vanilla对其进行排序 sort filename
会喜欢一些建议/意见.
gee*_*aur 14
您可能需要覆盖区域设置; 大多数Linux系统默认使用UTF8语言环境,它既指定了与案例无关的排序,又忽略了标点符号.
LANG=C sort filename
Run Code Online (Sandbox Code Playgroud)