我希望对从 TLD 开始并向上工作的域名列表(网络过滤器白名单)进行排序。我正在寻找任何可以轻松完成此操作的 *nix 或 windows 工具,尽管脚本也可以。
所以如果是给你的清单
www.activityvillage.co.uk
ajax.googleapis.com
akhet.co.uk
alchemy.l8r.pl
au.af.mil
bbc.co.uk
bensguide.gpo.gov
chrome.angrybirds.com
cms.hss.gov
crl.godaddy.com
digitalhistory.uh.edu
digital.library.okstate.edu
digital.olivesoftware.com
Run Code Online (Sandbox Code Playgroud)
这就是我想要的输出。
chrome.angrybirds.com
crl.godaddy.com
ajax.googleapis.com
digital.olivesoftware.com
digital.library.okstate.edu
digitalhistory.uh.edu
bensguide.gpo.gov
cms.hss.gov
au.af.mil
alchemy.l8r.pl
www.activityvillage.co.uk
akhet.co.uk
bbc.co.uk
Run Code Online (Sandbox Code Playgroud)
以防万一你想知道为什么,Squidguard,有一个错误/设计缺陷。如果www.example.com和example.com都包含在列表中,则该example.com条目将被忽略并且您只能访问来自 的内容www.example.com。我有几个需要清理的大列表,因为有人没有先查看就添加了条目。
我怎样才能对结果进行排序find?我想按创建日期按 asc 排序?
find /docs -type f | sort
Run Code Online (Sandbox Code Playgroud)
按文件名而不是创建日期排序。谢谢。
有一个交互键“M”可以按内存排序,好像是在常驻内存上排序。有没有办法对虚拟内存进行排序?我碰巧在 Redhat Linux 上工作,但问题并非特定于该发行版。
所以我有一个非常大的文件(大约 10GB)并且需要对它进行排序,就像使用“排序”实用程序一样,但更有效。
问题是,我没有内存、CPU 能力、时间,也没有可用的交换空间来支持整个排序。
好消息是文件已经部分排序(我可以说每一行与其最终位置的距离都小于某个值 N)。这让我想起了经典的计算机级示例,为此目的使用堆大小为 N 的堆排序。
问题:是否有一些 Unix 工具已经有效地做到了这一点,还是我需要自己编写一个代码?
谢谢-mk
我正在寻找高性能的 /bin/sort 替代品。我知道有 pbzip2 可以使用多核,但是 /bin/sort 有类似的产品吗?
我找到了 distsort.sh,但我想要一些不那么 IO 密集的东西。我正在寻找排序哦.. 60 演出数据非常频繁。
是否有用于对包含固定长度二进制记录的大文件进行排序的 Unix 实用程序?
换句话说,我正在寻找类似于 sort(1) 的东西,但是对于具有固定长度记录的二进制文件。
我可以将文件转换为文本,然后使用 sort(1) 进行排序,然后再转换回二进制表示,但我正在寻找更节省时间和空间的方法。
我已经在 SUSE 10 服务器、内核 2.6.16.60、ext3 文件系统上尝试过这个 shell 脚本
脚本有这样的问题:
cat file | awk '{print $1" "$2" "$3}' | sort -n > result
Run Code Online (Sandbox Code Playgroud)
该文件的大小约为 3.2G,我收到这样的错误消息:超出文件大小限制
在这个 shell 中, ulimit -f 是无限的
在我把脚本改成这个之后
cat file | awk '{print $1" "$2" "$3}' >tmp
sort -n tmp > result
Run Code Online (Sandbox Code Playgroud)
问题消失了。
不知道为什么,谁能帮我解释一下?
如何一次性输出所有按大小排序的文件/目录,包括隐藏的
\n(名称以点开头的文件/目录)?
目录的大小是指目录及其所有子目录树中所有文件大小的总和。
\n与如何按大小对输出进行排序的du -h区别?是我请求的输出包括当前目录 \xe2\x80\x93 中的所有文件和目录,无论是否隐藏。
我正在尝试获取已安装内核包的最新版本。主要的困难是,在我的情况下,版本可以安装在一个错误的顺序,所以我不能简单地用--last从参数rpm。
我想使用包含参数的coreutils'sort命令 (coreutils-8.4-31.el6_5.1) --version-sort,但这没有按预期返回:
$ rpm -q 'kernel' |sort --version-sort
kernel-2.6.32-431.5.1.el6.x86_64
kernel-2.6.32-431.11.2.el6.x86_64
kernel-2.6.32-431.17.1.el6.x86_64
kernel-2.6.32-431.el6.x86_64
rpm -q 'kernel' --last
kernel-2.6.32-431.17.1.el6.x86_64 mar. 13 mai 2014 09:48:44 CEST
kernel-2.6.32-431.11.2.el6.x86_64 jeu. 24 avril 2014 11:15:25 CEST
kernel-2.6.32-431.5.1.el6.x86_64 mer. 12 mars 2014 15:52:23 CET
kernel-2.6.32-431.el6.x86_64 ven. 29 nov. 2013 17:48:19 CET
Run Code Online (Sandbox Code Playgroud)
如您所见,修订版 431.e16(最旧的)被排序为最新的。电话rpm -qi确认:
Release : 431.17.1.el6 Build Date: jeu. 08 mai 2014 02:48:49 CEST
Release : 431.el6 Build Date: ven. 22 nov. 2013 …Run Code Online (Sandbox Code Playgroud) 我登录sftp:
sftp user@server
Run Code Online (Sandbox Code Playgroud)
然后我运行:
ls -lt
Run Code Online (Sandbox Code Playgroud)
我希望文件按日期排序。
sftp> ls -lt *.csv
-rw------- 0 76547986 200 5073032 Mar 14 08:42 file1.csv
-rw------- 0 76547986 200 5073032 Mar 15 08:41 file2.csv
-rw------- 0 76547986 200 5073032 Mar 16 08:41 file3.csv
-rw------- 0 76547986 200 5072802 Mar 17 08:42 file4.csv
-rw------- 0 76547986 200 1117736 Sep 30 14:44 file5.csv
-rw------- 0 76547986 200 1120419 Oct 2 08:45 file6.csv
-rw------- 0 76547986 200 1119763 Oct 1 08:43 file7.csv
-rw------- 0 76547986 200 5073258 Mar …Run Code Online (Sandbox Code Playgroud) 从文件中删除重复 IP 的最佳方法是什么
我使用命令:
sort file | uniq
Run Code Online (Sandbox Code Playgroud)
但我不确定这是否是最好的方法,也许我错过了什么?
备注:我的文件包含两个字段
文件示例
172.17.200.1 3.3.3.3
172.17.200.1 3.3.3.3
255.255.255.0 255.255.255.111
255.255.255.0 255.255.255.111
172.17.200.2 3.3.3.4
255.255.255.0 255.255.255.111
172.17.200.3 3.3.3.5
255.255.255.0 255.255.255.111
172.17.200.4 3.3.3.7
255.255.255.0 255.255.255.111
172.17.200.5 3.3.3.8
255.255.255.0 255.255.255.111
255.255.255.0 255.255.255.111
172.17.200.1 3.3.3.3
255.255.255.0 255.255.255.111
172.17.200.2 3.3.3.4
255.255.255.0 255.255.255.111
172.17.200.3 3.3.3.5
255.255.255.0 255.255.255.111
172.17.200.4 3.3.3.7
255.255.255.0 255.255.255.111
172.17.200.5 3.3.3.8
255.255.255.0 255.255.255.111
255.255.255.0 255.255.255.111
Run Code Online (Sandbox Code Playgroud) 因此,我在对 IPv4 地址进行排序时遇到了困境,并且不知道某些晦涩的网络文档中是否有固定规则。我是否只对原始地址进行直接排序(例如将 IP 地址转换为 32 位数字然后排序),我是否通过一些数学公式将 CIDR 因素考虑在内,我是否仅通过 CIDR 进行排序(好像我' m 比较网络大小而不是直接比较地址)?
即,正常数学,我们会做一些事情-1 < 0 < 1来表示优先顺序。鉴于说,10.1.0.0/16,172.16.0.0/12,192.168.1.0/24和192.168.1.42,优先顺序是什么?