Inq*_*Kea 18 shell-script text-processing cat
最旧的文件在底部?
另外,如果我这样做,是否也可以去除每个 HTML 文件中包含的冗余标题?我看到自己将很多 HTML 文件连接起来,最好稍微减少最终文件的文件大小。
ang*_*gus 36
连接您使用的文件
cat file1 file2 file3 ...
Run Code Online (Sandbox Code Playgroud)
要获取按时间排序的引用文件名列表,最新的,您可以使用
ls -t
Run Code Online (Sandbox Code Playgroud)
把这一切放在一起,
cat $(ls -t) > outputfile
Run Code Online (Sandbox Code Playgroud)
您可能想要为ls
(例如,*.html
)提供一些参数。
但是如果你的文件名中有空格,这将不起作用。My file.html
将假定为两个文件名:My
和file.html
. 您ls
可以引用文件名,然后使用xargs
理解引用的 将参数传递给cat
.
ls -tQ | xargs cat
Run Code Online (Sandbox Code Playgroud)
至于你的第二个问题,过滤掉部分文件并不难,但这取决于你到底想去掉什么。什么是“冗余标题”?