phk*_*phk 3 diff file-comparison comm text-formatting
我正在寻找一些东西,它为我提供了comm -3两个排序输出的输出(逐行比较,只有来自任一侧的附加/缺失行),但它看起来更像是来自 的输出diff -y,例如它使用整个宽度。
file1:
bar/a
bar/feugiat
bar/libero
bar/mauris
bar/scelerisque
bar/urna
foo/blandit
foo/elementum
foo/feugiat
foo/laoreet
foo/luctus
foo/non
foo/pellentesque
foo/pulvinar
foo/rutrum
foo/sed
foo/ut
foo/vivamus
Run Code Online (Sandbox Code Playgroud)
file2:
bar/a
bar/molestie
bar/quam
bar/risus
bar/tristique
foo/blandit
foo/elementum
foo/feugiat
foo/ligula
foo/massa
foo/mauris
foo/metus
foo/pellentesque
foo/pulvinar
foo/ut
Run Code Online (Sandbox Code Playgroud)
输出comm -3 file1 file2:
bar/feugiat
bar/libero
bar/mauris
bar/molestie
bar/quam
bar/risus
bar/scelerisque
bar/tristique
bar/urna
foo/laoreet
foo/ligula
foo/luctus
foo/massa
foo/mauris
foo/metus
foo/non
foo/rutrum
foo/sed
foo/vivamus
Run Code Online (Sandbox Code Playgroud)
diff -y --suppress-common-lines file1 file2(GNU) 的输出,它取决于屏幕宽度:
bar/feugiat | bar/molestie
bar/libero | bar/quam
bar/mauris | bar/risus
bar/scelerisque | bar/tristique
bar/urna <
foo/laoreet | foo/ligula
foo/luctus | foo/massa
foo/non | foo/mauris
> foo/metus
foo/rutrum / foo/ut
foo/sed <
foo/ut <
foo/vivamus <
Run Code Online (Sandbox Code Playgroud)
我希望的可能输出:
bar/feugiat <
bar/libero <
bar/mauris <
> bar/molestie
> bar/quam
> bar/risus
bar/scelerisque <
> bar/tristique
bar/urna <
foo/laoreet <
> foo/ligula
foo/luctus <
> foo/massa
> foo/mauris
> foo/metus
foo/non <
foo/rutrum <
foo/sed <
foo/vivamus <
Run Code Online (Sandbox Code Playgroud)
没有箭头也可以,只是应该更好地使用屏幕宽度:
bar/feugiat
bar/libero
bar/mauris
bar/molestie
bar/quam
bar/risus
bar/scelerisque
bar/tristique
bar/urna
foo/laoreet
foo/ligula
foo/luctus
foo/massa
foo/mauris
foo/metus
foo/non
foo/rutrum
foo/sed
foo/vivamus
Run Code Online (Sandbox Code Playgroud)
您可以通过管道发送至:
expand -t "$((${COLUMNS:-$(tput cols)} / 2))"
Run Code Online (Sandbox Code Playgroud)
或者对于尖括号:
awk -v cols="${COLUMNS:-$(tput cols)}" '
BEGIN {width = cols/2-1; space = sprintf("%*s", width, "")}
/^\t/ {print space ">", substr($0, 2); next}
{printf "%-*s<\n", width, $0}'
Run Code Online (Sandbox Code Playgroud)
如果您tput没有输出列数,您可以尝试解析stty sizeor的输出stty -a。或使用zsh -c 'echo $COLUMNS'(也适用于mksh)。没有标准/便携式方式来获取该信息。
如果输入文件包含多字节或双角字符,YMMV. 根据expand/awk实现对齐可能会关闭。
这也假设输入文件没有以 Tab 字符开头的行。如果不能保证,GNU 实现comm有一个--output-delimiter,你可以用它来指定一个唯一的字符串。或者你可以实现comm在功能上awk应该不会太复杂。