在 POSIX shell 中使用while 循环来处理文本通常被认为是不好的做法吗?
正如Stéphane Chazelas 所指出的,不使用 shell 循环的一些原因是概念、可靠性、易读性、性能和安全性。
这个答案解释了可靠性和易读性方面:
while IFS= read -r line <&3; do
printf '%s\n' "$line"
done 3< "$InputFile"
Run Code Online (Sandbox Code Playgroud)
为了性能,从文件或管道读取时,while循环和读取非常慢,因为内置的read shell一次读取一个字符。
怎么样的概念和安全性方面?
我正在编辑一个简单的表格。我想把它格式化得很好。虽然我可以使用tbl、latex或类似的东西,但这似乎有点矫枉过正——纯文本真的就足够了。由于它很简单,我不妨将源作为输出。所以来源也应该看起来不错。这似乎应该是一项完美的工作column -s '|' -t——它找到分隔符并自动插入空格以根据每列中的最大宽度对齐。不幸的是,它删除了分隔符,所以我无法在进一步编辑后重新运行它。是否有任何好的文本处理工具可以幂等地执行此操作,以便将其输出用作输入?还是我需要自己写?
编辑:这是我想要的一个例子:
foo | bar | baz
abc def | 12 | 23456
Run Code Online (Sandbox Code Playgroud)
应该成为
foo | bar | baz
abc def | 12 | 3456
Run Code Online (Sandbox Code Playgroud)
当' '分离器和间隔器同时使用时,column -t效果很好。但是我的物品中有空格,所以我不能使用它。使间隔物与分隔物不同会使事情复杂化。我认为在分隔符旁边将它们视为分隔符是很有用的,但事实并非column -s '|' -t如此(尽管显然当前的行为也很有用)。