如何使用gawk多次通过?

Ste*_*sky 5 awk gawk

我正在尝试使用CYGWIN中的GAWK来处理csv文件.通过1找到最大值,通过2打印匹配最大值的记录.我正在使用.awk文件作为输入.当我使用手册中的文本时,它在两次传递中都匹配.我可以使用IF形式作为解决方法,但这迫使我在每个模式匹配中使用IF,这是一种痛苦.知道我做错了什么吗?

这是我的.awk文件:

pass == 1
{
    print "pass1 is", pass;  
}    

pass == 2
{
if(pass == 2)
    print "pass2 is", pass;  
}    
Run Code Online (Sandbox Code Playgroud)

这是我的输出(输入文件只是"你好"):

hello
pass1 is 1
pass1 is 2
hello
pass2 is 2
Run Code Online (Sandbox Code Playgroud)

这是我的命令行:

gawk -F , -f test.awk pass=1 x.txt pass=2 x.txt
Run Code Online (Sandbox Code Playgroud)

我很感激任何帮助.

F. *_*orr 7

(g)awk解决方案可能如下所示:

awk 'FNR == NR{print "1st pass"; next}
     {print "second pass"}' x.txt x.txt
Run Code Online (Sandbox Code Playgroud)

(请更换awkgawk,如果必要的.)
比方说,你想搜索的文件的第一列中的最大值x.txt,然后打印已在第一列中这个值的所有行,你的程序可能是这样的(感谢给埃德莫顿的一些提示,请参阅评论):

awk -F"," 'FNR==NR {max = ( (FNR==1) || ($1 > max) ? $1 : max ); next}
           $1==max'  x.txt x.txt
Run Code Online (Sandbox Code Playgroud)

输出x.txt:

6,5
2,6
5,7
6,9
Run Code Online (Sandbox Code Playgroud)

6,5
6,9
Run Code Online (Sandbox Code Playgroud)

这是如何运作的?变量NR随每条记录不断增加,而在读取新文件时FNR重置为1.因此,FNR==NR仅适用于处理的第一个文件.

  • 那个剧本里没有什么特别的傻瓜.为了避免要求max> = 0并使你的脚本可以移植到所有awks(某些awks在某些情况下会失败,并且更容易阅读),将测试更改为`FNR == NR {max =(( FNR == 1)||($ 1> max)?$ 1:max); 接下来}`.无论何时进行最小值或最大值计算,读取第一个值的种子,都不要假定/带有一些随机值的种子,如零.您可以而且应该删除`{print $ 0}`,因为这是条件为真时的默认操作. (2认同)