我正在写一个开始的gawk脚本
#!/bin/gawk -f
BEGIN { print FILENAME }
Run Code Online (Sandbox Code Playgroud)
我正在调用文件,./script file1.html但脚本只返回任何内容.有任何想法吗?
我在gawk中使用match()函数来获取HTML文件中的链接..正则表达式是这样的:
match($0, /(<a href=\")([^\"]+)/, arr)
Run Code Online (Sandbox Code Playgroud)
我似乎无法在最后使用"/ g"选项来获得每行多个匹配?