bash:在文件中找到所有正则表达式并放入数组

Evy*_*005 2 regex arrays bash awk grep

我有一个带有PlaceHolders的模板配置文件,我想找到所有这些 PlaceHolders 并将其放入一个数组中。

当前状态:
只有当一行中超过一个PlaceHolder 时,我才能找到文件中的所有 PlaceHolder 。

例如,这是我的模板文件:

upstream portal {        
   server {{UNICORN_SERVICE_NAME}}:{{UNICORN_SERVICE_PORT}};  
}

server {
  listen *:80 default_server;         
  server_name {{APP_HOST}};     
  server_tokens off;     
  root /dev/null;

  # Increase this if you want to upload large attachments
  # Or if you want to accept large git objects over http
  client_max_body_size {{NGINX_MAX_UPLOAD_SIZE}};

  location {{GITLAB_RELATIVE_URL_ROOT}}/ {
    root /var/lib/nginx/portal;
    # serve static files from defined root folder;.
    # @gitlab is a named location for the upstream fallback, see below    
  }
  }
Run Code Online (Sandbox Code Playgroud)

这是我用来查找占位符的代码

matches_bloc=$(awk 'match($0, /(\{\{)([^{]*)(\}\})/) {
                    print substr($0, RSTART, RLENGTH)                    
                }' ${currFile})

            # convert 'matches_bloc' into array
            matches=()
            echo "Matches:"
            while read -r line; do
                matches+=("$line")
                echo "  - ${line}"
            done <<< "$matches_bloc"
Run Code Online (Sandbox Code Playgroud)

在这个例子中,匹配结果将是:

匹配项:
- {{UNICORN_SERVICE_NAME}}
- {{APP_HOST}}
- {{NGINX_MAX_UPLOAD_SIZE}}
- {{GITLAB_RELATIVE_URL_ROOT}}

您可以注意到文件中有 5 个占位符,并且只有 4 个匹配项。
缺少的匹配项是:{{UNICORN_SERVICE_PORT}},因为同一行中已经有另一个匹配项。

我的问题是:
我怎样才能找到文件中的所有匹配项,而不管行如何?

Cyr*_*rus 5

在模板文件中查找所有变量并将它们放入一个数组中。

使用GNU grep

array=( $(grep -Po '{{.*?}}' file) )
declare -p array
Run Code Online (Sandbox Code Playgroud)

输出:

声明 -a array='([0]="{{UNICORN_SERVICE_NAME}}" [1]="{{UNICORN_SERVICE_PORT}}" [2]="{{APP_HOST}}" [3]="{{NGINX_MAX_UPLOAD_SIZE}} " [4]="{{GITLAB_RELATIVE_URL_ROOT}}")'

-P: 解释{{.*?}}为 Perl 正则表达式。

-o:只打印匹配行的匹配(非空)部分,每个这样的部分在单独的输出行上。

*前面的表达式可以匹配零次或多次。随着?*尝试匹配尽可能少的(非贪婪)。


请参阅:堆栈溢出正则表达式常见问题解答

  • 感谢 cyrus 提供的出色代码,您能否解释一下正则表达式部分,先生,我将不胜感激。 (2认同)