Evy*_*005 2 regex arrays bash awk grep
我有一个带有PlaceHolders的模板配置文件,我想找到所有这些 PlaceHolders 并将其放入一个数组中。
当前状态:
只有当一行中不超过一个PlaceHolder 时,我才能找到文件中的所有 PlaceHolder 。
例如,这是我的模板文件:
upstream portal {
server {{UNICORN_SERVICE_NAME}}:{{UNICORN_SERVICE_PORT}};
}
server {
listen *:80 default_server;
server_name {{APP_HOST}};
server_tokens off;
root /dev/null;
# Increase this if you want to upload large attachments
# Or if you want to accept large git objects over http
client_max_body_size {{NGINX_MAX_UPLOAD_SIZE}};
location {{GITLAB_RELATIVE_URL_ROOT}}/ {
root /var/lib/nginx/portal;
# serve static files from defined root folder;.
# @gitlab is a named location for the upstream fallback, see below
}
}
Run Code Online (Sandbox Code Playgroud)
这是我用来查找占位符的代码:
matches_bloc=$(awk 'match($0, /(\{\{)([^{]*)(\}\})/) {
print substr($0, RSTART, RLENGTH)
}' ${currFile})
# convert 'matches_bloc' into array
matches=()
echo "Matches:"
while read -r line; do
matches+=("$line")
echo " - ${line}"
done <<< "$matches_bloc"
Run Code Online (Sandbox Code Playgroud)
在这个例子中,匹配结果将是:
匹配项:
- {{UNICORN_SERVICE_NAME}}
- {{APP_HOST}}
- {{NGINX_MAX_UPLOAD_SIZE}}
- {{GITLAB_RELATIVE_URL_ROOT}}
您可以注意到文件中有 5 个占位符,并且只有 4 个匹配项。
缺少的匹配项是:{{UNICORN_SERVICE_PORT}},因为同一行中已经有另一个匹配项。
我的问题是:
我怎样才能找到文件中的所有匹配项,而不管行如何?
在模板文件中查找所有变量并将它们放入一个数组中。
使用GNU grep:
array=( $(grep -Po '{{.*?}}' file) )
declare -p array
Run Code Online (Sandbox Code Playgroud)
输出:
声明 -a array='([0]="{{UNICORN_SERVICE_NAME}}" [1]="{{UNICORN_SERVICE_PORT}}" [2]="{{APP_HOST}}" [3]="{{NGINX_MAX_UPLOAD_SIZE}} " [4]="{{GITLAB_RELATIVE_URL_ROOT}}")'
-P: 解释{{.*?}}为 Perl 正则表达式。
-o:只打印匹配行的匹配(非空)部分,每个这样的部分在单独的输出行上。
*前面的表达式可以匹配零次或多次。随着?在*尝试匹配尽可能少的(非贪婪)。
请参阅:堆栈溢出正则表达式常见问题解答