使用正则表达式从URL捕获域和路径

以下行是用于将URI引用分解为其组件的正则表达式.
   ^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?
    12            3  4          5       6  7        8 9
Run Code Online (Sandbox Code Playgroud)
上面第二行中的数字只是为了提高可读性; 它们表示每个子表达的参考点(即每个配对括号).我们将子表达式匹配的值称为$.例如,将上面的表达式与之匹配
   http://www.ics.uci.edu/pub/ietf/uri/#Related
Run Code Online (Sandbox Code Playgroud)
导致以下子表达式匹配:
   $1 = http:
   $2 = http
   $3 = //www.ics.uci.edu
   $4 = www.ics.uci.edu
   $5 = /pub/ietf/uri/
   $6 = <undefined>
   $7 = <undefined>
   $8 = #Related
   $9 = Related
Run Code Online (Sandbox Code Playgroud)
where表示该组件不存在,如上例中的查询组件的情况.因此,我们可以确定四个组件的值和片段为
   scheme    = $2
   authority = $4
   path      = $5
   query     = $7
   fragment  = $9
Run Code Online (Sandbox Code Playgroud)

Answer 2

Gab*_*iMe 5

如上所述 - 这是一个非网格版本: https?:\/\/(.+?)(\/.*)

归档时间：	12 年前
查看次数：	3019 次
最近记录：	12 年前