我的网址列中有一行。
我喜欢将URL分为域和路径。我可以通过使用BigQuery语法中的Domain(URL)来进行域名处理。
我的问题是如何获取URL的路径?
例如 http://www.somedomain.com/X/Y/abc
我想将X,Y和abc作为单独的列。
您可以使用REGEXP提取所需的内容
SELECT Regexp_extract(URL,r'^http://www(?:[^/]*)/(.*)') as full_path,
Regexp_extract(URL,r'^http://www(?:[^/]*)/(?:[^/]*/){0}([^/]*)') as full_path0,
Regexp_extract(URL,r'^http://www(?:[^/]*)/(?:[^/]*/){1}([^/]*)') as full_path1,
Regexp_extract(URL,r'^http://www(?:[^/]*)/(?:[^/]*/){2}([^/]*)') as full_path2,
Regexp_extract(URL,r'^http://www(?:[^/]*)/(?:[^/]*/){3}([^/]*)') as full_path3,
FROM
(Select 'http://www.somedomain.com/X/Y/abc' as URL)
Run Code Online (Sandbox Code Playgroud)
并考虑与MS日志解析器进行比较。
请享用
| 归档时间: |
|
| 查看次数: |
1856 次 |
| 最近记录: |