如何使用javascript正则表达式从字符串中获取域

Che*_*jyg 2 javascript regex string string-matching capturing-group

正如标题所示,我正在尝试使用javascript正则表达式从字符串中检索域.

请使用以下字符串:

String                                  ==>     Return
"google"                                ==>     null
"google.com"                            ==>     "google.com"
"www.google.com"                        ==>     "www.google.com"
"ftp://ftp.google.com"                  ==>     "ftp.google.com"
"http://www.google.com"                 ==>     "www.google.com"
"http://www.google.com/"                ==>     "www.google.com"
"https://www.google.com/"               ==>     "www.google.com"
"https://www.google.com.sg/"            ==>     "www.google.com.sg"
"https://www.google.com.sg/search/"     ==>     "www.google.com.sg"
"*://www.google.com.sg/search/"         ==>     "www.google.com.sg"
Run Code Online (Sandbox Code Playgroud)

我已经读过 "Regex找到没有www的域名 - Stack Overflow""从字符串中提取根域名 - Stack Overflow" 但它们太复杂了,所以我尝试编写自己的正则表达式:

var re = new RegExp("[\\w]+[\\.\\w]+");
/[\w]+[\.\w]+/
re.exec(document.URL);
Run Code Online (Sandbox Code Playgroud)

它工作正常"google.com","www.google.com""www.google.com.sg"而是返回http"http://google.com/","http://www.google.com/"

由于我是正则表达的新手,我似乎无法弄清楚出了什么问题......任何想法?

提前致谢!

Uni*_*ron 9

使用这个正则表达式:

/(?:[\w-]+\.)+[\w-]+/
Run Code Online (Sandbox Code Playgroud)

这是一个正则表达式演示!

采样:

>>> var regex = /(?:[\w-]+\.)+[\w-]+/
>>> regex.exec("google.com")
... ["google.com"]
>>> regex.exec("www.google.com")
... ["www.google.com"]
>>> regex.exec("ftp://ftp.google.com")
... ["ftp.google.com"]
>>> regex.exec("http://www.google.com")
... ["www.google.com"]
>>> regex.exec("http://www.google.com/")
... ["www.google.com"]
>>> regex.exec("https://www.google.com/")
... ["www.google.com"]
>>> regex.exec("https://www.google.com.sg/")
... ["www.google.com.sg"]
Run Code Online (Sandbox Code Playgroud)

  • @Cheejyg我们想要匹配的是`aaa.bbb(.ccc.ddd.eee ...)`序列.我通过引用字符为"[\ w - ] +`(任何单词字符或连字符),将另一个组作为带有点`(?:[\ w - ] + \.)`的字符并进行量化来完成此操作它允许匹配多次.'+'. (2认同)