使用正则表达式获取URL的域

Question

我正在尝试获取给定URL的域名.例如http://www.facebook.com/someuser/将返回facebook.com.给定的URL可以采用以下格式:

我写了这个正则表达式:

/(?: \.|\/{2})(?: www\.)?([^\/]*)/i

但它没有像我期望的那样起作用.

我可以部分地做到这一点:

但这不适用于子域.测试字符串:

https://www.facebook.com/username
http://last.fm/user/username
www.google.com
facebook.com/username
http://sub.tumblr.com/
sub.tumblr.com

我需要这个以尽可能少的内存和处理海岸.

有任何想法吗？

Answer 1

为什么不直接使用URI类来执行此操作？

URI.parse( your_uri ).host

而且你已经完成了.

只有一件事,如果在url的开头没有"http://"或"https://",你将不得不添加一个,或者解析方法不会给你一个主机(它会去是零).