在普通 URL 中,您有协议、子域(可选)、域名、顶级域和子目录。
例如:http://www.google.com/path。这里www是子域名,google是域名,com是 TLD;path是这里的子目录。解析这是一个简单的编程任务。
但当存在多个 TLD 时就会出现问题。例如:www.google.co.in/path。这里co.in是顶级域名。但我看到还有一个有名字的网站www.co.in。
我的疑问是:
google.co.in它不是 的子域co.in,那么为什么www.co.in会解析到不同的网站呢google.co.in?如果我必须编写一个算法来决定“www.co.in”属于印度顶级域名(TLD)而“www.google.co.in”属于印度二级域名(SLD),我会去在这里并获取列表:
https://wiki.mozilla.org/TLD_List
然后,我会像这样处理我的 URL: