我所说的“有意义”是指大多数人用来识别网站的 URL 部分(有专门的技术术语吗?)。例如,我希望代码在以下所有情况下返回“gm”:
gm.com, gm.net, gm.info, gm.com.uk, gm.co.jp, gm.jp(这些可能不是真实的网站)
另外,当上述任何一个具有附加子域时,例如www.gm.com、www.cars.gm.com等。它不必与国际化国家/地区代码顶级域(具有非 ASCII 字符的域)一起使用。
我能想到的唯一方法是将最高级别的标签(例如.com)与通用顶级域、美国顶级域和国家/地区代码顶级域进行比较,然后尝试在某一位置向左移一个标签。时间。尽管如此,这仍然需要我知道(以及所有其他国家/地区)下的所有二级域名.jp,因为否则我将无法为 和 返回正确的www.yahoo.jp值yahoo.co.jp。有一个更好的方法吗?
这实际上是一个比乍一看更棘手的问题,因为您想要的域组件(技术上“标签”)的数量取决于域名。看看这个:
http://www.onlineaspect.com/2011/03/17/detect-subdomains-using- effective-tlds/
Mozilla 项目启动了一个姊妹项目来维护有效 TLD 的列表;一旦您确定了 TLD,那么您所寻找的只是在此之前的另一个标签。该列表可在此处获取:
| 归档时间: |
|
| 查看次数: |
572 次 |
| 最近记录: |