哇,这里有很多不好的答案.如果您知道公共后缀列表中的内容,则只能执行此操作.如果你正在使用split或正则表达式或其他东西,你做错了.
幸运的是,这是python,并且有一个库:https://pypi.python.org/pypi/tldextract
从他们的自述文件:
>>> import tldextract
>>> tldextract.extract('http://forums.news.cnn.com/')
ExtractResult(subdomain='forums.news', domain='cnn', suffix='com')
Run Code Online (Sandbox Code Playgroud)
ExtractResult是一个有名的元组.让它变得非常简单.
使用这样的库的好处是它们将跟上公共后缀列表的添加,所以你不必这样做.
通常,要确定用户注册位的结束位置和注册表位的开始位置并不容易。例如:a.com、b.co.uk、c.us、d.ca.us、e.uk.com、f.pvt.k12.wy.us...
Mozilla 的好心人有一个专门列出域后缀的项目,公众可以在这些后缀下注册域:http : //publicsuffix.org/
domain = 'subdomain.domain.ext'
name, ext = domain.split('.')[-2:]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
13189 次 |
| 最近记录: |