python域名拆分名称和扩展名

bob*_*bsr 5 python string

您将如何拆分将返回名称和扩展名的域名

mli*_*ner 9

哇,这里有很多不好的答案.如果您知道公共后缀列表中的内容,则只能执行此操作.如果你正在使用split或正则表达式或其他东西,你做错了.

幸运的是,这是python,并且有一个库:https://pypi.python.org/pypi/tldextract

从他们的自述文件:

>>> import tldextract
>>> tldextract.extract('http://forums.news.cnn.com/')
ExtractResult(subdomain='forums.news', domain='cnn', suffix='com')
Run Code Online (Sandbox Code Playgroud)

ExtractResult是一个有名的元组.让它变得非常简单.

使用这样的库的好处是它们将跟上公共后缀列表的添加,所以你不必这样做.

  • 嗯...嗯,`.loc` 不是一个真正的后缀,是吗?这仅适用于真实域名。 (3认同)
  • 你能提供一些例子吗? (2认同)

And*_*ett 5

通常,要确定用户注册位的结束位置和注册表位的开始位置并不容易。例如:a.com、b.co.uk、c.us、d.ca.us、e.uk.com、f.pvt.k12.wy.us...

Mozilla 的好心人有一个专门列出域后缀的项目,公众可以在这些后缀下注册域:http : //publicsuffix.org/


Joh*_*rra 0

domain = 'subdomain.domain.ext'
name, ext = domain.split('.')[-2:]
Run Code Online (Sandbox Code Playgroud)